Text - Academic Torrents

Text - Academic Torrents collection curated by joecohen http://academictorrents.com/collection/text Synthetic Data for Text Localisation in Natural Images (Dataset) http://academictorrents.com/download/2dba9518166cbd141534cbf381aa3e99a087e83c Reading Text in the Wild with Convolutional Neural Networks (Dataset) http://academictorrents.com/download/3d0b4f09080703d2a9c6be50715b46389fdb3af1 PMC Open Access Subset (Dataset) http://academictorrents.com/download/06d6badd7d1b0cfee00081c28fddd5e15e106165 r/WritingPrompts, Text (2018) (Dataset) http://academictorrents.com/download/b4fa678ca4a330cf7078750b93eaefb1680a9053 OpenWebText (Gokaslan's distribution, 2019), GPT-2 Tokenized (Dataset) http://academictorrents.com/download/36c39b25657ce1639ccec0a91cf242b42e1f01db Flickr8k Dataset (Dataset) http://academictorrents.com/download/9dea07ba660a722ae1008c4c8afdd303b6f6e53b Common Crawl corpus - training-parallel-commoncrawl.tgz (CS-EN, DE-EN, ES-EN, FR-EN, RU-EN) (Dataset) http://academictorrents.com/download/2a4e272c4fd06abc3b3ee022fd2fd9e220b37c33 UN corpus - training-parallel-un.tgz (ES-EN, FR-EN) (Dataset) http://academictorrents.com/download/e4dc3c28d6035a64af928dbdcbc8d6cc0d62d39c Europarl v7 - training-parallel-europarl-v7.tgz (CS-EN, DE-EN, ES-EN, FR-EN) (Dataset) http://academictorrents.com/download/2c4dbfe50cda15026ebc2579b13edd532b10e911 Phishing corpus (Dataset) http://academictorrents.com/download/a77cda9a9d89a60dbdfbe581adf6e2df9197995a 30M Factoid Question-Answer Corpus (30MQA) (Dataset) http://academictorrents.com/download/973fb709bdb9db6066213bbc5529482a190098ce Indiana University - Chest X-Rays (XML Reports) (Dataset) http://academictorrents.com/download/66450ba52ba3f83fbf82ef9c91f2bde0e845aba9 Yelp reviews - Polarity (Dataset) http://academictorrents.com/download/271777225ff3c6dec8055e231c70731a1da2518f Yelp reviews - Full (Dataset) http://academictorrents.com/download/66ab083bda0c508de6c641baabb1ec17f72dc480 Sogou news (Dataset) http://academictorrents.com/download/b2b847b5e1946b0479baa838a0b0547178e5ebe8 DBPedia ontology (Dataset) http://academictorrents.com/download/881118da3e05d63f91dbadf84317381203f3cb24 Amazon reviews - Polarity (Dataset) http://academictorrents.com/download/db0cd5603a0d154ec3dcfc6ff7862d47d3884b83 Amazon reviews - Full (Dataset) http://academictorrents.com/download/66ddbb6d5f49aa6c36a01ca5e814f1beef00b5b7 AG News (Dataset) http://academictorrents.com/download/758bf646e3ffd39d20f9a3d9efbdb0e1eade5022 WMT 2015 French/English parallel texts (Dataset) http://academictorrents.com/download/2bc57fed1ea43b24296e096aa8746f6faee9513e Wikitext-2 (Dataset) http://academictorrents.com/download/ac7ffa98b66427246a316a81b2ea31c9b58ea5b6 Wikitext-103 (Dataset) http://academictorrents.com/download/a4fee5547056c845e31ab952598f43b42333183c IMDb Large Movie Review Dataset (Dataset) http://academictorrents.com/download/fd24bc44d461b10288469e05a64a8344eb079f15 Microsoft Academic Graph - 2016/02/05 (Dataset) http://academictorrents.com/download/1e0a00b9c606cf87c03e676f75929463c7756fb5 MovieLens 20M Dataset (Dataset) http://academictorrents.com/download/296054417b4d8eeeb4c7b1c842570bf792ee4d14 Sentiment Labelled Sentences Data Set (Dataset) http://academictorrents.com/download/07e05fc1229555e124df72160a01b2540d04cebf Online News Popularity Data Set (Dataset) http://academictorrents.com/download/95d3b03397a0bafd74a662fe13ba3550c13b7ce1 Structured Web Data Extraction Dataset (SWDE) (Dataset) http://academictorrents.com/download/411576c7e80787e4b40452360f5f24acba9b5159 SMS Spam Collection Data Set (Dataset) http://academictorrents.com/download/25932ba42d983dd7b4474d8f59ab56cdc25d9107 Enwiki Word2vec model 1000 Dimensions (Dataset) http://academictorrents.com/download/5d18911e7036870197bf5e23cf1be96d3353518a Yale YouTube Video Text (Dataset) http://academictorrents.com/download/156802226bcf5747e0bea4e4f14c03b3b952de80 Lerman Twitter 2010 Dataset (Dataset) http://academictorrents.com/download/d8b3a315172c8d804528762f37fa67db14577cdb