DBpedia 2016-04

Matches in DBpedia 2016-04 for { <http://dbpedia.org/resource/Tehran_Monolingual_Corpus> ?p ?o }

Showing triples 1 to 40 of 40 with 100 triples per page.

Tehran_Monolingual_Corpus abstract "The Tehran Monolingual Corpus (TMC) is a large-scale Persian monolingual corpus. TMC is suited for Language Modeling and relevant research areas in Natural Language Processing.The corpus is extracted from Hamshahri Corpus and ISNA news agency website. The quality of Hamshahri corpus is improved for language modeling purpose by a series of tokenization and spell-checking steps.TMC comprises more than 250 million words. The total number of unique words (with frequency of two or more) of the corpus is about 300 thousand, which is relatively good for a highly-inflectional language like Persian.TMC is created by Natural Language Processing Lab of University of Tehran. The corpus is free for research use, after obtaining permission from the corpus aggregator.".
Tehran_Monolingual_Corpus wikiPageExternalLink 940.
Tehran_Monolingual_Corpus wikiPageID "29547984".
Tehran_Monolingual_Corpus wikiPageLength "1271".
Tehran_Monolingual_Corpus wikiPageOutDegree "14".
Tehran_Monolingual_Corpus wikiPageRevisionID "699763116".
Tehran_Monolingual_Corpus wikiPageWikiLink Category:Applied_linguistics.
Tehran_Monolingual_Corpus wikiPageWikiLink Category:Corpora.
Tehran_Monolingual_Corpus wikiPageWikiLink Category:Linguistic_research.
Tehran_Monolingual_Corpus wikiPageWikiLink Category:Natural_language_processing.
Tehran_Monolingual_Corpus wikiPageWikiLink Category:Persian_language.
Tehran_Monolingual_Corpus wikiPageWikiLink Hamshahri_Corpus.
Tehran_Monolingual_Corpus wikiPageWikiLink Iranian_Students_News_Agency.
Tehran_Monolingual_Corpus wikiPageWikiLink Language_model.
Tehran_Monolingual_Corpus wikiPageWikiLink Natural_language_processing.
Tehran_Monolingual_Corpus wikiPageWikiLink Steve!.
Tehran_Monolingual_Corpus wikiPageWikiLink Tehran_English-Persian_parallel_corpus.
Tehran_Monolingual_Corpus wikiPageWikiLink Tokenization_(lexical_analysis).
Tehran_Monolingual_Corpus wikiPageWikiLink University_of_Tehran.
Tehran_Monolingual_Corpus wikiPageWikiLinkText "Tehran Monolingual Corpus".
Tehran_Monolingual_Corpus wikiPageUsesTemplate Template:Corpus_linguistics.
Tehran_Monolingual_Corpus wikiPageUsesTemplate Template:Unreferenced.
Tehran_Monolingual_Corpus subject Category:Applied_linguistics.
Tehran_Monolingual_Corpus subject Category:Corpora.
Tehran_Monolingual_Corpus subject Category:Linguistic_research.
Tehran_Monolingual_Corpus subject Category:Natural_language_processing.
Tehran_Monolingual_Corpus subject Category:Persian_language.
Tehran_Monolingual_Corpus hypernym Corpus.
Tehran_Monolingual_Corpus type Language.
Tehran_Monolingual_Corpus type Work.
Tehran_Monolingual_Corpus type Application.
Tehran_Monolingual_Corpus type Language.
Tehran_Monolingual_Corpus type Science.
Tehran_Monolingual_Corpus comment "The Tehran Monolingual Corpus (TMC) is a large-scale Persian monolingual corpus. TMC is suited for Language Modeling and relevant research areas in Natural Language Processing.The corpus is extracted from Hamshahri Corpus and ISNA news agency website. The quality of Hamshahri corpus is improved for language modeling purpose by a series of tokenization and spell-checking steps.TMC comprises more than 250 million words.".
Tehran_Monolingual_Corpus label "Tehran Monolingual Corpus".
Tehran_Monolingual_Corpus sameAs Q7670671.
Tehran_Monolingual_Corpus sameAs m.0dr_tp_.
Tehran_Monolingual_Corpus sameAs Q7670671.
Tehran_Monolingual_Corpus wasDerivedFrom Tehran_Monolingual_Corpus?oldid=699763116.
Tehran_Monolingual_Corpus isPrimaryTopicOf Tehran_Monolingual_Corpus.