我正在设计一个自动文本摘要生成器。该项目的主要模块之一需要 TRAINING CORPUS 。有人可以通过培训企业或引用一些链接下载来帮助我。在期待中感谢
答案 0 :(得分:5)
见Norvig的How to Write a Spelling Corrector。他提到Project Gutenberg,Wiktionary,British National Corpus,Birkbeck spelling error corpus。还有Brown Corpus。
答案 1 :(得分:3)
以下是一些Text summarization resources,包括语料库。 Stanford list of NLP/Corpus linguistics resources也可以提供帮助。
答案 2 :(得分:0)
另请参阅Corpora mailing list,它们是一个很好的起点,您还可以查看其邮件存档以获取更多资源。
答案 3 :(得分:0)
不列颠哥伦比亚省会话语料库 - http://www.cs.ubc.ca/~rjoty/Webpage/resources.htm 您可以从here下载。