标签: nlp
我似乎无法在文档中找到
答案 0 :(得分:3)
Penn Treebank有450万个英文单词用于P.O.S标记,其中大约一半用于骨架解析。
查看本文档的第327页http://acl.ldc.upenn.edu/J/J93/J93-2004.pdf。这有点过时(2004年),但我想不出英语发言者从那以后引入的任何新词。
答案 1 :(得分:0)
总共约40,000个句子,摘自《华尔街日报》。
40,000