我需要一种方法来检查英语词典中是否存在单词。这个词也可以是一个正确的名称(城市的名字,贵宾的名字,地点和名字......等等),考虑到专有名称也会更低。
我可以通过Python无限制地访问哪些最好的数据库或字典?
答案 0 :(得分:0)
print requests.get("https://en.wikipedia.org/wiki/Special:Search?search="+raw_input("Search For:").lower()+"&go=Go").content
可能不是你想要的......但它的东西
答案 1 :(得分:0)
最后我检查过,UIUC NER标记器包含一个从维基百科派生的大量实体。你应该能够从中下载他们的标记器 http://cogcomp.cs.illinois.edu/page/download_view/NETagger 解压缩它,并访问通过读取文件的标准python方法中包含的列表。如果您只想检查一个单词是否在字典中,您可以使用WordNet。
您将遇到的一个问题是如何处理多令牌实体。如果您遇到中文总理的名字,他姓名中的任何一个令牌都可能不会出现在字典中,但应将全名识别为姓名。在这种情况下,您将需要一个真正的NER系统,如UIUC或Stanford NLP工具。它也会更加耗时,你只需要考虑文本参考。