标签: python nlp wikipedia corpus
我想在句子数据库中找到许多包含一对代表现实世界的单词的句子。例如 - 我想要许多包含单词" person"和"行走"。我有两个问题:
是否有一些大型语料库可以直接为此目的调用?
如果我有一些这么大的语料库,我可以在网上申请吗?或者如果我自己编写代码,如何在Python中进行编写?
答案 0 :(得分:1)
维基百科是一个非常好的句子集合,包含一对单词,以及将它们导入向量的代码在这里:https://github.com/idio/wiki2vec