寻找好的语料库来寻找包含单词的句子

时间:2015-09-22 17:26:21

标签: python nlp wikipedia corpus

我想在句子数据库中找到许多包含一对代表现实世界的单词的句子。例如 - 我想要许多包含单词" person"和"行走"。我有两个问题:

是否有一些大型语料库可以直接为此目的调用?

如果我有一些这么大的语料库,我可以在网上申请吗?或者如果我自己编写代码,如何在Python中进行编写?

1 个答案:

答案 0 :(得分:1)

维基百科是一个非常好的句子集合,包含一对单词,以及将它们导入向量的代码在这里:https://github.com/idio/wiki2vec