我正在开发一个程序但却陷入了一个特定的障碍。我需要找到与其他单词相关的单词。 EG“绿色”可能与“环境”,“叶子”,“地球”,“风”,“电动”,“混合”等相关联。我所能找到的只是Google Sets。还有其他更好的资源吗?
答案 0 :(得分:0)
如果您有大型文本集(比如维基百科,Project Gutenberg),您可以使用共现分数提取此类数据。参见例如Padó and Lapata及其中的参考文献。
我最近构建了一个tool,它通过另一种方法从维基百科数据库转储中挖掘出这种关联。但它需要大量的内存;其他人试图使用随机方法做同样的事情。