让我们假设我想用一种算法来构建有向图,该算法可以读取一个parragraph,并在名词和相应的形容词之间建立边缘。
实施例: 输入字符串
“猫头鹰是孤独的夜行性猛禽。”
输出应该如下所示:
猫头鹰= {形容词:“孤独,夜间,鸟类”}
如果上述情况不可能,那么获得描述名词的形容词的最佳方法是什么?
答案 0 :(得分:1)
如果您正在寻找可以描述名词的所有形容词,那么您最好的起点可能是 Google NGram数据集。您可以尝试查看here的观看者,其中显示了“角落'”,“谷仓'”' screech'都是猫头鹰的常见形容词。
或者,如果您尝试标记特定句子以查找与名词相关的形容词,则应尝试使用词性标记之一。
答案 1 :(得分:1)
对于您提出的问题,更通用的方法是使用Dependency Parser来提取句子中单词之间的各种关系。
解析器的输入是一个句子,它的输出是单词的依赖关系树,其中每个边表示两个单词之间的依赖关系。
考虑以下示例(取自上面链接的wiki条目)。在句子中,"句法"是形容词描述"功能"。解析树通过将两个单词与标记为ATTR(属性)的边连接来对该信息进行编码。
您可以在线查找多种语言的依赖解析器。 一个很好的起点是python的NLTK包。