提取与关键字相对应的最相关的位置

时间:2019-04-12 09:53:20

标签: python nlp

我正在实现一个应用程序,该应用程序通过分析Twitter数据集来跟踪澳大利亚鲨鱼的位置。因此,我使用shark作为关键字,并搜索包含“ shark”和位置短语的Twitts。

所以问题是如何识别“哈迪礁上的艾尔利滩”与“鲨鱼”有关?如果可能的话,有人可以提供Python的有效代码进行演示吗?非常感谢!

2 个答案:

答案 0 :(得分:1)

如果您已经使用NER提取位置列表,那么可以创建目标词表并分配作为正确位置的概率吗?例如,您对海滩而不是医院感兴趣。如果在该位置提到海滩,则正确位置的可能性会增加。这样做的另一种方法是确定单词shark和位置之间的字符或标记数量-希望距离越小,该单词与实际攻击相关的可能性就越大。

答案 1 :(得分:0)

这不是一件容易的事,这将需要命名实体识别https://www.quora.com/What-are-the-best-python-libraries-for-extracting-location-from-text