我正在实现一个应用程序,该应用程序通过分析Twitter数据集来跟踪澳大利亚鲨鱼的位置。因此,我使用shark作为关键字,并搜索包含“ shark”和位置短语的Twitts。
所以问题是如何识别“哈迪礁上的艾尔利滩”与“鲨鱼”有关?如果可能的话,有人可以提供Python的有效代码进行演示吗?非常感谢!
答案 0 :(得分:1)
如果您已经使用NER提取位置列表,那么可以创建目标词表并分配作为正确位置的概率吗?例如,您对海滩而不是医院感兴趣。如果在该位置提到海滩,则正确位置的可能性会增加。这样做的另一种方法是确定单词shark和位置之间的字符或标记数量-希望距离越小,该单词与实际攻击相关的可能性就越大。
答案 1 :(得分:0)