标签: python data-mining nlp
我有以下文章的列表: 标题,副标题和正文。
现在我需要解析所有这些文章,并根据可能的关键字 将它们分组到不同的上下文类别或子类别。
例如如果文章可能与跑车有关,那么该文章将与汽车或/和车辆背景相关联
现在我明白这是一片广阔的海洋,但这也是我提出这个问题的原因。因为解决方案的海洋可能对我来说太大了,我很可能迷路并采取一些糟糕的思路解决方案。
可能有一些流行和标准化的方法,我不知道,如果有人指出我正确的方向,这将是非常有用的。
帮助会很棒。 =)
答案 0 :(得分:1)
Natural Lanugage Toolkit但不要指望那里有一个神奇的子弹会让你不得不学习一些关于语言学的东西,因为你所描述的问题无法完全机械地解决。