对社交活动进行分类

时间:2015-02-01 17:46:34

标签: machine-learning nlp

我有活动的名称和描述,我想了解活动的类别(例如娱乐活动,政治活动或其他)。  我在网上搜索,我看了一些自然语言处理技术,如Latent Dirichlet分配,但我无法看到在我的情况下使用它的方法。 尝试通过为每个类别预定义关键字进行分类,然后查询文本并根据每个类别的关键字数量来决定是一个好主意吗? 有人能给我一个关于我的问题的线索吗?非常感谢

1 个答案:

答案 0 :(得分:0)

您可以采取的一种方法是从简单开始并使用贝叶斯分类器来分析/分类您的数据。

我会通过获取您的数据集并将其拆分为训练数据集和非训练数据集来解决此问题。然后,手动检查每个事件并将其分类为一种事件。使用此训练数据集针对其余数据运行分类器。

这对于大量事件类型可能并不理想,但它可能是您开始解决问题的一种方式。