如何使用NLP和机器学习检测事件?

时间:2016-04-19 07:49:43

标签: machine-learning nlp text-classification document-classification

我的文字描述了诸如出生,新工作,婚礼,死亡等事件。或者没有事件。我如何检测这些事件?

我的方法是形成一组单词并在与事件相对应的文本中搜索它们。或者使用贝叶斯分类器。但贝叶斯分类器需要对所有类进行一些培训,我需要的方法甚至可以分类而不给出所有类型的例子?这可能吗?

1 个答案:

答案 0 :(得分:0)

您的表现要求是什么?低召回可以吗?你需要高精度吗?

根据您的问题,我猜你想要一些合理回忆的东西(阅读分类广告以发送垃圾邮件?)但实际上并没有任何培训数据。

您需要一种可以对文档进行分类的方法(使用命名实体识别算法中的事件作为要素),而无需提供任何训练数据。所有监督方法(包括贝叶斯方法)都需要训练数据,因此您无法提出要求/希望的方法。在任何情况下都需要标记数据,否则如何判断检测过程的效果如何?

在这个阶段你甚至不应该担心使用哪个分类器 - 我建议写一些正则表达式,看看你的问题有多难/你获得了什么样的表现。它可能是十几个正则表达式可能会让你获得90%的这些事件,你可以避免过度设计问题。祝你好运!