使用NLP

时间:2017-09-09 18:38:31

标签: nlp data-science

我有一组未分类的SMS消息,我想从中提取与交易相关的消息,然后根据借记或贷记对它们进行分类。我还想提取交易金额,日期和受益人。

有没有办法在NLP中解决这个问题?我不想regexp匹配,因为我的SMS数据库可以变化,包括电子钱包,现金转账,ATM提款,电子资金转账和其他多个提供商的此类事情。

2 个答案:

答案 0 :(得分:1)

你可以做几件事

  • 检查spacy库,它可以帮助您进行命名实体和与资金相关的提取。我仍然觉得如果你在谈论自动短信,最好使用正则表达式来提取这些细节。
  • 我不确定您借记或贷记的含义

答案 1 :(得分:0)

我同意这是一个难题,因为输入产生的复杂性。以下是CogCompNLP能够对您的输入进行挖掘的内容: enter image description here

您可以看到它对日期和组织很敏感。

  

A)。交易价值: - 50美元b)。交易类型: - 借记c)。时间 :-   2017年9月18日15:45 d)。 Pupose: - McDonald Eatery e)。最终余额: -   $ 41276.00 f)。相关账户: - xxxxxxx1234。

我要做的是将一堆规则与这些自动提取的标签结合起来。不幸的是,没有100%保证提取这些标签,但如果它在99%的例子中都有效,那么它应该足够可靠。

您可以在此处使用演示:http://nlp.cogcomp.org

披露:我是该软件的作者之一。