我有一组未分类的SMS消息,我想从中提取与交易相关的消息,然后根据借记或贷记对它们进行分类。我还想提取交易金额,日期和受益人。
有没有办法在NLP中解决这个问题?我不想regexp匹配,因为我的SMS数据库可以变化,包括电子钱包,现金转账,ATM提款,电子资金转账和其他多个提供商的此类事情。
答案 0 :(得分:1)
你可以做几件事
答案 1 :(得分:0)
我同意这是一个难题,因为输入产生的复杂性。以下是CogCompNLP能够对您的输入进行挖掘的内容:
您可以看到它对日期和组织很敏感。
A)。交易价值: - 50美元b)。交易类型: - 借记c)。时间 :- 2017年9月18日15:45 d)。 Pupose: - McDonald Eatery e)。最终余额: - $ 41276.00 f)。相关账户: - xxxxxxx1234。
我要做的是将一堆规则与这些自动提取的标签结合起来。不幸的是,没有100%保证提取这些标签,但如果它在99%的例子中都有效,那么它应该足够可靠。
您可以在此处使用演示:http://nlp.cogcomp.org
披露:我是该软件的作者之一。