短信文本挖掘

时间:2018-12-04 06:37:18

标签: nlp sms text-mining

我正在尝试从一组SMS中提取数字信息。正则表达式无法提取余额和贷方金额,因为SMS的模式在整个行业中都不一致。 我们目前正在做出使它像“第一笔金额=贷方金额”这样的假设 第二金额=余额。 这有很多限制,错误率正在逐渐增加。 有没有人可以代替正则表达式?

1 个答案:

答案 0 :(得分:0)

由于每个操作员都创建自己的消息,因此没有标准的消息。这是营销沟通...但是,对于给定的运营商和给定的计划,所有平衡查询消息的答复都应该是相同的(只要运营商营销团队不更改它们...)。

正则表达式是一个很好的工具,但是您需要先了解消息并创建适当的正则表达式模式