从混合字符串中识别正确的单词(随机位置出现意外空格)

时间:2018-08-10 05:33:36

标签: javascript c# text

我遇到的问题是:我可能从其他系统收到了字符串,并且字符串内可能有一些不必要的空格,例如:“有效日期”,应该是“生效日期”,所以有可能有通用的算法可以消除这种不正确的空格?。

我已经尝试过RegExp,但是问题是空格可能出现在任何单词中,另一个例子是:“不是所有字段都适用于所有场景-仅提供必要的数据”

有人可以提供一些建议吗?

高度推荐使用JS或C#解决方案。

1 个答案:

答案 0 :(得分:1)

一种方法是剥离所有空格并应用分词算法将有意义的单词序列中的连续字母流分开。

this描述了各种技术,This blog post提供了一种实现。