我需要在一组字符串中找到通用格式。 IE浏览器。我们有几个代表相同数据类型的字符串,但它们没有标准化的格式(格式)。
例如 - 我们有一组电话号码
600123456
(600)111222
+1600333444
600 654 456
所有这些信息都代表相同类型的信息(电话号码),但每个信息都以不同的格式存储。我不能真正使用Levenshtein距离之类的东西,因为字符串可能非常不同但仍然代表相同类型。
此电话号码应转换为
600123456
600111222
1600333444
600654456
如何知道字符串集是否代表相同类型的数据?如何以最简单的形式提取这些数据?