使用不可靠数据进行字符串模式匹配

时间:2016-01-18 18:27:37

标签: neural-network string-matching fuzzy-search

我知道有几个关于字符串模式匹配的线程,但我觉得我的情况略有不同。

我有一个用户输入的索赔号列表,每个索赔号都是唯一的。每个索赔号可以采用不同的格式,这取决于用户以及他们给我们的实际完整索赔号的多少。我们不知道保险公司的索赔格式是什么,他们不会与我们分享。

我们假设我们的用户输入了以下索赔号

保险承运人X索赔号码: 04756G215 04759Q696 04760G279 04760T844 00631F546 006G34549 006J73029

保险承运人Y索赔号码: 000628948-014 01-VK4994-0 01-VW6183-4 01-WC20436 12082356 01VL0063-6 01WB16121 03-016298-2 03-165476-3 1000-66-0792 1000-66-3808 1000-67-8667 1000-68-1360 1000-68-1686 1000-68-8494 1000-69-5647 1000-69-6905

保险承运人Z: 42RBB903752 444F09799 51RBB672507 51RBC153279 55RBB120866 55RBB339718

如您所见,不同的格式。此外,我确信我不能依赖用户输入正确的用户,他们经常省略部分内容,因为该部分可能有一些索赔办公室代码,我们根本不知道。< / p>

知道这一点,我想在一个系统中输入一个索赔号,告诉我哪个是它可能属于哪个载体

所以55RBB339719最有可能给我载体Z.

神经网络是否可行?模糊逻辑?

更新: 这是一个匹配的字符串模式 51RAB435220

正如您所看到的那样(2位数字,3个字符,6位数字)。

但是,用户可以输入RAB435220,因为前两位数字可能无关紧要,这意味着它们可能是部门代码而不是实际的索赔号。可能只有最后6位是重要的数字。 难以理解的是,我们不知道有效数字是什么。

0 个答案:

没有答案