应用错误收集

我知道有几个关于字符串模式匹配的线程，但我觉得我的情况略有不同。

我有一个用户输入的索赔号列表，每个索赔号都是唯一的。每个索赔号可以采用不同的格式，这取决于用户以及他们给我们的实际完整索赔号的多少。我们不知道保险公司的索赔格式是什么，他们不会与我们分享。

我们假设我们的用户输入了以下索赔号

保险承运人X索赔号码： 04756G215 04759Q696 04760G279 04760T844 00631F546 006G34549 006J73029

保险承运人Y索赔号码： 000628948-014 01-VK4994-0 01-VW6183-4 01-WC20436 12082356 01VL0063-6 01WB16121 03-016298-2 03-165476-3 1000-66-0792 1000-66-3808 1000-67-8667 1000-68-1360 1000-68-1686 1000-68-8494 1000-69-5647 1000-69-6905

保险承运人Z： 42RBB903752 444F09799 51RBB672507 51RBC153279 55RBB120866 55RBB339718

如您所见，不同的格式。此外，我确信我不能依赖用户输入正确的用户，他们经常省略部分内容，因为该部分可能有一些索赔办公室代码，我们根本不知道。< / p>

知道这一点，我想在一个系统中输入一个索赔号，告诉我哪个是它可能属于哪个载体

所以55RBB339719最有可能给我载体Z.

神经网络是否可行？模糊逻辑？

更新：这是一个匹配的字符串模式 51RAB435220

正如您所看到的那样（2位数字，3个字符，6位数字）。

但是，用户可以输入RAB435220，因为前两位数字可能无关紧要，这意味着它们可能是部门代码而不是实际的索赔号。可能只有最后6位是重要的数字。难以理解的是，我们不知道有效数字是什么。

使用不可靠数据进行字符串模式匹配

0 个答案: