我们有一个带有组织名称的表,并且需要能够按名称查询这些名称,而不必在输入字符串上过于具体。
示例:
Real name Found by input strings
-------------------------------------------------------------
Marks & Spencer Marks and spencer, Mark spencer, Spencer
7-Eleven Seven Eleven, Seven-Eleven
L'Oréal Loreal, L oreal
我们正在使用SQL Server 2016,CI-AS-归类。
是否存在有关如何解决此问题的最佳实践? 我们可以用来实现它的任何SQL Server技术(或其他)?
还是我们应该实现自己的“字符串归一化算法”(或科学术语是什么?),然后将归一化的公司名称存储在专用列中,并在执行通配符搜索之前对输入的字符串进行归一化? 结合“别名”表可以转换“常见错误”(例如7-11查询)。