我有一张目前包含1000万条记录的表格。
其中一列是SourceText
类型的nvarchar(4000)
。
我需要非常有效的方法来搜索SourceText以查看它是否包含另一个字符串。
我对表结构有极大的灵活性 - 我可以修改插入过程并使用其他更好的索引表来跟踪事物。一种想法是按字标记SourceText并将单词存储在索引表中,然后使用映射表映射到主表。问题是SourceText
列可以是任何语言,并且总是有规则re:parantheses等。例如,在英语中,如果我使用''作为分隔符进行标记,我仍然会得到类似{{{ 1}}而不是(Where
,这是有问题的。
有什么想法吗?
答案 0 :(得分:0)
这将是一个非常有趣且具有挑战性的项目(而且我认为有可能)实现快速全文搜索,而无需可选且非常强大的full text search component of SQL Server; - )