SQL Server - 高效字符串包含超大表

时间:2012-11-08 14:24:51

标签: sql-server sql-server-2008 tsql

我有一张目前包含1000万条记录的表格。

其中一列是SourceText类型的nvarchar(4000)

我需要非常有效的方法来搜索SourceText以查看它是否包含另一个字符串。

我对表结构有极大的灵活性 - 我可以修改插入过程并使用其他更好的索引表来跟踪事物。一种想法是按字标记SourceText并将单词存储在索引表中,然后使用映射表映射到主表。问题是SourceText列可以是任何语言,并且总是有规则re:parantheses等。例如,在英语中,如果我使用''作为分隔符进行标记,我仍然会得到类似{{{ 1}}而不是(Where,这是有问题的。

有什么想法吗?

1 个答案:

答案 0 :(得分:0)

这将是一个非常有趣且具有挑战性的项目(而且我认为有可能)实现快速全文搜索,而无需可选且非常强大的full text search component of SQL Server; - )