基于索引的精确搜索CLOB列中的任意字符序列

时间:2013-03-12 07:05:31

标签: oracle oracle10g

我们需要在CLOB列中精确搜索任意字符序列。由于性能原因,搜索必须基于索引。

目前我们使用存储在不同表格中的n-gram。

使用Oracle Text,我们了解到需要一个tokenizer。为了匹配我们的“精确和字符明智搜索”要求,此标记生成器必须将我们的初始CLOB拆分为单个字符。没有人物可以忽略。因为使用了反向文本索引,所以我们怀疑这种解决方案是否合适。

另一个选择是利用Lucene和Java与Oracle(假设Lucene支持精确的字符匹配)。

还有其他选择吗?

0 个答案:

没有答案