标签: oracle oracle10g
我们需要在CLOB列中精确搜索任意字符序列。由于性能原因,搜索必须基于索引。
目前我们使用存储在不同表格中的n-gram。
使用Oracle Text,我们了解到需要一个tokenizer。为了匹配我们的“精确和字符明智搜索”要求,此标记生成器必须将我们的初始CLOB拆分为单个字符。没有人物可以忽略。因为使用了反向文本索引,所以我们怀疑这种解决方案是否合适。
另一个选择是利用Lucene和Java与Oracle(假设Lucene支持精确的字符匹配)。
还有其他选择吗?