在哪里可以找到Oracle全文搜索的“停止”单词列表?

时间:2010-06-08 02:36:22

标签: full-text-search reserved-words stop-words oracle-xe oracle-ucm

我有一个客户端在新的Oracle UCM站点上测试全文(下面的示例)搜索。 他们选择测试的随机文本字符串是“仅测试”。失败了;从我的测试来看,似乎'only'是一个保留字,因为它永远不会从全文搜索返回(它是从元数据搜索返回的)。

我上午搜索了oracle.com,发现this似乎非常全面,但没有'仅'。

因此,我的问题是,'只是'一个保留字。在哪里可以找到Oracle全文搜索(10g)的完整保留字列表?

全文搜索字符串示例;

(<ftx>test only</ftx>)

<小时/> 的更新 我做了一些测试。似乎它忽略了指示地点或时间的单词; 只有,有些,直到,何时,何时,何地,有,在这里,在哪里,那,谁,约,这,他们。

任何人都可以证实吗?我无法在任何地方找到这个。

<小时/> 更新2.发布回答 我应该一直在寻找“停止”的词而不是“保留”。 更新了问题标题和标签以反映。

3 个答案:

答案 0 :(得分:4)

其他答案:

SELECT *
FROM DR$STOPWORD
LEFT JOIN DR$STOPLIST ON DR$STOPWORD.SPW_SPL_ID = DR$STOPLIST.SPL_ID

在结果中,SPL_*字段来自DR$STOPLIST系统表,SPW_*字段来自DR$STOPWORD

  • 从用户架构中,可以通过
  • 检索用户定义的停止列表和停用词
SELECT * FROM CTX_USER_STOPLISTS;
SELECT * FROM CTX_USER_STOPWORDS;

答案 1 :(得分:3)

我敢打赌,系统正试图自动忽略经常出现的单词。这可以解释为什么你找不到'只'但是'onnly'可以找到。你能搜索'a','an',...

你给出的不起作用的单词列表看起来像一些非常常见的单词,通常不是句子中的主要单词。鉴于此,它们不太可能是您在全文搜索中搜索的单词。

您正在寻找包含“那个”这个词的文章,并且包含该词是您在该文章中唯一的事实,有什么可能性?

我想我找到了你的清单......具有讽刺意味的是,我在上一家公司的维基页面开始......:http://www.sugarcrm.com/wiki/index.php?title=Overview_of_Full_Text_Stop_Words#Default_Stop_Words_.28for_English.29

2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist:
 • CTX_DDL.ADD_STOPWORD
 • CTX_DDL.REMOVE_STOPWORD
 • CTX_DDL.ADD_STOPTHEME
 • CTX_DDL.ADD_STOPCLASS
 When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect.

默认禁用词列表:

a he out up
be more their at
had one  will  from
it than and is
only when corp not
she also in  says
was by ms to
about her  over  
because  most  there  
has or  with  
its that are  
of which could  
some an inc  
we can mz  
after  his s  
been mr they  
have other  would  
last the as  
on who for  
such any into  
were co  no  
all if so  
but mrs this

更新 - 来自Oracle的一份精彩白皮书,其中包括全文搜索的工作原理,可以从以下网址下载:http://www.oracle.com/technology/products/text/pdf/text_techwp.pdf。他们提到了停用词以及有一个默认列表的事实,但是没有提到这些词本身。

答案 2 :(得分:0)

保留关键字: http://www.toadworld.com/KNOWLEDGE/KnowledgeXpertforOracle/tabid/648/TopicID/SQL15/Default.aspx 点击左侧的“关键字保留字”。

“仅”在列表中。

我不确定你的情况是怎么回事,但我无法想象甲骨文只会在全文搜索中支持这个词。在许多全文案例中,您必须搜索一个单词。这可能是你遇到的问题吗?