Oracle - 意外的CONTAINS结果

时间:2013-07-24 08:34:25

标签: sql oracle oracle11g

数据库信息:

Oracle Database 11g Enterprise Edition Release 11.2.0.3.0 - 64bit Production
PL/SQL Release 11.2.0.3.0 - Production
"CORE   11.2.0.3.0  Production"
TNS for Linux: Version 11.2.0.3.0 - Production
NLSRTL Version 11.2.0.3.0 - Production

设定:

CREATE TABLE my_contains_test(    
   USERID VARCHAR2(8) NOT NULL,
   SEARCH VARCHAR2(40),
   CONSTRAINT contains_test_pk PRIMARY KEY (USERID)
);

INSERT ALL
INTO my_contains_test VALUES ('HUNTERW','Willie Hunter')
INTO my_contains_test VALUES ('HUWU','Will Hu')
SELECT * FROM dual;

create index ind_contains_test on my_contains_test(search) indextype is ctxsys.context;

查询:

select m.*, contains(search, 'will% and hu%', 1) as c_result from my_contains_test m;

结果:

    USERID   SEARCH         C_RESULT
    HUNTERW  Willie Hunter  4
    HUWU     Will Hu        0

对于第二条记录(C_RESULT == 0),这是一个好结果吗?我无法弄清楚发生了什么。

这是很好的部分。将名称更改为其他名称,例如WillieBillieWillBill,查询至:

select m.*, contains(search, 'bill% and hu%', 1) as c_result from my_contains_test m;

,结果是正确的:

USERID  SEARCH          C_RESULT
HUNTERW Billie Hunter   4
HUWU    Bill Hu         4

因此,改变一个位置会使其工作方式不同。我不知道那是什么意思。任何想法如何解决它都会很棒。

1 个答案:

答案 0 :(得分:1)

单词will位于英语语言的默认停止列表中,默认情况下不会编入索引。
请看这个链接:http://docs.oracle.com/cd/B28359_01/text.111/b28304/astopsup.htm#CEGBGCDF

创建自己的停止列表并在索引中使用它,尝试此代码(您必须在ctx_dll上授予执行权限):

drop index ind_contains_test;
exec CTX_DDL.CREATE_STOPLIST('my_empty_stoplist','BASIC_STOPLIST');
create index ind_contains_test on my_contains_test(search) 
indextype is ctxsys.context parameters('stoplist my_empty_stoplist');

select m.*, contains(search, 'will% and hu%', 1) as c_result 
from my_contains_test m;

USERID   SEARCH                                     C_RESULT
-------- ---------------------------------------- ----------
HUNTERW  Willie Hunter                                     4 
HUWU     Will Hu                                           4