SQL Server Word Breaker版本之间的差异(全文搜索)

时间:2018-12-06 15:30:11

标签: sql-server full-text-search wordbreaker

我有两个不同的环境,一个LIVE和一个STAGING环境。

这些正在运行SQL Server 2016 Web版,但是SQL主机本身和某些全文组件(即分词系统(MsWb7.dll))的版本都有细微的差异

LIVE: SQL: 13.0.1728.2, Word breaker: 15.0.4569.1503
STAGING: SQL: 13.0.4466.4, Word breaker: 14.0.4763.1000

我使用以下方法获取分词系统版本:

EXEC sp_help_fulltext_system_components 'wordbreaker';

我正在使用sys.dm_fts_parser使用下划线打断单词:

SELECT *
FROM sys.dm_fts_parser('xxxx_yyyy', 1033, 0, 0)

1033是英语的LCID。

这是LIVE中的结果:

keyword                                   group_id    phrase_id   occurrence  special_term     display_term  expansion_type source_term
---------------------------------------------------------------------------------------------------------------------------------------
0x006200750069006C005F006E003000350030    1           0           1           Exact Match      xxxx_yyyy                                                                                                                                                                                                                                                        0              xxxx_yyyy
0x006200750069006C                        1           0           1           Exact Match      xxxx          0              xxxx_yyyy
0x006E003000350030                        1           0           2           Exact Match      yyyy          0              xxxx_yyyy

结果在STAGING:

keyword                                   group_id    phrase_id   occurrence  special_term     display_term  expansion_type source_term
---------------------------------------------------------------------------------------------------------------------------------------
0x006200750069006C005F006E003000350030    1           0           1           Exact Match      xxxx_yyyy                                 

我看不到如何控制断字程序使用的字符,这似乎是硬编码的,这表明升级断字程序组件是前进的方向,但是我找不到有关 how < / em>来做到这一点。

还有其他人会经历吗?

1 个答案:

答案 0 :(得分:1)

为时已晚,

我遇到了同样的问题,对我来说sys.dm_fts_parser方法的结果是不同的。 您可以看到我的问题here

我的建议是创建自己的断字器。

查看相关问题here的答案