MarkLogic中的汉字处理

时间:2019-01-28 10:04:55

标签: marklogic marklogic-8

我正在尝试搜索包含汉字的文档。启用的索引是单词搜索,3个字符搜索,快速短语搜索。在重新索引之前,代码可以提供正确的结果,但是在重新索引之后,它无法提供预期的输出。

XML:

<root>
  <name xml:lang="en">Propylene</name>
  <name xml:lang="zh">丙烯</name>
</root>

搜索查询:

cts:search(collection('live'),
  cts:element-query(xs:QName('name'), 
    cts:word-query('丙烯', ("wildcarded", "whitespace-insensitive", "lang=zh"), 1)))

我希望以上XML出现在结果集中,但重新索引后不在结果集中。

其他语言的索引与MarkLogic中的“英语”不同吗?