Zend_Lucene CJK支持

时间:2009-09-07 00:56:23

标签: php zend-framework lucene cjk

有人知道Zend_Lucene类是否支持CJK(中文日文韩文)。

我想在我自己的网站上使用它,它应该适用于英语和日语。

此外,如果有人对CJK版本的Java版本有一些资源,也会受到赞赏。

由于

1 个答案:

答案 0 :(得分:2)

目前,这些是Zend_Lucene中内置的唯一兼容UTF-8的分析仪

  • Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8
  • Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num
  • Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8_CaseInsensitive
  • Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8Num_CaseInsensitive

您可以使用以下代码来使用它们:

Zend_Search_Lucene_Analysis_Analyzer::setDefault(
new Zend_Search_Lucene_Analysis_Analyzer_Common_Text());

如果需要,您也可以构建自己的分析器。

另一种解决方案是使用Java Lucene构建索引并在PHP中使用该索引,因为它们应该是兼容的。我没有试过这个。

  

Zend_Search_Lucene源自Apache Lucene项目。目前(从ZF 1.6开始)支持的Lucene索引格式版本为1.4 - 2.3

您可以在Zend Framework手册中阅读更多相关信息。 link text