有人知道Zend_Lucene类是否支持CJK(中文日文韩文)。
我想在我自己的网站上使用它,它应该适用于英语和日语。
此外,如果有人对CJK版本的Java版本有一些资源,也会受到赞赏。
由于
答案 0 :(得分:2)
目前,这些是Zend_Lucene中内置的唯一兼容UTF-8的分析仪
您可以使用以下代码来使用它们:
Zend_Search_Lucene_Analysis_Analyzer::setDefault(
new Zend_Search_Lucene_Analysis_Analyzer_Common_Text());
如果需要,您也可以构建自己的分析器。
另一种解决方案是使用Java Lucene构建索引并在PHP中使用该索引,因为它们应该是兼容的。我没有试过这个。
Zend_Search_Lucene源自Apache Lucene项目。目前(从ZF 1.6开始)支持的Lucene索引格式版本为1.4 - 2.3
您可以在Zend Framework手册中阅读更多相关信息。 link text