我应该如何调整狮身人面像?

时间:2018-06-16 00:01:54

标签: sphinx

我制作了我的第一个FullTextSearch应用。今天我终于开始测试了。

'测试'

... the Whig national **ticket** victorious, he ... Democrats who **thought** he was ...
... also a self-**tought** architect. He ... and he always **thought** of how ...
... HTML (Hyper **Text** Mark-up ... Сервер HTML Hyper **Text** Markup Language. ...
... ,0 2. Aiced **test** ratio (Quick ratio ... 
... on the first **Tuesday**, after the first ... 

'停止'

... ],Elm); OutText(Elm); **Stop**:=False; End; '2 ... 
.. a crucial **step** in the ... is an increasingly **steep** maturity-related... 
... CHIPSET FEATURES **SETUP** или INTEGRATED ... CHIPSET FEATURES **SETUP** или ... 
... Trisetum, Anisantna, **Stipa** и ... многие виды **Stipa**, Stipagrostis), что ...

我的配置:

source src1
{
type = csvpipe
csvpipe_command = /usr/bin/php /var/www/html/import.php 
csvpipe_field_string = title
csvpipe_field_string = content
csvpipe_attr_string  = path
}

 index test1
{   source          = src1
path            = /var/lib/sphinxsearch/data/test1
mlock           = 0
# morphology        = stem_en, stem_ru, soundex
min_word_len    = 2
html_strip      = 0
}

我评论了形态字符串并重新加载Sphinx,但结果相同。看起来形态仍然适合我。

1 个答案:

答案 0 :(得分:0)

可能最重要的是

  

morphology = stem_en,stem_ru,soundex

形态学是一种非常强大的功能,因为它可以变形'进入索引的单词(在查询中,所以可以匹配!),使用各种规则。

在您的情况下,您已启用了词干,这会使词汇量正常化'单词结尾,BUt auso有soundex,这是一个类似的'算法。我相信是为英语设计的,所以不知道它对俄语有多好!

所有这些都意味着类似的'匹配,而不仅仅是确切的单词匹配。

test 只是一个听起来与其他单词类似的单词,你的 hyper 示例,是一个更独特的发声单词)

也可以实现它的jsut测试脚本,但可以一次传递多个文件来构建摘录。所以它应该更有效率,编译文档并只调用buildExcepts一次。

但更有趣的是,当您从sphinx属性中获取文本时,可以在主查询中使用SNIPPETS() sphinx函数(在setSelect()!中)。所以你不必收到全文,只是发送回狮身人面像。即sphinx将在内部从属性中获取文本。更有效率!