我制作了我的第一个FullTextSearch应用。今天我终于开始测试了。
'测试'
... the Whig national **ticket** victorious, he ... Democrats who **thought** he was ...
... also a self-**tought** architect. He ... and he always **thought** of how ...
... HTML (Hyper **Text** Mark-up ... Сервер HTML Hyper **Text** Markup Language. ...
... ,0 2. Aiced **test** ratio (Quick ratio ...
... on the first **Tuesday**, after the first ...
'停止'
... ],Elm); OutText(Elm); **Stop**:=False; End; '2 ...
.. a crucial **step** in the ... is an increasingly **steep** maturity-related...
... CHIPSET FEATURES **SETUP** или INTEGRATED ... CHIPSET FEATURES **SETUP** или ...
... Trisetum, Anisantna, **Stipa** и ... многие виды **Stipa**, Stipagrostis), что ...
我的配置:
source src1
{
type = csvpipe
csvpipe_command = /usr/bin/php /var/www/html/import.php
csvpipe_field_string = title
csvpipe_field_string = content
csvpipe_attr_string = path
}
index test1
{ source = src1
path = /var/lib/sphinxsearch/data/test1
mlock = 0
# morphology = stem_en, stem_ru, soundex
min_word_len = 2
html_strip = 0
}
我评论了形态字符串并重新加载Sphinx,但结果相同。看起来形态仍然适合我。
答案 0 :(得分:0)
可能最重要的是
morphology = stem_en,stem_ru,soundex
形态学是一种非常强大的功能,因为它可以变形'进入索引的单词(在查询中,所以可以匹配!),使用各种规则。
在您的情况下,您已启用了词干,这会使词汇量正常化'单词结尾,BUt auso有soundex,这是一个类似的'算法。我相信是为英语设计的,所以不知道它对俄语有多好!
所有这些都意味着类似的'匹配,而不仅仅是确切的单词匹配。
( test 只是一个听起来与其他单词类似的单词,你的 hyper 示例,是一个更独特的发声单词)
也可以实现它的jsut测试脚本,但可以一次传递多个文件来构建摘录。所以它应该更有效率,编译文档并只调用buildExcepts
一次。
但更有趣的是,当您从sphinx属性中获取文本时,可以在主查询中使用SNIPPETS()
sphinx函数(在setSelect()
!中)。所以你不必收到全文,只是发送回狮身人面像。即sphinx将在内部从属性中获取文本。更有效率!