如何在带有(可能)“掩码”的字形中使用多个令牌源字?

时间:2016-01-05 04:21:54

标签: sphinx

我发现创建多字字形的问题

Word1 Word2 > Word3 Word4

当任何这些单词是先前或后续单词形式的一部分时(实际上顺序无关紧要)

Word5 > Word1
Word6 > Word2

上述单词的任何组合都可以使用,例如

"Word5 Word6"="Word1 Word2"="Word1 Word6"="Word5 Word2"

自然

"Word1 Word2" = "Word3 Word4"

但是,如果我在mutlitoken字形中进行任何替换,例如

"Word5 Word2" != "Word3 Word4"

"Word1 Word6" != "Word4 Word4"

到目前为止,我找到的唯一(笨拙)解决方案是在左侧制作所有可能的mutltoken版本的版本:

Word1 Word2 > Word3 Word4
Word5 Word2 > Word3 Word4
Word1 Word6 > Word3 Word4
Word5 Word6 > Word3 Word4

我发现我没有被迫在右/目标字形上做同样的事情。

有更好的解决方案吗?在我阅读的文档中:

  

..您可以指定多个文件,而不仅仅是一个。面具可以   用作模式,所有匹配的文件将被简单处理   升序。

这是否表示可能的解决方案,即带有单个令牌字形的第一个字形,然后是处理mutlitokens的第二个字形?

0 个答案:

没有答案