在任何给定单词的替代品数量很多的情况下,有没有人在速度方面做过任何表现措施。例如,我想用它来存储常见的拼写错误;期待一个单词有4-10个变体。
<expansion>
<sub>administration</sub>
<sub>administraton</sub>
<sub>aministraton</sub>
</expansion>
运行全文搜索时,性能如何随着该数量的变化而降低?例如,我假设它必须进行单独的全文搜索来执行OR?
另外,在Thesaurus xml文件中说20 / 30K条目 - 这会影响性能吗?
答案 0 :(得分:0)
不,但性能测试通常非常特定于系统。我建议将一些示例数据放在一起,运行自己的测试用例是最好的选择。