生成用于Lucene.NET的同义词列表XML的最简单方法是什么?根据我的阅读,Lucene.NET将加载一个XML文档,如以下格式:
<?xml version="1.0" encoding="utf-8" ?>
<synonyms>
<group>
<syn>fast</syn>
<syn>quick</syn>
<syn>rapid</syn>
</group>
<group>
<syn>slow</syn>
<syn>decrease</syn>
</group>
<group>
<syn>google</syn>
<syn>search</syn>
</group>
<group>
<syn>check</syn>
<syn>lookup</syn>
<syn>look</syn>
</group>
</synonyms>
我尝试过搜索一个工具,该工具会使用CSV并以正确的格式吐出XML文档。但是,我很惊讶没有找到任何东西。所以我的理解是不正确的,像上面这样的XML文档不是在Lucene.net中加载同义词的方法,或者我没有正确搜索。
任何帮助都将不胜感激。
答案 0 :(得分:0)
您的xml来自CodeProject文章Lucene.Net - Custom Synonym Analyzer,其中还包含一个XmlSynonymEngine
来解析您的xml。您可以构建自定义ISynonymEngine
来直接解析csv数据,而无需将输入转换为xml。