我使用Apache Lucene构建了一个拼写检查器应用程序。我目前正在使用英文单词(每行一个)的文本文件中使用表单中的字典。我的拼写检查器正在在线技术论坛上使用,所以我需要一个替换词典,其中包含一些相同格式的技术词汇。我搜索过但我找不到任何东西。任何建议都将受到高度赞赏。
答案 0 :(得分:0)
该域名的专业社团可能会有词典。一旦你有一个包含相应技术词的字典,你就可以创建一个包含两组单词的临时文件,然后对该文件进行排序,以创建一个文件,其中所有单词都按排序顺序排列。 (在Linux上或使用Cygwin,您可以使用'sort'命令进行排序。)