标签: java spell-checking text-classification
我目前正在进行文本分类,并发现语料库中的某些文档有拼写错误,如“go”被写为“geos”,“available”被写为“avaliable”。我是524智能停止的话删除停止的话。这种拼写错误导致停止词不能从语料库中正确删除并驻留在那里,这可能影响我的分类器性能。我正在使用20个新闻组数据集。
我应该如何使用Java中的英语拼写更正?
答案 0 :(得分:1)
请参阅此内容您可能会有所了解 http://code.google.com/p/google-api-spelling-java/