我正在实现用于比较java中两个文本文件的工具。 文本文件仅包含数字,字母数字和键盘符号。 将一个文件与其他文件进行比较,找到拼写,标点符号或缺少文本错误。
示例:
Original word: Her
Error Word: hor
It is spelling error
Original word: Miss
Error Word: miss
It is Punctuation error
不需要使用字典,因为拼写也与原始文件比较。如果原始文件中的单词是她而且在第二个文件中该单词是hor而不是产生拼写错误但问题是拼写,标点符号或缺失文本的分类不完善
如果有任何功能或工具可以解决我的问题,请建议我。
答案 0 :(得分:0)
您需要实现字典Trie data structure。这是通过可预测的结果进行拼写校正的唯一方法。
答案 1 :(得分:0)
由于我不能在原帖下发表评论,我会在此要求澄清。
问题是“如何判断一个单词是否丢失”?例如,如果您有以下行:
“我的名字是罗伊,这里有一堆其他文字”
“我的名字是罗伊,这里是一堆其他文字”
因为第二行缺少单词“is”,程序会报告一堆拼写错误而不是缺少单词错误?