文本文件比较

时间:2012-10-08 08:10:39

标签: java

我正在实现用于比较java中两个文本文件的工具。 文本文件仅包含数字,字母数字和键盘符号。 将一个文件与其他文件进行比较,找到拼写,标点符号或缺少文本错误。

示例:

Original word: Her
 Error Word: hor   
It is spelling error

Original word: Miss
 Error Word: miss 
It is Punctuation error 

不需要使用字典,因为拼写也与原始文件比较。如果原始文件中的单词是她而且在第二个文件中该单词是hor而不是产生拼写错误但问题是拼写,标点符号或缺失文本的分类不完善

如果有任何功能或工具可以解决我的问题,请建议我。

2 个答案:

答案 0 :(得分:0)

您需要实现字典Trie data structure。这是通过可预测的结果进行拼写校正的唯一方法。

答案 1 :(得分:0)

由于我不能在原帖下发表评论,我会在此要求澄清。

问题是“如何判断一个单词是否丢失”?例如,如果您有以下行:

“我的名字是罗伊,这里有一堆其他文字”

“我的名字是罗伊,这里是一堆其他文字”

因为第二行缺少单词“is”,程序会报告一堆拼写错误而不是缺少单词错误?