我有一个包含成千上万行乱码的文本文件,隐藏在某处的内容是一串英文单词。
在不必逐行阅读的情况下搜索文本的最有效方法是什么?
我是否可以编写一个脚本来读取文件?
如果感兴趣的话,我可以发帖子吗?
编辑:如果有人愿意告诉我如何检查Java中BufferedReader
的单词真的很酷!
答案 0 :(得分:1)
如果您只知道文件中某处有一行有效的英语单词,则必须读入该文件并根据一组有效单词(词典)检查每个单词。在第一次点击时,您继续读取文件,直到出现第一个无效词。
这假设在胡言乱语中没有意外有效的词语。在这种情况下,你必须找到所有有效单词的条纹,然后可能有一个人(你)决定哪一个是正确的。
编辑:如果您知道要查找的单词字符串包含n个有效单词的最小值,则可以执行的另一项操作是定义最小条纹长度n。这至少可以避免你处理乱码中单个意外有效单词的所有误报1字条纹。