我知道您可以使用seek()查找特定字节并从那里开始读取。如何在文件中找到特定单词并从那里开始阅读。例如,我如何从单词' Origin'中开始阅读文件。谢谢你的帮助!!
答案 0 :(得分:2)
您可以使用grep
用于查找单词的相同算法有效地实现此目的。这是Boyer-Moore string search algorithm。
从根本上搜索字符串的最后一个字母。您可以通过创建目标词中所有字母的列表来执行此操作,然后使用搜索检查文件中的字母。如果你找到一个不在单词中的字母,那么你知道单词不能在单词的全长之前结束,所以你可以跳过那个远远的并再次测试。如果字母在单词中,那么您可以在单词中使用它的可能位置来优化搜索。如果你找到了最后一个字母,那么你可以回到预期的单词开头并检查它是否符合你的预期。