我想在我的网络应用程序中列出一个单词的所有出现。 我已经看过的几个地方是HTML页面,代码文件,数据库,上传的文档,图像,视频。 请告诉我其他我应该看的地方,这个词可以出现在哪里。 我知道爬虫可以用于此任务,但如果有人在过去有相同的经验,那么请建议一些好的自动化工具,可以在网站上轻松找到这个词。
答案 0 :(得分:0)
由于文件是本地文件,我认为您不需要爬虫。您只需要搜索文件。
正如我在评论中所说,操作系统本身应该能够找到最多的事件。
程序ack应该能够做你想要的。它是用Perl编写的,所以它完全可以移植到Windows上。这是Windows上的SO question about installing it。这适用于所有HTML文件和源代码。
一些警告: