自动获取术语列表,导入Windows搜索功能(用于内容),并导出结果列表。 (AutoIt的?)

时间:2012-12-19 14:44:20

标签: algorithm search full-text-search autoit windows-search

我的下一个重大挑战是编写一个脚本(我认为它将在AutoIT中,这是我很少有经验的领域)来自动化Windows搜索功能。

最终目标是从.txt文件中获取搜索词列表(每行一个字符串),并在计算机上搜索每个文档的内容以查找所述搜索词(一次一个)。

我可以手动实现这一点 - 通过内容功能打开搜索,索引所有连接驱动器上的所有文件,逐个搜索条件,并突出显示所有> shift-click>复制为路径>粘贴在记事本中,并保存为[searchterm] .txt。

但是,我需要自动完成整个过程。据我所知,我可能需要为每个版本的Windows编写一个单独的脚本(XP,Vista,7,8)。

这是一项非常容易完成的任务,还是需要花费大量的编程时间?谁能指出我正确的方向?感谢所有帮助。

1 个答案:

答案 0 :(得分:0)

好吧,假设您的查询文本文件足够大,并且您不想为每个文件系统实际迭代整个文件系统,那么您将描述一个经典的information retrieval问题。

  1. 索引文件系统中的数据(这是一次只进行一次的预处理)
  2. 对于每个查询 - 在索引中搜索它,并获取相关文档。
  3. 信息检索领域是一个巨大的研究领域,我真的不鼓励你尝试从头开始实施。

    我鼓励使用已经为您开发和测试的内置库。例如,在java中,一个流行的选择是lucene - 它被广泛用于在任何地方搜索。

    如果你不熟悉java,我也知道这个库的python(pylucene)和.NET(lucene.NET)绑定。


    要了解有关信息检索的更多信息,我建议使用Manning的Introduction to Information Retrieval