我希望能够搜索整个文件系统,甚至只搜索包含文本字符串的图像的目录。这当然会使用OCR(光学字符识别)。
最理想的是,这将在后台运行,并为所有图像中的所有文本创建索引。
我的理由是我有很多包含文字的屏幕截图,我希望能够搜索它们。
有人知道现有的解决方案吗?如果不是,我正在考虑使用OCR库自己创建。有关如何实施它的任何建议吗?
主要目标平台是Windows 7。
答案 0 :(得分:1)
VietOCR监视监视文件夹中的新输入图像文件并对其执行OCR。它不支持索引。该计划是开源的;您可以将其功能扩展到您的要求。
答案 1 :(得分:0)
当然,您描述的解决方案很多。 首先,有一类称为“文档管理系统”的产品,它允许索引计算机或网络中的所有文档。其中许多可选地提供OCR和图像文本索引功能。 其次,有一套“企业搜索系统”产品,它们也提供了这样的选项(even Google has one)。最后,看看at e-discovery term。它是专门用于美国法律需求的文档管理系统的子类。
我相信这些是相当昂贵的企业解决方案,也许在某些地方有SoHo版本,尝试使用我上面提到的搜索内容。