我正在实施一个用于索引图像格式的IFilter。一个问题是照片 - 许多用户拥有大量照片,照片非常庞大,加载和搜索文本非常耗时。
是的,有时人们使用相机而不是扫描仪来对文档进行数字化处理,但是IMO的潜在问题远远超过了使用照相机数字化文档的可能性。所以我的实现根本不会从照片中提取文本。
一旦检测到给定文件是照片图像,IFilter应该做什么 - 表示错误或返回空文本?
答案 0 :(得分:1)
如果Word过滤器没有处理跟踪的更改,则不会抛出错误;它会跳过它们。即使在你的情况下你正在跳过整个文件,它的原理也是一样的。这不是错误条件。只返回没有文字。