我正在开展一个项目,对大约100万张图片进行数字化处理,以便为搜索添加元数据。
每个图像例如是字典中的页面。但不是文字。只是静态扫描图像。 OCR不是一种选择:(
我的目标是模拟当前的搜索过程,其中包括查找字母条目,直到找到正确的页面。在没有机器可读文本的情况下,我正在寻找使用字典范围标记标记每个页面。例如(Apple-Canada)。因此,如果有人搜索“Banana”,它应该会打到(Apple-Canada)范围Tag。
SharePoint中是否支持此功能?如果没有,是否有一个提供此功能的插件产品,或者我正在构建自定义扩展?
任何帮助将不胜感激:)
答案 0 :(得分:1)
只需点击几下即可安装IFilter for TIF文件,并为您提供免费的OCR。非常适合扫描页面。
在您的问题上:不,SharePoint没有任何类型的“范围”标签或字段。与你要求的唯一模糊相似的是搜索词库。在那里你可以为单词定义首字母缩略词和同义词,它实际上会搜索其他内容。所以你可以进入香蕉,但它实际上会搜索Apple。这里有一些例子:How to: Customize the Thesaurus in SharePoint Search and Search Server。
除此之外,我只能想到一个自定义实施的搜索提供商,为您提供所需的灵活性。