我使用Azure来托管我的项目,并选择blob来存储所有文件(因为它们以兆字节为单位,数量很大)。我要求在blob中的所有文件中搜索(有点像全文搜索)。我尝试将其与Azure搜索集成,但没有运气,因为索引仅在sql上进行。有没有办法在blob中集成全文搜索?
如果没有,那么将文档存储在azure中的有效方法是什么,并且仍然可以搜索(全文搜索),就像sharepoint提供的那样。
答案 0 :(得分:10)
我在Azure搜索上工作。我们刚刚为存储在Azure blob存储中的索引文档提供了预览支持,支持PDF,Office文档,HTML和一些其他格式。有关详细信息,请参阅https://azure.microsoft.com/en-us/documentation/articles/search-howto-indexing-azure-blob-storage/。
谢谢, 尤金
答案 1 :(得分:0)
您可以尝试现在支持认知搜索[Preview]的天蓝色搜索,它可以使用OCR进行图像识别。它对pdf和所有类型的文档都非常有用。
即使使用扫描的文档也可以正常工作。
有一个来自Microsoft的关于天蓝色搜索的在线演示,它做得很好。 https://jfk-demo.azurewebsites.net/