场景:
Blob存储:包含pdf,word,图像文件(约70个文件)
我使用默认字段和预定义的技能通过Azure门户创建Azure搜索实例。
但是查询这些文件中任何文本的结果不是很好。我将内容和关键短语设为可搜索和可检索。我尝试使用Lucene分析仪,但并没有太大帮助。
主要问题是,如果我在搜索浏览器中甚至键入字母(例如“ u”),它都会返回文件。据我了解,我的文件中没有这样的词。那它在做什么?
如何优化搜索?以及如何操纵结果?
我不是文档处理专家。因此,请在Blob中使用非结构化文档,而不是JSON格式的文档。
另一件事,如何在索引中定义某些字段,比如说可以与PDF章节/标题名称相关的章节名称或标题名称?
请给我建议一些想法或示例链接。我正在使用.net core进行开发。
答案 0 :(得分:0)
使用自定义技能集提取所需的字段,并确保在索引中定义了这些字段。