Search Server通过元标记索引html文档的所有元数据。对于其他文件类型,如Word文档,PDF等,元数据位于自己的文件中。
假设我们有一个CMS,其中包含位于数据库中的每个文件的元数据,是否可以以任何方式添加此数据?
我尝试通过httphandler在http标头中添加元数据,但Search Server不对它们编制索引。
答案 0 :(得分:0)
我最终通过连接http模块并检查useragent字符串来为爬虫提供一个html页面而不是文件。 html页面包含文件中的文本摘录和元标记中的其他元数据。我使用IFilters从文件中提取内容。