标签: html sharepoint search metadata
我正在使用SharePoint搜索来抓取由标准HTML文件组成的外部网站。似乎我缺少很多功能,因为文件没有存储在SharePoint本身,也没有自定义元数据,列和托管属性。
是否可以在HTML文件中创建要由SharePoint进行爬网并用作托管属性的标记?
答案 0 :(得分:2)
理论上是,但它需要大量的自定义,因为你必须创建一个i-filter,它将处理html对象的请求并读取你的元数据标签并将其存储到搜索数据库中的元数据属性。然后将其传递给实际的i-filter,以便在处理时对其进行处理。 使用OOTB功能是不可能的
答案 1 :(得分:1)
根据这些two blogs,也希望这样做,这可能是使用html元标记