我想在html文件中进行纯文本搜索。
似乎属性值未编入索引。
如果我有一个包含这个<div property="property value"> Textual value </div>
标签的html文件,我无法通过搜索属性值找到此文件。
有没有办法让这成为可能?
答案 0 :(得分:4)
您需要定义自己的自定义元数据提取符。您可以在下面的链接中了解更多信息。
http://wiki.alfresco.com/wiki/Metadata_Extraction
根据您的要求,
alfresco-community-sdk-3.4.b\src\alfresco-repository-src.zip\java\org\alfresco\repo\content\metadata\HtmlMetadataExtracter.java
上面是负责从html文件中提取数据的类。如果你看到该文件的内容,它忽略了tag内的标签和属性。所以你可以参考上面的文件并定义你自己的{{1 }}