根据GSA的文件:
PDF or XPS documents typically have metadata such as:
<MT N="CreationDate" V="D:20040107111105Z"/>
<MT N="ModDate" V="D:20040209162220+01'00'"/>
The search appliance can automatically pick up these formats without any special formatting configuration.
但不幸的是,这似乎并没有奏效。我们在网站上有PDF,DOC和其他文件,最后修改日期出现在GSA搜索结果中相应的<MT>
条目中。但<FS NAME="date">
有一个空白值,表示GSA无法提取日期。即使在GSA控制台的“文档日期”页面中指定日期格式也无济于事。
那么如何让GSA“看到”文件的最后修改日期?请注意:我们无法使用Web服务器上次修改的HTTP标头值,因为它们在我们的情况下不正确(AEM调度程序/缓存干扰)。
答案 0 :(得分:0)
GSA可以从文档属性中提取元数据,但我不确定GSA是否可以使用该ModDate / CreationDate在没有“文档日期”配置的情况下填充<FS NAME="date">
。
您已经提到“您不能使用Web服务器上次修改的HTTP标头值,因为它们在我们的情况下不正确。”这是否意味着您的Web服务器返回具有不正确值的最后修改标头?
Last-Modified响应标头优先于GSA中的所有其他元数据。因此,如果您的服务器无法返回正确的值,则必须从响应中删除Last-Modified标头。
我在使用Java Simpledateformat(yy-MM-dd)时遇到了很多人,同时指定了文档日期下的格式,但GSA只能理解strptime格式。这是GSA无法填充{{1}的主要原因之一}。因此,请确保在strptime中使用日期格式,否则请将其留空,因为它不是必填字段。