我们正在使用PageMap为我们的Html内容提供结构化数据。此结构化数据的一部分是结果页面上显示的关键字。此外,还应该可以使用这样的关键字过滤结果。
我们确实有包含空格和特殊字符的关键字。所以这里是Google Site Search的XML API返回的结果元素的摘录:
<PageMap>
<DataObject type="document">
<Attribute name="mykeywords">Computer & Hobby</Attribute>
...
</DataObject>
</PageMap>
这非常适合显示结果。但是,对于过滤,我们必须传递这样的查询:
more:pagemap:document-mykeywords:computer___hobby
我们如何从XML中的结果中确定查询字符串?只需通过降低值并用_替换每个非单词字符?这有多可靠?
或者最好在我们的PageMap中提供两个不同的属性,一个用于关键字的标签,另一个用于关键字的id?