使用google cse搜索页面映射结构化数据中的整个属性进行过滤

时间:2014-01-03 18:11:07

标签: google-custom-search

我无法从我设置的网页地图中搜索数据。当包含页面是结果时,页面映射会正确返回,但我只能搜索属性的前十个单词,如下所示:

<Attribute name="description">The smash is the most
    explosive and aggressive stroke in Badminton. Elite athletes can
    generate shuttlecock velocities of up to 370 km/h. To perform the
    stroke, one must understand the biomechanics involved, from the body
    positioning to the wrist flexion. </Attribute>

“Smash”(more:pagemap:document-description:smash)将匹配并返回页面,但“羽毛球”不会。结构化数据测试工具显示每个space创建一个新数据点并将点数限制为十个:

more:pagemap:document-description
more:pagemap:document-description:aggressive
more:pagemap:document-description:and
more:pagemap:document-description:explosive
more:pagemap:document-description:in
more:pagemap:document-description:is
more:pagemap:document-description:most
more:pagemap:document-description:smash
more:pagemap:document-description:stroke
more:pagemap:document-description:the

我需要能够在每个属性中过滤十个以上的单词。有没有办法绕过这个限制,或者我是否会以错误的方式过滤?

1 个答案:

答案 0 :(得分:0)

根据google,每个属性只能获得10个令牌进行过滤。我无法绕过它。

为了更具体地说明我的原始问题,我在诊所页面中存储了多个医生页面路径,这些路径在每个/被标记化。我通过在医生页面标签中搜索诊所页面解决了我的问题,而不是从我的诊所页面搜索结果中读取医生页面。我使用重复的属性来搜索,比如

//inside clinic-page
<Attribute name="doctor">path/to/doc1</Attribute>
<Attribute name="doctor">path/to/doc2</Attribute>
...

但这不允许您从诊所页面结果中阅读每个医生页面。这恰巧适用于我的情况。谷歌肯定会将其代币限制为每个属性10个。