谷歌抓取/索引“计算”或原始html源?

时间:2013-06-21 18:50:51

标签: php wordpress search

我有一个独特的情况,我有几页在多个页面中“分页”(通过WordPress“nextpage”功能)。相同的内容,分布在两个或更多页面上,如下:

http://mysite.com/mypage/
http://mysite.com/mypage/2
http://mysite.com/mypage/3

因此,页面本身有一个html页面标题标记<title>My Page</title>,但由于它分布在多个页面上,我必须创建脚本以为每个页面添加唯一的html标题标记以便获取谷歌索引他们。

要做到这一点,我正在使用

$exploded = explode("/",$_SERVER['REQUEST_URI']);

if( is_numeric( $exploded[sizeof($exploded)-2] ) && !is_archive())
{
    $title = $title." (Page ".$exploded[sizeof($exploded)-2].")";
}

为每个“分页”页面创建唯一的页面标题,如下所示:

<title>mypage</title>
<title>mypage (page 2)</title> 
<title>mypage (page 3)</title>

现在,我遇到了一种情况,我正试图通过一个更具描述性的标题来更新(第X页)。

所以,在我的标记中,当页面被这样分页时,我已经包含了一个html“details”元素,其中包含页面的目录,如下所示:

<details class="myEl" open="open">
    <summary>In this article</summary>
    <ol>
        <li><a href="post-slug/">Introduction</a></li>
        <li><a href="post-slug/2/" class="active">Title for the second page</a></li>
        <li><a href="post-slug/3/">Title for the third page</a></li>
    </ol>
</details>

为了尝试将TOC的标题复制到标题标签中(以替换“Page X”标题),我正在尝试使用这个jQuery脚本(它可以完美地改变“计算”的标题)源):

<script>
    jQuery(document).ready(function(){
        var title = jQuery('.myEl').find('a.active').text();
        jQuery('title').text(title);
    });
</script>

但是,当我使用Google Structured data testing tool测试这些页面时,标题与“(页面X)”语法保持不变。就好像Google正在解析原始html源而不是计算源。

这可以确认吗?

1 个答案:

答案 0 :(得分:2)

虽然一些爬虫能够运行JS并访问渲染的页面,但大多数爬虫都没有。因此,他们都将原始HTML的信息作为基础,并使用呈现的页面(如果可用)来检测黑帽SEO策略(隐藏的关键字填充,链接更改,js重定向等)。

如果您希望Google(和其他搜索引擎)获取改进的标题,则必须在HTML中发送,而不是在页面加载后修改它。