Question

我有一个独特的情况，我有几页在多个页面中“分页”（通过WordPress“nextpage”功能）。相同的内容，分布在两个或更多页面上，如下：

http://mysite.com/mypage/
http://mysite.com/mypage/2
http://mysite.com/mypage/3

因此，页面本身有一个html页面标题标记<title>My Page</title>，但由于它分布在多个页面上，我必须创建脚本以为每个页面添加唯一的html标题标记以便获取谷歌索引他们。

要做到这一点，我正在使用

$exploded = explode("/",$_SERVER['REQUEST_URI']);

if( is_numeric( $exploded[sizeof($exploded)-2] ) && !is_archive())
{
    $title = $title." (Page ".$exploded[sizeof($exploded)-2].")";
}

为每个“分页”页面创建唯一的页面标题，如下所示：

<title>mypage</title>
<title>mypage (page 2)</title> 
<title>mypage (page 3)</title>

现在，我遇到了一种情况，我正试图通过一个更具描述性的标题来更新（第X页）。

所以，在我的标记中，当页面被这样分页时，我已经包含了一个html“details”元素，其中包含页面的目录，如下所示：

<details class="myEl" open="open">
    <summary>In this article</summary>
    <ol>
        <li><a href="post-slug/">Introduction</a></li>
        <li><a href="post-slug/2/" class="active">Title for the second page</a></li>
        <li><a href="post-slug/3/">Title for the third page</a></li>
    </ol>
</details>

为了尝试将TOC的标题复制到标题标签中（以替换“Page X”标题），我正在尝试使用这个jQuery脚本（它可以完美地改变“计算”的标题）源）：

<script>
    jQuery(document).ready(function(){
        var title = jQuery('.myEl').find('a.active').text();
        jQuery('title').text(title);
    });
</script>

但是，当我使用Google Structured data testing tool测试这些页面时，标题与“（页面X）”语法保持不变。就好像Google正在解析原始html源而不是计算源。

这可以确认吗？

Answer 1

虽然一些爬虫能够运行JS并访问渲染的页面，但大多数爬虫都没有。因此，他们都将原始HTML的信息作为基础，并使用呈现的页面（如果可用）来检测黑帽SEO策略（隐藏的关键字填充，链接更改，js重定向等）。

如果您希望Google（和其他搜索引擎）获取改进的标题，则必须在HTML中发送，而不是在页面加载后修改它。

谷歌抓取/索引“计算”或原始html源？

1 个答案: