谷歌抓取:现在解析JavaScript结果?

时间:2011-03-26 05:51:40

标签: javascript

我有一个HTML5网站,只显示我的名片。此“名片”上的文字通过JavaScript填写。

我的名片页面的HTML标记如下所示:

<body>
    <div id="card">
        <name />
        <title />
        <email />
        <phone />
    </div>
</body>

当DOM准备就绪时,这些<name><title>等元素将使用JavaScript替换为实际文本。

这一点实际上是为了防止搜索引擎缓存并索引我的私人联系信息。

目前该页面没有元描述标签。

当我将卡片页面的网址输入Google时,结果列表会显示我的姓名,职位,电子邮件等。

唯一可行的方法是,Google用来索引我的网页的蜘蛛加载JavaScript,然后然后会拍摄文档的快照。

我认为Google的抓取工具不会解析JavaScript。

我可以做些什么来将这些私人信息放在网上,而不是由谷歌公开索引?

1 个答案:

答案 0 :(得分:0)

如果您不希望Google和任何其他网络抓取工具无法为您的网页编制索引,则应使用robots.txt

我的猜测是,Google下载您的网页(用于缓存目的),然后将其编入索引。到那时,页面中的javascript会填写您的详细信息。 (这可能是非常错误的:D)

现在,Google实际上已将其编入索引,您可以request it to be deleted