JS,PHP动态内容和Google Crawlers

时间:2012-11-07 14:59:24

标签: php javascript google-analytics domdocument

我有一系列大约25个我创建的静态网站,它们共享相同的信息,并且不得不在这里和那里更改复制的副本,所以我写了这个javascript所以所有网站从一个位置拉出内容。 (缩写为一个例子)

var dataLoc = "<?=$resourceLocation?>";
$("#listOne").load(dataLoc+"resources.html #listTypes");

当页面加载时,它会找到div id listOne,然后用文件resources.html中div的内容替换它,并且只有div标记为listTypes的内容。

我的问题:谷歌根本没有抓取这个动态内容,我被告知谷歌会抓取动态导入的信息,所以我很想知道的是我目前正在做的事情需要是什么改进吗

我认为js刚刚被谷歌蜘蛛跳过,所以我使用PHP访问之前使用的相同HTML文件,它稍微有点工作,但它不能正常工作我需要它。这将返回文本,但我也需要标记,<li>, <p><img>标记,依此类推。也许我可以调整这个? (我不是开发人员所以我刚刚在PHP在线帮助中尝试了几十件事情,这和我一样接近)

function parseContents($divID)
    {


    $page = file_get_contents('content/resources.html');
    $doc = new DOMDocument();

    @$doc->loadHTML($page);
    $divs = $doc->getElementsByTagName('div');

    foreach($divs as $div) 
        {
        if ($div->getAttribute('id') === $divID) 
            {
            echo $div->nodeValue;
            }
        }


    }

parseContents('listOfStuff');

感谢您帮助我更好地理解这一点,请告诉我是否需要更好地解释它:)

1 个答案:

答案 0 :(得分:1)

请参阅Google发布的Making AJAX Applications Crawlable