我有一个xml文件,其中包含指向多个内部html页面的链接。我正在使用HTML DOM来获取这些链接并在表格中显示链接。这些链接是简单的html链接,没有参数。这些html页面驻留在服务器中。
我的问题是,当我在网站管理员工具中使用Google抓取谷歌时。谷歌正在获取javascript但不是填充的表。谷歌会抓取并索引这些链接吗?我想确保这里链接的这些页面将被编入索引......请指导我完成此问题。另请告诉我是否有更好的方法来显示xml中的内容,以便Google抓取这些链接。
<script>
if (window.XMLHttpRequest)
{// code for IE7+, Firefox, Chrome, Opera, Safari
xmlhttp=new XMLHttpRequest();
}
else
{// code for IE6, IE5
xmlhttp=new ActiveXObject("Microsoft.XMLHTTP");
}
xmlhttp.open("GET","/jobs/jobs.xml",false);
xmlhttp.send();
xmlDoc=xmlhttp.responseXML;
document.write('<table id="example">');
document.write('<thead><tr><th>Job ID</th><th>Job Title</th><th class=\"mobexcl\">Location</th><th class=\"mobexcl\">Country</th><th class=\"mobexcl\">Date Posted</th><th>Status</th><th class=\"mobexcl\">View</th></tr></thead><tbody>');
var x=xmlDoc.getElementsByTagName("CD");
for (i=0;i<x.length;i++)
{
if(i%2==0){
document.write('<tr class="alt">');
}
else{
document.write('<tr class="alt1">');
}
document.write("<td>");
document.write('<a href="' + x[i].getElementsByTagName("VIEW")[0].childNodes[0].nodeValue + '">'+x[i].getElementsByTagName("JOBID")[0].childNodes[0].nodeValue+'</a>');
document.write("</td><td>");
document.write(x[i].getElementsByTagName("TITLE")[0].childNodes[0].nodeValue);
document.write("</td><td class=\"mobexcl\">");
document.write(x[i].getElementsByTagName("LOCATION")[0].childNodes[0].nodeValue);
document.write("</td><td class=\"mobexcl\">");
document.write(x[i].getElementsByTagName("COUNTRY")[0].childNodes[0].nodeValue);
document.write("</td><td class=\"mobexcl\">");
document.write(x[i].getElementsByTagName("DATE")[0].childNodes[0].nodeValue);
document.write("</td><td>");
document.write(x[i].getElementsByTagName("STATUS")[0].childNodes[0].nodeValue);
document.write("</td><td class=\"mobexcl\">");
document.write('<a href="' + x[i].getElementsByTagName("VIEW")[0].childNodes[0].nodeValue + '">View/Apply</a>');
document.write("</td></tr>");
}
document.write("</tbody></table>");
</script>
答案 0 :(得分:0)
Crawlers不会在您的网页上执行脚本。
Google已经设计了一种抓取ajax填充网站的方法。你可以阅读它here。
列表中的第三项似乎适用于您的案例。
基本上,您的服务器需要创建ajax呈现页面的HTML快照,以供google bot抓取。
Google还提供了测试此设置的工具。
HTH。