与ajax一起使用的web scrapper / crawler

时间:2015-11-05 15:54:24

标签: ajax go

我需要抓取一个网站并从中获取所有链接,问题是 - 这个网站使用ajax,而Go的标准http.Get(..)将返回如下内容:

 <body>
    //javascript here       
     <div class="content"></div>
    //javascript here
 </body>
Div是空的。 golang有解决方案吗?

2 个答案:

答案 0 :(得分:0)

http.Get(Url)只是获取了Url的响应。 resp.Content就像:

<body>
//javascript here       
 <div class="content"></div>
//javascript here
</body>

如果你想获得div中的内容,你需要分析javascript并知道ajax如何获取数据。然后你可以模拟你想要的过程。

答案 1 :(得分:0)

您必须使用其中一个无头网络浏览器。 没有检查我说其余三个浏览器引擎(Webkit / Firefox,IE)没有Go绑定。

切换到python和javascript。