我有这段代码
request.get('http://www.google.co.uk/?gws_rd=cr&ei=CgY4WPCVCczXUYyElegN#q=house+definition', function(error, response, body) {
body.indexOf('a building'));
我正在使用请求来下载网页的html。据我所知,页面非常大,可能是45000个字符。我正在身体上做一个indexOf,我知道有一个参数,但它无法找到它。我使用Visual Studio Code打开了一个调试器会话,当我在文本末尾记录我的body变量时,我说这个 e ...(长度:15000)
看起来我看不到信息的其余部分,而且我猜它太大了。我尝试过文档,但我不完全理解为什么我看不到这些数据。 有谁知道我做错了什么?
答案 0 :(得分:1)
正如我在评论中所说,您没有收到所需的HTML,因为Google正在使用javascript向您展示您在浏览器上看到的内容。尝试禁用javascript并输入该网址,您会看到。
实现目标的最简单方法是更改网址。试试这个:
request.get('https://www.google.co.uk/search?q=house+definition', function(error, response, body) {
console.log(body.indexOf('a building'))
})