我想从网站上获取内容,但是当我使用file_get_contents()函数时,我得到了HTML代码,但是其中一些丢失了,我检查了网站代码,我知道Ajax会生成一些部分,我不知道我知道怎么弄它们,有人有什么建议吗? 我可能会得到一些例子, 网站:http://www.drbattery.com/category/notebook+battery/acer/aspire+series.aspx?p=3 要求:我想获得在此页面上列出的那些笔记本电脑型号,例如“Aspire 1690”等。我需要所有这些型号。
答案 0 :(得分:0)
MHM。
在JS中,您可以通过
访问浏览器中的HTML内容document.getElementsByTagName('body')[0].innerHTML
做这个服务器端,你可能需要一个无头浏览器。
当内容完成加载并且一切就绪后,棘手的部分就是检测。 (您无法通过"window.onload"
跟踪AJAX请求。)
手动执行,您可以在浏览器中添加书签,例如
javascript:alert(document.getElementsByTagName('body')[0].innerHTML)
然后,您可以通过键盘快捷键(CTRL + A或Command + A)选择警报的内容,复制并点击返回(因为对话框的关闭按钮可能不在视线范围内)。