我必须获取某个网站的网址,但不存在典型的<a href="">
链接。
我已经发现使用phantomJS来抓取一些JS内容和ajax结果等。
但在抓取此页面时,我无法找到如何获取指向某个页面的链接列表...
以下是内容的结构:
我已经尝试用php的file_get_content()和正常的phantomJS()请求来捕获它,但没有任何帮助我:(
你可以给我一个暗示吗?答案 0 :(得分:1)
首先查看JS重定向的内联标记。如果失败了,请在标题中查找标记内的任何内容,如下所示:
<script async="" src="https://SOME-URL"></script>
如果将这些URL复制到浏览器中,则可以获得JS文件的纯文本。然后,您也可以搜索它们的JavaScript重定向行为。