卷曲检索页面没有阴影dom

时间:2016-07-27 20:32:26

标签: curl shadow-dom

我创建了一个使用curl登录页面然后检索页面的脚本。它部分工作:它不显示整个页面。该页面包含一些带有阴影dom内容的iframe。我如何计算页面的这些部分?有没有办法检索这个隐藏的代码? 这是我运行的命令:

curl "https://example.com/portal/default.aspx" -H "Cookie: ASP.NET_SessionId=xxxxxxxxxxxxxxxxxxxxxxxx; DefaultPage=login.aspx" -H "Origin: https://example.com" -H "Accept-Encoding: gzip, deflate, br" -H "Accept-Language: en-EN,en;q=0.8,en-US;q=0.6,en;q=0.4,pt;q=0.2" -H "Upgrade-Insecure-Requests: 1" -H "User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36" -H "Content-Type: application/x-www-form-urlencoded" -H "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8" -H "Cache-Control: max-age=0" -H "Referer: https://example.com/portal/login.aspx" -H "Connection: keep-alive" --data "IdLogin=user&IdPwd=&IdPwdCript=[2!>]h88RA/-VMen30:V]&ReturnTo=https://example.com/portal/" -o result.txt

提前致谢!

1 个答案:

答案 0 :(得分:1)

iframe由浏览器呈现,而cURL根本没有渲染引擎。

尝试SeleniumPhantomJS。我认为您希望编写与网站的交互脚本,因此您可以找到适用于多种语言的这些工具的包装。

对于PHP,您可以尝试Mink。它有Selenium或PhantomJS的驱动程序。