如何通过curl返回html5页面?

时间:2015-02-06 10:32:09

标签: html5 curl phantomjs

我尝试使用curl检索html页面。 登录网站后,使用以下命令:

curl -o out.html -L -b cco.txt -c cco.txt -d "site=it&redirect_url=aHR0cDovL2l0LmFkdmZuLmNvbS9wLnBocD9waWQ9bW9u&login_username=NAME&login_password=PWWW&login_submit=Accedi" https://secure.advfn.com/login/secure

我得到一个代码为html5的网页,但没有处理过的数据。

如何获取数据,如浏览器快照? 没有图像(jpg,png ...),而是文本文件。

1 个答案:

答案 0 :(得分:1)

我找到了问题的答案。简单地说,卷曲是错误的。 我使用PhantomJS下面的简单代码:

var page = require('webpage').create(),
  server = 'https://secure.advfn.com/login/secure',
  data = 'site=it&redirect_url=aHR0cDovL2l0LmFkdmZuLmNvbS9wLnBocD9waWQ9bW9u&login_username=bl&login_password=PPPPPPP&login_submit=Accedi';


page.open(server, 'post', data, function (status) {
  if (status !== 'success') {
    console.log('Unable to post!');
  } else {
    console.log(page.content);
  }
  page.render('example.png');  //optional
  phantom.exit();
});

然后,它可以在控制台上运行它:

bl@edesktop $ phantomjs --debug=true --ssl-protocol=any --cookies-file=cook.txt script.js > page

同时获取所需数据的渲染页面和文本文件,读取解析。