挖掘pentaho数据集成

时间:2015-02-15 10:23:41

标签: web-scraping httpclient pentaho kettle

我想从登录身份验证后的页面中删除数据,我正在使用http客户端,但即使在我从我想要的数据传递页面的URL后,也只能从第一页获取HTML ,很明显,我无法提供用于身份验证的用户名和密码,它最终只能登录到登录页面,所以有人可以解释我如何以及在哪里可以传递我的登录详细信息,我将获得HTML的我要废弃数据的页面。

0 个答案:

没有答案