Haskell通过浏览器获取URL

时间:2012-07-05 22:19:46

标签: haskell screen-scraping web-scraping

我想在Haskell中进行一些屏幕抓取(来自Netflix),但该网站需要cookie登录状态,因此大多数示例使用浏览器自动化来要求登录浏览器进行实际的URL提取,然后从那段文字中删除。

我想要的一个很好的例子(在Ruby中)是:https://gist.github.com/1425290

有没有简单的方法可以从Haskell中完成等效的工作?

1 个答案:

答案 0 :(得分:3)

我清楚地知道HTTP包的Network.Browser支持Cookie,curl也是如此。据推测,http-conduitNetwork.HTTP.Conduit.Browser之所以如此命名,是因为它也支持cookie,尽管我对此并不是100%有信心。