应用错误收集

Haskell通过浏览器获取URL

时间：2012-07-05 22:19:46

标签： haskell screen-scraping web-scraping

我想在Haskell中进行一些屏幕抓取（来自Netflix），但该网站需要cookie登录状态，因此大多数示例使用浏览器自动化来要求登录浏览器进行实际的URL提取，然后从那段文字中删除。

我想要的一个很好的例子（在Ruby中）是：https://gist.github.com/1425290

有没有简单的方法可以从Haskell中完成等效的工作？

1 个答案:

答案 0 :(得分：3)

我清楚地知道HTTP包的Network.Browser支持Cookie，curl也是如此。据推测，http-conduit的Network.HTTP.Conduit.Browser之所以如此命名，是因为它也支持cookie，尽管我对此并不是100％有信心。