假设我想访问一个受密码保护的网站,从中抓取一些信息并将其放入电子表格中。例如,它可能是我的个人信用卡帐户页面,我将抓取有关最新交易的信息。
如果网站允许将交易信息下载为CSV文件,则可能会出现这种情况的变体,在这种情况下,我希望下载该文件。
如果我想在Python中编写这样的刮刀,我应该使用哪些包来完成任务?是否取决于特定网站的实施方式,即我可能需要一个工具来刮取一个网站,另一个工具来刮另一个网站。
谢谢
答案 0 :(得分:1)
我实际上做了一些非常类似的事情,但在节点中。你真的想用Python做这个吗?
如果您想坚持使用Python,请查看以下模块:
有人写了一个非常棒的模块,结合了以上两个模块:
如果您想沿着节点路线冒险,请看一下: