可以从网站中提取内容的程序

时间:2017-08-10 03:23:16

标签: extractor

如果这是一个不合适的地方,我很抱歉。如果没有,请删除此。

我正在寻找可以帮助我完成一个非常简单的程序的人:

登录网站上的帐户并从每个帐户中提取一个号码,并在txt文件中保存详细信息(帐号 - 必须保存的号码)。

我的工作需要这个。这个程序将为我节省时间。这就是目的。

如果有人可以帮助我,请告诉我。非常感谢你。

1 个答案:

答案 0 :(得分:0)

幸运的是,有足够的工具可用。

我将为您提供有关Python生态系统中相关工具的一些见解,因为这是我最熟悉的,也是初学者使用的简单语言。

如果您正在提取/抓取的内容相对简单且不需要与网站元素进行复杂的UI交互,我建议requests个会话保留Cookie和其他信息以用于一系列经过身份验证的请求,以及bs4解析文档树以提取您感兴趣的数据。

对于更复杂的交互,您需要关注浏览器自动化以及可能更高级的抓取框架。希望我已经为你提供了足够的关键词,以便在谷歌中走得更远。

当然,如果您想编写这样的脚本,您首先需要学习编程的基础知识以及Web数据的结构。这留给你学习和吸收。