刮价格>制表>提醒我

时间:2017-02-04 06:41:34

标签: python automation

我之前在大学学习Java有一个为期3个月的短期课程(唯一的项目是编写数独游戏)。

我想学习一种最常用于一般自动化任务的编程语言。到目前为止,我已经选择了AHK,它帮助我提供了大量的文本扩展/应用程序快捷方式等等。

希望进一步推进并完成以下工作,例如:

1访问此网站:https://carousell.com/search/products/?query=12-35mm

2抓取所有包含“Panasonic”,“12-35mm”的数据 (这些结果的每一页都难以刮掉吗?)

3价格列的价格。如果价格具有误导性(例如$ 1或以下$ X 4值),请在商品描述中搜索价格值(“$”)。

4 Tabluate导致Excel

5将最新结果与平均价格进行比较。

6如果最新价格低于平均价格>通过电子邮件提醒我。

我的大多数自动化项目都是这样的。什么是最好的编程语言,哪些付费教程可以指导我做到这一点?

我已将其缩小为Import.IO和Python;但我可能错了。

这个课程看起来很有用,但我不确定它是否会教会我完成这个个人项目所需的一切。

https://www.udemy.com/automate/

请指教,谢谢!

1 个答案:

答案 0 :(得分:1)

Python非常适合这些类型的网页抓取和处理。您的工作需要几个模块:

通过HTTP(S)获取页面:由于您要抓取的页面不使用Javascript输出您需要的信息,我建议好的requests就够了。

解析HTML并提取信息:这里有很多选择,我个人最喜欢的是BeautifulSoup。如果你想深入挖掘,有一个question about this

将结果保存到Excel中:有几个模块可以再次完成工作,我最喜欢的是openpyxl。如果您不需要保存非常大的文件,这应该没问题。

价格比较:您可以将价格与您的脚本进行比较,将Excel工作表作为"数据库"。

通过电子邮件发送:您可以使用Python standard library发送电子邮件。这是一个fine tutorial怎么做..

没有尝试编写脚本,如果您需要提示任何特定阶段,请返回特定代码,该代码不适用于该特定部分,然后我们可以帮助您。