(使用Python)如何将网页上的文本保存到Excel文件中?

时间:2013-05-31 11:01:22

标签: python excel webpage

每天我都需要打开一个网页,复制页面上的文字并将其粘贴到Excel文件中。有没有办法可以使用Python自动执行此过程,而无需打开Web浏览器?

感谢提供答案的朋友们。能告诉我一个例子吗?

感谢。

5 个答案:

答案 0 :(得分:1)

当然,只需使用urllib2打开您的网页,然后使用BeautifulSoup查看内容,然后使用xlwt将这些数据粘贴到Excel文件中。简单!

答案 1 :(得分:1)

您可以使用一种称为网络抓取的技术;甚至还有一个用python编写的开源框架,称为scrapy,专门用于爬行和屏幕抓取。

只需使用搜索词组进行谷歌搜索; “使用python进行网络抓取”这应该足以让你开始上路了。

以下帖子中有一些很好的信息; Anyone know of a good Python based web crawler that I could use?

答案 2 :(得分:1)

是的,你可以这样做。

我建议:

祝你好运

答案 3 :(得分:1)

您可以在excel本身中进行相同的操作(从Web导入数据到Excel)。从Excel功能区中选择“数据”> '来自网络。如果你一直在使用python试试https://datanitro.com/。 Datanitro是一个出色的python-excel集成。这是一个演示http://scriptogr.am/richie/post/python-for-excel-using-datanitro

答案 4 :(得分:0)

是的,有。您需要使用urllib2从Web中提取HTML,然后您需要解析HTML所需的值(模块BeautifulSoup和regex),最后将结果保存为CSV文件,可以在Excel中打开