标签: python python-3.x html-parsing spyder
使用Python3,我希望从超过4000个网页的源代码中收集特定数据,并将其导出为csv格式文件。
目前正在使用:urllib.request.urlopen(url).read().decode("utf-8")以及.split()函数以及DataFrame。
urllib.request.urlopen(url).read().decode("utf-8")
.split()
使用Python实现此目的的其他好/更好的方法是什么? 我目前估计完成的时间大约是60个小时,只运行单个内核。