我正在使用mechanize for python来读取信息。
我没有像下面所示阅读整个网站,而是想从网站访问特定的一行(例如第439行)。
site = br.open('www.example.com').read()
我对.read()的问题是,有些网站太长,而且这个过程需要大量的时间来阅读。如果有办法缩短阅读时间,请告诉我。
提前致谢。
答案 0 :(得分:0)
通常的方法不是"面向行的",而是"标签/面向元素"。
将机械化response()
提供给 HTML Parser ,例如BeautifulSoup
和locate the tag:
from bs4 import BeautifulSoup
soup = BeautifulSoup(br.response())
print soup.find('my_tag', class_='my_class')