Mechanize,python:从站点读取特定行以减少长页面的读取时间(。)

时间:2014-12-22 14:13:51

标签: python mechanize readline

我正在使用mechanize for python来读取信息。

我没有像下面所示阅读整个网站,而是想从网站访问特定的一行(例如第439行)。

site = br.open('www.example.com').read()

我对.read()的问题是,有些网站太长,而且这个过程需要大量的时间来阅读。如果有办法缩短阅读时间,请告诉我。

提前致谢。

1 个答案:

答案 0 :(得分:0)

通常的方法不是"面向行的",而是"标签/面向元素"。

将机械化response()提供给 HTML Parser ,例如BeautifulSouplocate the tag

from bs4 import BeautifulSoup

soup = BeautifulSoup(br.response())
print soup.find('my_tag', class_='my_class')