嗨,我是一个Python noob,甚至更大的BeautifulSoup和html noob。我有一个下载的文件,里面有一个html表。在我看过的所有BeautifulSoup解析的例子中,他们都使用urllib访问表url,然后读取响应并将其传递给BeautifulSoup进行解析。我的问题是,对于本地存储的文件,我是否必须将整个文件加载到内存中?所以不要说:
contenturl = "http://www.bank.gov.ua/control/en/curmetal/detail/currency?period=daily"
soup = BeautifulSoup(urllib2.urlopen(contenturl).read())
我是否这样做:
soup = BeautifulSoup(open('/home/dir/filename').read())
这似乎并不合适。所以我收到以下错误:
Traceback (most recent call last):
File "<string>", line 1, in <fragment>
TypeError: 'module' object is not callable
我很抱歉,如果它真的很傻我正在做,但感谢帮助
更新:问题已解决,需要从BeautifulSoup的模块导入类。谢谢!