Question

嗨，我是一个Python noob，甚至更大的BeautifulSoup和html noob。我有一个下载的文件，里面有一个html表。在我看过的所有BeautifulSoup解析的例子中，他们都使用urllib访问表url，然后读取响应并将其传递给BeautifulSoup进行解析。我的问题是，对于本地存储的文件，我是否必须将整个文件加载到内存中？所以不要说：

    contenturl = "http://www.bank.gov.ua/control/en/curmetal/detail/currency?period=daily"
    soup = BeautifulSoup(urllib2.urlopen(contenturl).read())

我是否这样做：

    soup = BeautifulSoup(open('/home/dir/filename').read())

这似乎并不合适。所以我收到以下错误：

    Traceback (most recent call last):
    File "<string>", line 1, in <fragment>
    TypeError: 'module' object is not callable

我很抱歉，如果它真的很傻我正在做，但感谢帮助

更新：问题已解决，需要从BeautifulSoup的模块导入类。谢谢！

使用BeautifulSoup将文件中的HTML表解析为csv

0 个答案: