内存错误使用漂亮的汤来解析~100mb html文件与python

时间:2018-06-15 00:37:25

标签: python beautifulsoup

我在运行以下代码时出现内存错误:

from bs4 import BeautifulSoup
with open(r'C:\user\table.html', 'r') as f:
    soup = BeautifulSoup(f, 'html.parser')
    found = soup.find("td", text = "A")
    print(found)
f.closed

此代码适用于小型html文件。但是,当我用~100mb html表运行它时,它会慢慢耗尽内存直到程序崩溃。任务管理器显示python.exe在程序崩溃时占用2GB的内存。我已经尝试查看了beautifulsoup文档,但我无法弄清楚为什么这个程序占用的内存比我的html文件大20倍。

0 个答案:

没有答案