我在两台Windows 10计算机(64位操作系统)上安装了一个python 2.7.11(32位)。最近,在这两台机器上,应用程序引发了#34; python.exe已停止工作"使用bs4
和lxml
运行网络抓取工具时出现错误对话框。错误将在一两分钟正确运行(成功解析一堆网页)后发生。
为了隔离问题,我在一个只安装了所需模块的虚拟环境中运行它。同样的问题。
Windows事件日志在两台计算机上引用etree.pyd
:
Faulting application name: python.exe, version: 0.0.0.0, time stamp: 0x56634a05
Faulting module name: etree.pyd, version: 0.0.0.0, time stamp: 0x56f0edd1
Exception code: 0xc0000005
Fault offset: 0x000fa43b
Faulting process id: 0x2e78
Faulting application start time: 0x01d1ce087cff81b9
Faulting application path: C:\Projects\VENVS\hhs_v5_venv\Scripts\python.exe
Faulting module path: C:\Projects\VENVS\hhs_v5_venv\lib\site-packages\lxml\etree.pyd
Report Id: f8a4345e-1d59-44d7-be66-f0ff04abbe2e
Faulting package full name:
Faulting package-relative application ID:
我在Windows 10中lxml
或etree.pyd
崩溃python时找不到最近的任何内容。其他有类似问题的人?
更新:我没有弄清楚lxml
导致问题的原因,但我确实切换了解析器,现在脚本运行完美:
旧:
html_node = BeautifulSoup(html_to_parse, "lxml")
新:
html_node = BeautifulSoup(html_to_parse, "html.parser")