标签: html python-3.x boilerpipe
我需要一个通用工具,从HTML文档中提取内容。对于python2,通常建议使用套管。
python3有没有类似的替代方案?
答案 0 :(得分:0)
python 3的Boilerpipe
pip install boilerpipe-py3
答案 1 :(得分:0)
您可以尝试jusText
pip install justext
以下是一些替代方案: