我无法阻止python中的错误。无论我做什么,它总是显示这个错误:
validity error : ID some_id already defined
我正在使用Python 3.4.3和Lxml 3.4.4
答案 0 :(得分:0)
我解决了,从lxml调用函数清理器时出错
doc = clean.Cleaner(
scripts=True,
javascript=True,
comments=True,
embedded=False,
meta=True,
page_structure=False,
links=True,
style=True,
forms=True,
safe_attrs_only=False,
remove_unknown_tags=False
).clean_html(doc)
解决方案:
c = clean.Cleaner(
scripts=True,
javascript=True,
comments=True,
embedded=False,
meta=True,
page_structure=False,
links=True,
style=True,
forms=True,
safe_attrs_only=False,
remove_unknown_tags=False
)
doc = c.clean_html(doc)