如何在python中停止lxml记录错误

时间:2015-06-01 18:01:56

标签: python lxml

我无法阻止python中的错误。无论我做什么,它总是显示这个错误:

validity error : ID some_id already defined

我正在使用Python 3.4.3和Lxml 3.4.4

1 个答案:

答案 0 :(得分:0)

我解决了,从lxml调用函数清理器时出错

doc = clean.Cleaner(
            scripts=True,
            javascript=True,
            comments=True,
            embedded=False,
            meta=True,
            page_structure=False,
            links=True,
            style=True,
            forms=True,
            safe_attrs_only=False,
            remove_unknown_tags=False
         ).clean_html(doc)

解决方案:

c = clean.Cleaner(
            scripts=True,
            javascript=True,
            comments=True,
            embedded=False,
            meta=True,
            page_structure=False,
            links=True,
            style=True,
            forms=True,
            safe_attrs_only=False,
            remove_unknown_tags=False
        )
        doc = c.clean_html(doc)