我对lxml库很新,发现解析除了链接之外的所有东西都很困惑。
我阅读了这些文档,但我很难从xml:lang=".."
标记中获取<html ..>
属性的值。
我如何阅读该值?
示例:<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en">
答案 0 :(得分:1)
>>> import lxml.html
>>> s = '''<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en"></html>'''
>>> root = lxml.html.fromstring(s)
>>> root.get('xml:lang')
'en-GB'