如何使用lxml库获取页面语言(xml:lang =“”)?

时间:2013-07-27 08:49:39

标签: python python-2.7 lxml

我对lxml库很新,发现解析除了链接之外的所有东西都很困惑。

我阅读了这些文档,但我很难从xml:lang=".."标记中获取<html ..>属性的值。

我如何阅读该值?

示例:<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en">

1 个答案:

答案 0 :(得分:1)

>>> import lxml.html
>>> s = '''<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en"></html>'''
>>> root = lxml.html.fromstring(s)
>>> root.get('xml:lang')
'en-GB'