使用XPath从HTML中提取信息

时间:2015-11-07 23:27:09

标签: html xpath

我有一段html,我是从我正在处理的网页的来源中提取的:

<span itemprop="homeLocation" itemscope itemtype="http://schema.org/Place"><meta itemprop="name" content="Kansas"/>

...我想使用Xpath从中提取位置Kansas

使用enter image description here,我一直在测试这个,但无济于事。

我试过

//*[@itemprop="homeLocation"]/meta[@itemprop="name"]/@content

和类似的尝试,但似乎无法得到匹配。我不明白我做错了什么。

任何建议都将不胜感激。

1 个答案:

答案 0 :(得分:1)

您的xPath绝对有效。 问题出在xml上。

  1. 关闭span代码。
  2. itemscope属性设置一些值。
  3. 最重要的。您尝试使用的xPath检查器似乎有一些错误。检查一下:http://www.freeformatter.com/xpath-tester.html#ad-output

    我用过的Xml:

        <span 
          itemprop="homeLocation"
          itemscope=""
          itemtype="http://schema.org/Place">
                 <meta itemprop="name" content="Kansas"/>
      </span>
    

    结果:

    Attribute='content="Kansas"'