Xpath - 节点具有不同数量的值

时间:2016-05-13 14:03:54

标签: xml r xpath

这是结构:

<div>
<ul>
  <li>"asdffa"</li>
  <li><a href = "www.abc.com"> text </a> 
"asdfasdfasdfagh" 
<a href = "www.xyz.com"> asdf </a>
"uidhfbnkaer" </li>
<li>"oijh" <a href = "www.123.com"> jcb </a>
"sdfhwebwyh cxvyjbwer" </li>

我是XPath的新手,有两个任务:

  1. 抓取某组节点下的所有文字。我用/div//ul//li做了这个,所以没问题。
  2. 我需要获取每个<li>中的href网址 - 问题是某些<li>没有链接,其他人有1-2。我可以抓住div//ul//li//a//@href的所有链接,但后来我不知道他们来自哪个<li>。(我认为)。
  3. 有谁知道我怎么能让XPath返回每个<li>文本的相对位置,然后返回它们所处的相对位置的链接?最后,我想在R中的数据框中将它们绑定在一起。我不需要在li内知道哪个文本属于哪个链接,我只想连接所有链接。

    E.g。

    1. asdffa
    2. asdfasdfasdfagh uidhfbnkaer www.abc.com,www.xyz.com
    3. oijh jcb sdfhwebwyh cxvyjbwer www.123.com

0 个答案:

没有答案