这是结构:
<div>
<ul>
<li>"asdffa"</li>
<li><a href = "www.abc.com"> text </a>
"asdfasdfasdfagh"
<a href = "www.xyz.com"> asdf </a>
"uidhfbnkaer" </li>
<li>"oijh" <a href = "www.123.com"> jcb </a>
"sdfhwebwyh cxvyjbwer" </li>
我是XPath的新手,有两个任务:
/div//ul//li
做了这个,所以没问题。<li>
中的href网址 - 问题是某些<li>
没有链接,其他人有1-2。我可以抓住div//ul//li//a//@href
的所有链接,但后来我不知道他们来自哪个<li>
。(我认为)。有谁知道我怎么能让XPath返回每个<li>
文本的相对位置,然后返回它们所处的相对位置的链接?最后,我想在R中的数据框中将它们绑定在一起。我不需要在li
内知道哪个文本属于哪个链接,我只想连接所有链接。
E.g。