使用HTMLAgilitypack </ul>从具有特定文本文本的<ul>中提取值

时间:2014-03-18 19:54:17

标签: html parsing xpath html-agility-pack

我正在尝试从http://www.raws.dri.edu/cgi-bin/rawLIST.pl?idIAN1+id中提取链接 此站点包含未排序的列表,我想获取每日摘要的链接。

到目前为止,我已尝试使用"//ul/li/a"方法使用.SelectNodes()的xpath字符串。这样做只返回列表中的第一个项目,这是我想要的,但最终将来我可能希望获得指向不同页面的链接,以便能够指定要检索的链接是我需要的。

1 个答案:

答案 0 :(得分:1)

如果您使用//ul/li/a,则应该所有 <a>个链接,而不是一个。

如果要提取包含某些文字的链接(例如Time Series Graph),您可以执行以下操作:

//ul/li/a[contains(text(), 'Time Series Graph')]

类似,如果您要在href属性中查找某些特定文字:

//ul/li/a[contains(@href, 'Time Series Graph')]

顺便说一下,我看到you have asked many questions指向同一个网站,等等。我的建议是:学习一点XPath,基础知识,并阅读有关HtmlAgilityPack如何工作的教程(一旦理解就很简单) XPath的基础知识),然后开始研究该刮刀。