Question

我正在尝试从http://www.raws.dri.edu/cgi-bin/rawLIST.pl?idIAN1+id中提取链接此站点包含未排序的列表，我想获取每日摘要的链接。

到目前为止，我已尝试使用"//ul/li/a"方法使用.SelectNodes()的xpath字符串。这样做只返回列表中的第一个项目，这是我想要的，但最终将来我可能希望获得指向不同页面的链接，以便能够指定要检索的链接是我需要的。

Answer 1

如果您使用//ul/li/a，则应该所有 <a>个链接，而不是一个。

如果要提取包含某些文字的链接（例如Time Series Graph），您可以执行以下操作：

//ul/li/a[contains(text(), 'Time Series Graph')]

类似，如果您要在href属性中查找某些特定文字：

//ul/li/a[contains(@href, 'Time Series Graph')]

顺便说一下，我看到you have asked many questions指向同一个网站，等等。我的建议是：学习一点XPath，基础知识，并阅读有关HtmlAgilityPack如何工作的教程（一旦理解就很简单） XPath的基础知识），然后开始研究该刮刀。