我正在尝试从http://www.raws.dri.edu/cgi-bin/rawLIST.pl?idIAN1+id中提取链接 此站点包含未排序的列表,我想获取每日摘要的链接。
到目前为止,我已尝试使用"//ul/li/a"
方法使用.SelectNodes()
的xpath字符串。这样做只返回列表中的第一个项目,这是我想要的,但最终将来我可能希望获得指向不同页面的链接,以便能够指定要检索的链接是我需要的。
答案 0 :(得分:1)
如果您使用//ul/li/a
,则应该所有 <a>
个链接,而不是一个。
如果要提取包含某些文字的链接(例如Time Series Graph
),您可以执行以下操作:
//ul/li/a[contains(text(), 'Time Series Graph')]
类似,如果您要在href
属性中查找某些特定文字:
//ul/li/a[contains(@href, 'Time Series Graph')]
顺便说一下,我看到you have asked many questions指向同一个网站,等等。我的建议是:学习一点XPath,基础知识,并阅读有关HtmlAgilityPack如何工作的教程(一旦理解就很简单) XPath的基础知识),然后开始研究该刮刀。