我用这个打了一堵墙,请有人帮帮我吗?
从下面的网址我想看到
的内部文字<a href="/borsa/azioni/scheda.html?isin=IT0001233417&lang=en">A2A</a>
我使用的XPath
语法不会返回任何数据:
.//table[@class='table_dati']//tbody[@class='constituents']//tr//td[@class='name']//a
网址是 http://www.borsaitaliana.it/borsa/azioni/ftse-mib/lista.html?lang=en&page=1
提前致谢,
捐赠
答案 0 :(得分:2)
//tbody[@class='constituents']//td[@class='name']/a
怎么样?实际上,这应该可以很好地工作。
答案 1 :(得分:2)
您的XPath以.
开头,因此它与上下文节点相关。但是你没有告诉我们任何有关背景的信息。也许你想省略最初的.
并使其成为“绝对的”:
//table[@class='table_dati']/tbody[@class='constituents']/tr/td[@class='name']/a
我还会将//
更改为/
,无论您在哪里寻找直接的孩子(一般不是后代)关系。
答案 2 :(得分:0)
根据我的经验,HTMLAgilityPack与tbody标签不相称。我只是用tr td跟进表格,找到合适的单元格,完全跳过tbody。