我正在尝试使用import.io来抓取此网站:ScoreCard
我能够成功获得击球得分,但我想在最后插入额外的栏目,这可以告诉我有关局的情况。所以它应该与击球手的名字有关。
我尝试使用XPATH://*[@id="innings_1"]/div[1]/div/h4/b
但由于ID为"innings_1"
,因此将始终返回First Inning。
其他ID是innings_2/3/4
等。在XPATH中我有什么方法可以获得相对于Batsman列的这个元素吗?
答案 0 :(得分:5)
以下是我为了获得理想结果所做的工作:
我使用了以下XPATH值。 .//一个/祖先:: DIV / DIV [1] / DIV / H4 / B
.// a给了我Batsmen的名字。我搜索了它的祖先和路径div [1] / div / h4 / b仅被Innings部分使用..所以它做了诀窍:))
答案 1 :(得分:1)
尝试使用starts-with():
//*[starts-with(@id,'innings_')/div/div/h4/b