我是XPath的新手,想要了解访问各种HTML组件时的细节。
我目前正在使用此xpath
//*[@id=\"resultsDiv\"]/p[1]/a
访问下面的HTML(缩写):
<p style="margin:0;border-width:0px;"><a href="./t_Person.aspx?PersonID=140476">Bill%20Jones</a></p>
XPath返回:<a href="./t_Person.aspx?PersonID=140476">Bill%20Jones</a>
但我想要的只是PersonID = 140476.
问题:是否可以编写导致140476
的XPath,或者我是否需要获取返回的内容并使用正则表达式其他方法来访问{{1 }}
答案 0 :(得分:1)
如果是这个XPath,
//*[@id=\"resultsDiv\"]/p[1]/a
选择此a
元素
<a href="./t_Person.aspx?PersonID=140476">Bill%20Jones</a>
那么这个XPath,
substring-after(//*[@id='resultsDiv']/p[1]/a/@href, 'PersonID=')
将根据要求单独返回140476
。