Question

我正在尝试使用yahoo管道工具从我的网站页面构建一个RSS源。

我可以使用雅虎管道中的“xphat fetch page”从网页中只提取一个ID：

//*[@id="ctr3262_MainView_ViewBlog_lstBlogView_lnkEntry_0"

其他ID不同：..lstBlogView_lnkEntry_1，..lstBlogView_lnkEntry_2等等。

这是html文件的一部分：

< div class="vbEntry" >
< h2 >
< a id="ctr3262_MainView_ViewBlog_lstBlogView_lnkEntry_1" rel="bookmark" href="http://www.site.com/blogs/EntryId/12">word1-word2-word3 < /a >
< /h2 > 
< div class="vbHeader dnnClear" >
from < a href='http:/www.site.com/ipse dixit' > ipse dixit < /a > , 
< span id="ctr3262_MainView_ViewBlog_lstBlogView_lblPublishDate_1" >sunday 7 december 2012 17:31 < /span >
< div class="dnnRight" >< /div >
< /div >

如何查看我页面中的所有ID？

Answer 1

如果您要查找id为id包含文本的所有元素，请使用此

"//*[contains(@id, 'lstBlogView_lnkEntry_') ]"

所有ID为

的元素

"//*[@id ]"

所有ids：
从@Jens Erat那里得到答案

Answer 2

您可以使用属性步骤来处理属性，此XPath表达式将查询文档中的所有id属性：

//@id

xpath在雅虎管道中提取所有不同的id

2 个答案: