我正在尝试使用yahoo管道工具从我的网站页面构建一个RSS源。
我可以使用雅虎管道中的“xphat fetch page”从网页中只提取一个ID:
//*[@id="ctr3262_MainView_ViewBlog_lstBlogView_lnkEntry_0"
其他ID不同:..lstBlogView_lnkEntry_1
,..lstBlogView_lnkEntry_2
等等。
这是html文件的一部分:
< div class="vbEntry" >
< h2 >
< a id="ctr3262_MainView_ViewBlog_lstBlogView_lnkEntry_1" rel="bookmark" href="http://www.site.com/blogs/EntryId/12">word1-word2-word3 < /a >
< /h2 >
< div class="vbHeader dnnClear" >
from < a href='http:/www.site.com/ipse dixit' > ipse dixit < /a > ,
< span id="ctr3262_MainView_ViewBlog_lstBlogView_lblPublishDate_1" >sunday 7 december 2012 17:31 < /span >
< div class="dnnRight" >< /div >
< /div >
如何查看我页面中的所有ID?
答案 0 :(得分:1)
如果您要查找id为id包含文本的所有元素,请使用此
"//*[contains(@id, 'lstBlogView_lnkEntry_') ]"
所有ID为
的元素"//*[@id ]"
所有ids:
从@Jens Erat那里得到答案
答案 1 :(得分:0)
您可以使用属性步骤来处理属性,此XPath表达式将查询文档中的所有id
属性:
//@id