我有一个格式错误的页面要抓,并且很难为YQL获取正确的XPath。我可以刮掉我需要使用的各个字段,例如:
//*[@id="cell_12345"]
但我真正需要做的是返回ID以cell_
开头的所有元素。类似的东西:
//*[@id="cell_"*]
我该怎么做?
另外,如果有人能指出我的XPath参考资料,那将非常有帮助。
谢谢!
答案 0 :(得分:28)
像
这样的东西//*[starts-with(@id, 'ceil_')]
应该做得很好。
对于xpath引用,一旦你知道语法和轴,任何旧的函数引用都应该有所帮助。这是第一个google:http://www.w3schools.com/xpath/xpath_functions.asp