标签: php html-parsing domxpath
我需要从HTML页面的第4个表格的第4行中的所有表格单元格中获取数据。经过一段时间的研究,似乎使用DOMXPath是解析HTML文件的最佳方法。但是,文件中的任何位置都不使用ID或类。从这些单元格中获取数据的最佳方法是什么?
提前致谢。
答案 0 :(得分:0)
使用XPath获取时可以指定索引。在你的情况下
/html/body/table[4]/tbody/tr[4]/td
请注意XPath index is not zero-based, but one-based。
答案 1 :(得分:0)
如果您熟悉jQuery语法,请查看phpQuery吗?