我使用php简单的html dom在这个问题上没有成功。 现在我已经去了DOMDocument和DOMXpath,这似乎很有希望。
这是我的问题: 我试图从页面最初显示后通过Web服务请求加载的数据中抓取数据。它只有几毫秒,但正因为如此,正常的抓取显示模板值而不是实际数据。 我使用chrome开发人员网络设置找到了端点URL。因此,如果我将该URL输入浏览器地址栏,则数据将以JSON格式显示。好的。
我的问题出现了,因为无论何时重新访问网站或刷新页面,端点网址的后缀都是随机生成的,因此我无法将此网址硬编码到我的php文件中。例如,首次访问时,网址的结尾为“? = 253648592”,但刷新时可能是“? = 375482910”。网址的基础是静态的。
没有进入无头浏览器(我试过,我的头疼!)有没有办法让Xpath在页面加载时找到这个随机网址?
很抱歉这么啰嗦,但我想尽我所能解释。
答案 0 :(得分:0)
如果您只需要HTML中的一个项目/值,那么使用正则表达式可能会更容易,更快捷。我想举个例子,但是我需要一个更加扩展的HTML代码片段,其中包含你想要获取的端点。
是否可以提供包含端点的HTML片段?