我正在尝试解析http://skytech.si/
中的数据我环顾四周,发现该网站使用http://skytech.si/skytechsys/data.php?c=tabela来显示数据。当我在浏览器中打开此文件时,我什么都没得到。文件是受保护的,只能从服务器端运行吗?
有没有办法从中获取数据?如果我冷获取HTML数据(可能在表中?),我可能知道如何解析它。
如果没有,是否仍然可以解析网站以及如何解决?
答案 0 :(得分:1)
在浏览器中打开此URL时,您会发送GET请求。使用params发送POST请求后,可以访问此地址下返回的数据,如下所示 c:tabela , l:undefined , x:undefined 。如果您使用的是Chrome / Chromium,请在下次分析标题并查看网络日志。
答案 1 :(得分:1)
我查看了提出的请求;
http://skytech.si/skytechsys/?c=graf&l=bf0b3c12e9b2c2d65bd5ae8925886b57
http://skytech.si/skytechsys/?c=tabela
Forbidden
You don't have permission to access /skytechsys/ on this server.
本网站不允许“外部”GET请求。您可以尝试通过file-put-contents解析数据,但我认为由于需要进行AJAX请求,您将无法获得特定的数据表(除了那个主页上的数据表)。我相信/数据?是处理未通过API公开的数据的控制器。
答案 2 :(得分:0)
如果该网站没有公开API,则不建议解析数据,因为它们的HTML结构很容易发生变化。
请参阅: http://php.net/manual/en/function.file-put-contents.php
然后你可以用HTML解析引擎或正则表达式解释它(不推荐)。