假设有一个名为http://example.com/a
的网站该网站正在使用PHP,Perl,Ruby和其他语言开发。
我希望能够从我的网站上阅读此网站页面,执行代码,然后分析HTML结果页面标签并使用PHP获取内容。
就像从一些新闻网站阅读新闻,然后以不同的格式或不同的风格在我的网站上显示。
答案 0 :(得分:4)
我不确定您是否了解Web编程的这一方面,但您无法访问生成HTML的服务器端代码。您当然可以使用许多HTML parsers中的一个来解析从服务器返回的HTML。
这可能是也可能不是你提出的问题,因为你的问题对我来说有点模糊。请注意,如果您要从 网页上的其他网页收集信息,则应确保每次用户访问时,您的网站都不会向其他网页发出请求您的网站。 (Phew,这是少数几个!)你需要对其他网站的内容进行某种缓存。