阅读网站页面

时间:2009-09-30 16:55:45

标签: php html regex web-scraping

假设有一个名为http://example.com/a

的网站

该网站正在使用PHP,Perl,Ruby和其他语言开发。

我希望能够从我的网站上阅读此网站页面,执行代码,然后分析HTML结果页面标签并使用PHP获取内容。

就像从一些新闻网站阅读新闻,然后以不同的格式或不同的风格在我的网站上显示。

1 个答案:

答案 0 :(得分:4)

我不确定您是否了解Web编程的这一方面,但您无法访问生成HTML的服务器端代码。您当然可以使用许多HTML parsers中的一个来解析从服务器返回的HTML。

这可能是也可能不是你提出的问题,因为你的问题对我来说有点模糊。请注意,如果您要从 网页上的其他网页收集信息,则应确保每次用户访问时,您的网站都不会向其他网页发出请求您的网站。 (Phew,这是少数几个!)你需要对其他网站的内容进行某种缓存。