是否可以提取远程HTML页面的一部分,并使用PHP cURL,HTML DOM解析器或任何其他方法将其打印在另一页面上,保留原始格式样式,图像,标签功能? 例如,如何从http://ru.yahoo.com/中提取中心列的内容(带标签和格式,保留原始文本的外观)?
据我所知,脚本应该处理外部CSS,以便返回的内容与原始内容具有相同的外观。如果可能的话,最合适的方式是什么?如果是的话,一个例子将受到高度赞赏。我看了几个例子,但没有为我的案例找到任何解决方案。
答案 0 :(得分:2)
好吧,如果我必须快速做(读:非常脏)我会这样做,我想:
小提琴直到看起来还不错。但是:我认为这会破坏外部JS文件的加载,因为域策略相同。
一个很好的方法是:
你知道:RSS是为此而发明的,如果他们不提供RSS提要,他们很可能不希望你获取内容并将其发布在你自己的网站上。 :P