将来自多个网页的抓取数据合并为单页

时间:2011-04-25 15:57:31

标签: java php javascript aggregate web-scraping

我想创建一个网页,汇总来自多个网页的数据,其方式与IE Web Slice,WebChunks,PageSlices或other web slices does类似。

它可以是一个网站(或只是html页面,本地)或桌面应用程序,它作为一种聚合器。

这样做的方法是什么? Java,Javascript,PHP,桌面应用程序还是其他? 另外,你能否提供一些参考资料来抓取已知ID <1的单个div。 div id =“ThisIsIt”&gt;从几个不同的网页,并将它们一起呈现(作为网页或应用程序)?

提前致谢。

1 个答案:

答案 0 :(得分:1)

在带有DOMDocument类的php中它将是

$url='....bla bla';
$out=file_get_contents($url);
$dom=new DOMDocument();
@$dom->loadHTML($out);

$div=$dom->getElementById('yourid');
$value=$div->nodeValue;