每天从其他网站获取内容

时间:2013-01-17 21:45:56

标签: html parsing rss sync

这是我的问题。我正在创建一个有"新闻"标签。我在新闻标签上想要的是来自其他新闻网站的更新内容。

有没有办法获取在其他网站上发布的纯文本,将其发布在我网站的新闻标签上,并在网站发布新内容时自动更新?任何人都可以把我推向正确的方向,这样我就可以学习如何做到这一点吗?

我非常了解HTML,但缺乏PHP和Javascript技能。为了解决这个问题,我需要学习什么?

3 个答案:

答案 0 :(得分:2)

查找Curl ...它是在php中。 http://php.net/manual/en/book.curl.php

这是一个很好的视频,可能与你想要推出的东西有关。 http://www.youtube.com/watch?v=PvEJz6du7R0

这里还有一些代码,用于使用curl获取网站的源代码。

<?php

$ch = curl_init("http://www.example-webpage.com/file.html");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_BINARYTRANSFER, true);
$content = curl_exec($ch);
curl_close($ch);
echo $content;

?>

另外一种做你想做的事情就是在div中使用iframe ......

<html>
<head>
<title></title>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

<style type="text/css">
<!--
#container{
    width:300px;
    height:100px;
    border:1px solid #000; 
    overflow:hidden;
    margin-left:50%;
    margin-top:5%;

}
#container iframe {
    width:1000px;
    height:750px;
    margin-left:-734px;
    margin-top:-181px;   
    border:0 solid;
 }
-->
</style>

</head>
<body>

<div id="container">
<iframe src="http://www.w3schools.com/" scrolling="no"></iframe>
</div>

</body>
</html>

某些网站不允许您对其网站进行iframe,因此这可能无效。例如,你不能iframe google,youtube,yahoo等。

希望这有帮助:D

答案 1 :(得分:1)

您需要使用file_get_contents并解析html以获得所需内容。如果您希望定期更新,则需要在“cron任务”上运行此脚本。

如果新闻网站有RSS源,您可以使用SimpleXML

更有效地解析它

答案 2 :(得分:1)

本书的一节介绍了如何从其他网站读取数据并使用PHP解析它。第10章,第328页“访问其他网站”。

http://www.amazon.com/PHP-Advanced-Object-Oriented-Programming-QuickPro/dp/0321832183/

但是,如果您是PHP的新手,并且高级Book无法启动。我会推荐以下任何一种方法让你开始走这条路。

http://www.amazon.com/PHP-MySQL-Dynamic-Web-Sites/dp/0321784073/

http://www.amazon.com/PHP-Web-Visual-QuickStart-Guide/dp/0321733452/

您可以使用高级书籍拼凑您需要的内容,但使用高级技能的最佳方法是从初学者开始学习!