如何将其他网站的内容保存到我的数据库?

时间:2010-06-01 23:14:30

标签: php mysql

我想动态地将足球比分网站上的内容上传到我的数据库。

我也想每天从该网站上的一个页面(那天的足球比赛)中做到这一点。

如果您只能通过该网页连接和检索数据来帮助我,我会管理剩下的工作。

网站:http://soccerstand.com/ 语言:php / java - mysql

谢谢!

3 个答案:

答案 0 :(得分:1)

您可以使用php的file函数来获取数据。您只需传递一个URL,它就会将内容作为文件中的行数组返回。您还可以使用file_get_contents将内容作为一个大字符串。

答案 1 :(得分:1)

关于抓取其他网站数据的道德问题:

使用php,只要您正确设置,就可以在网站上进行“开放”通话。有关该示例和示例的详细信息,请参阅此页面:http://www.php.net/manual/en/wrappers.http.php

从那里你有网页的内容,这是一个分解的问题。在我的脑海中,我将使用正则表达式或HTML解析器来拆分HTML,然后遍历子元素并将数据解析为数据库调用以保存数据。

在网络上解析HTML有很多资源,只需选择最适合您的资源。

请记住,您需要监控网站的更改,因为如果他们更改元素或其类/ ID,您可能还需要更改解析结构。

答案 2 :(得分:1)

使用curl,你将获得页面的内容,然后使用正则表达式,你将得到你想要的。

有一种简单的方法:http://www.jonasjohn.de/lab/htmlsql.htm