从站点提取数据并放入文件

时间:2010-09-14 11:56:14

标签: php

得到了这个项目,客户端丢失了他们的数据库,因此我必须查看他们当前的(实时)站点并检索信息...问题是有太多的数据我必须复制并插入到花了很多时间的数据库...你能建议一些可以帮助我的代码吗?

2 个答案:

答案 0 :(得分:1)

您可以使用DOMDocument库进行php并编写自动脚本,以便在识别页面使用标记中的信息位置后检索数据。
http://www.php.net/manual/en/book.dom.php

该库非常强大并使用xpath http://www.w3schools.com/xpath/xpath_examples.asp

答案 1 :(得分:0)

如果页面结构非常相似,您可以尝试使用正则表达式或html解析器(整理)来过滤掉相关数据。

我为一个拥有200多个带有图像,标题和文字的手写产品页面的客户做了类似的事情。来源似乎是从最后一页复制粘贴,并演变成几种不同的风格。经过一些调整后效果很好。