得到了这个项目,客户端丢失了他们的数据库,因此我必须查看他们当前的(实时)站点并检索信息...问题是有太多的数据我必须复制并插入到花了很多时间的数据库...你能建议一些可以帮助我的代码吗?
答案 0 :(得分:1)
您可以使用DOMDocument库进行php并编写自动脚本,以便在识别页面使用标记中的信息位置后检索数据。
http://www.php.net/manual/en/book.dom.php
该库非常强大并使用xpath http://www.w3schools.com/xpath/xpath_examples.asp
答案 1 :(得分:0)
如果页面结构非常相似,您可以尝试使用正则表达式或html解析器(整理)来过滤掉相关数据。
我为一个拥有200多个带有图像,标题和文字的手写产品页面的客户做了类似的事情。来源似乎是从最后一页复制粘贴,并演变成几种不同的风格。经过一些调整后效果很好。