我正在寻找一种使用 PHP 获取 HTML页面结构的方法。
我想要实现的是能够检查页面结构是否已更改(不内容)。
例如,我希望能够知道从具有经常更改内容的页面添加(或删除)新功能的时间。如果添加或删除了某个功能,则结构也会发生变化。
这样做的好方法是什么?使用DOMDocument,Xpath或您能想到的任何其他方法?
我曾尝试使用 DOMDocument ,但这是一项非常艰巨的任务......
思想?
答案 0 :(得分:0)
我建议使用selenium / jquery和xpath来计算div或body-html中的元素数量,并检查数字是否更改。
答案 1 :(得分:0)
我能想到的最简单的方法是使用文档的file_get_contents()并将其存储在数据库中,然后让cron每天检查或以适合您的时间间隔进行检查并再次重新检索内容并检查数据存储在数据库中以查看它们是否匹配。