我遇到了一个看起来很难的情况,因为我是新手。我在谷歌搜索,但无法了解它。 有一个网站为用户提供搜索其所在地区/州等医生的设施。
在任何州,可能会出现在该网站上增加医生地址数量的情况。我怎么知道这个新医生在该网站上添加,没有访问和搜索该网站。
换句话说。假设你有一个网站。如果您更改了网站内容。我怎么知道您更改了网站内容。
我希望每天或每周同步记录,因为他们的数据库会发生变化。
答案 0 :(得分:2)
您可以在PHP中使用cURL。
使用的基本示例:
<?php
$ch = curl_init("http://www.example.com/");
$fp = fopen("example_homepage.txt", "w");
curl_setopt($ch, CURLOPT_FILE, $fp);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_exec($ch);
curl_close($ch);
fclose($fp);
?>
您还可以定义一系列参数,因此很容易模仿POST
或GET
- 然后定期运行脚本作为CRON作业,每次将结果保存到新的文件和compare it到旧的PHP
答案 1 :(得分:2)
如果他们有动力与您分享更新(例如业务开发安排),您可以请求对其数据库,API接口或他们的只读访问权限在他们的最后部署一个脚本,以便在有更新时对您进行ping操作,或者甚至在发送更新时向您发送更新。
您很可能只需要在某个时间间隔内重新扫描其网站并相应地更新您的数据。如果您执行以下操作,则可以避免不必要的处理和带宽开销:
分析页面返回的HTTP标头。它可能包含“上次修改”或“etag”,可帮助您确定自上次访问页面后页面是否已更改。
对加载的内容使用CRC32()或md5()哈希函数。如果它已经发生了变化,它将产生不同的哈希。