我有一个企业邮箱帐户,我的任务是创建一个可以扫描帐户上的帐户并将所有元信息(包括直接链接)保存在本地数据库中的爬虫程序。这很好。
PHP中的我还构建了一个下载文档的函数(通过我从api获得的直接链接)并从中提取可读文本。这在一周前完成,昨天,然而这完全停止了工作。我正在使用file_get_contents()函数来下载文件,目前它只检索文档的文件大小而不是文档本身,我觉得很奇怪。我已经尝试过CURL并得到相同的结果,似乎框响应了我的文件大小而不是实际文件的直接文件请求。
这些文件都是开放访问权限,因此任何拥有直接链接的人都可以在不登录的情况下下载该文件。我也尝试在另一家托管公司的另一台服务器上运行此代码,我得到完全相同的结果。我通过访问其他位置的其他文件(不是框)测试了我的代码,它运行正常。
重要的是要注意,这一周工作正常,但现在根本不起作用。在我的结尾之间没有任何改变(我知道)。有人有想法吗?