我刚刚发现了一个用于从pubmed中检索摘要的R的包,这很棒。但我在数据检索过程中会收到一条警告信息:
R2009 <- pubmed.search("R+package[tiab]+AND+2009/01/01[dp]:2009/12/31[dp]",dest="temp",format="ris")
Warning message:
In download.file(e.query, dest = temp, quiet = TRUE) :
downloaded length 2565 != reported length 200
> nrow(as.data.frame(R2009))
[1] 82
我已经在pubmed中手动搜索,并找到相同数量的文章(82)。
我想知道警告信息意味着什么,这里需要修复什么?感谢。
答案 0 :(得分:4)
这意味着无论文件pubmed.search()
下载了什么,它的长度为2565
(我假设的字节数?),但在连接协商期间报告的长度仅为200
个字节。
我不太了解pub med,但人们可以想象这样一种情况,其中包含正在下载的搜索结果的数据文件是动态生成的,并且最终文件大小未知,因此虚拟大小是首先报告,但实际下载流量增长超过此大小。您可以在不时使用浏览器时直观地看到这一点 - 有时浏览器不知道下载有多大,因此不会报告完成时间,只记录下载的数据量。
答案 1 :(得分:2)
200是OK的HTTP状态值,而不是下载的文件长度。令人讨厌的警告显示了download.file函数的问题,并且取决于它在内部用于执行下载请求的方法。