Question

我刚刚发现了一个用于从pubmed中检索摘要的R的包，这很棒。但我在数据检索过程中会收到一条警告信息：

R2009 <- pubmed.search("R+package[tiab]+AND+2009/01/01[dp]:2009/12/31[dp]",dest="temp",format="ris")
Warning message:
In download.file(e.query, dest = temp, quiet = TRUE) :
  downloaded length 2565 != reported length 200

> nrow(as.data.frame(R2009))
[1] 82

我已经在pubmed中手动搜索，并找到相同数量的文章（82）。

我想知道警告信息意味着什么，这里需要修复什么？感谢。

Answer 1

这意味着无论文件pubmed.search()下载了什么，它的长度为2565（我假设的字节数？），但在连接协商期间报告的长度仅为200个字节。

我不太了解pub med，但人们可以想象这样一种情况，其中包含正在下载的搜索结果的数据文件是动态生成的，并且最终文件大小未知，因此虚拟大小是首先报告，但实际下载流量增长超过此大小。您可以在不时使用浏览器时直观地看到这一点 - 有时浏览器不知道下载有多大，因此不会报告完成时间，只记录下载的数据量。

Answer 2

200是OK的HTTP状态值，而不是下载的文件长度。令人讨厌的警告显示了download.file函数的问题，并且取决于它在内部用于执行下载请求的方法。

RISmed的这条警告信息是什么意思？

2 个答案: