R导入

时间:2018-03-05 23:41:12

标签: r csv parsing import-csv

我有一个文件,找到here

出现了一个非常奇怪的错误,我有时会重现,但无法弄清楚。导入R时,偶尔会有一些特殊字符附加到“数字”列,这意味着数字$ number不再有意义。

例如在跑步时:

library(readr)
mers3 <- read_csv("~/Documents/Code/AnalysisInEpi/Week 3 - Binomial Regression/PS3/mers3.csv")

结果输出

Parsed with column specification:
cols(
  'number' = col_integer(),
)

当列的实际名称是没有引号的数字时。在我的机器上,当我使用基本R read.csv()函数时,这会消失,但在另一台用户机器上,它会持续存在,并带有一组不同的特殊字符。我现在使用文本编辑器在两台机器上打开文件,看不到任何编码错误等。原始文件是通过Excel导出创建的。

有谁知道可能会发生什么?

作为更新,它出现打开并且在XCode中重新保存文件可能有固定的东西,尽管BBEdit也不能这样说。

1 个答案:

答案 0 :(得分:4)

该文件的

Row 1080包含

?840,67,NA,1,0,0,1,0,1,0

readr是唯一抱怨(正确)存在“?”的包。应该有一个数字。

至于您提供的输出,这是readr包的典型值,是消息而不是错误。它告诉你它解释的列类型,所以如果你想让它消失,你可以自己指定列类型。

否则,read.csv()data.table::fread()会按原样加载您的CSV。