fread,data.table中的小数点设置

时间:2013-11-13 15:57:46

标签: r data.table

我想使用来自data.table的fread,但得到一个与小数点相关的警告[这里是','而不是'。']。通常我使用'。',但在某些情况下我必须使用','作为小数点导入文件。

在read.csv中,我可以设置小数点分隔符:

df <- read.csv("mydata.csv", sep=";", dec=",")

如何在data.table中的fread函数中执行此操作?与

df=fread('mydata.csv',sep=';')

我收到一条警告信息:

Warning message:
In fread("mydata.csv",  :
Bumped column 7 to type character on data row 86, field contains '4,5'. 

,其中4,5是在read.csv中用sep =','正确读取的值为'4.5'。

sessionInfo()
R version 3.0.2 (2013-09-25)
Platform: x86_64-pc-linux-gnu (64-bit)

locale:
 [1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C               LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8     LC_MONETARY=en_US.UTF-8   
 [6] LC_MESSAGES=en_US.UTF-8    LC_PAPER=en_US.UTF-8       LC_NAME=C                  LC_ADDRESS=C               LC_TELEPHONE=C            
[11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C  

1 个答案:

答案 0 :(得分:6)

2014年10月更新:现在在v1.9.5

  

fread现在接受dec=','(以及其他非'。'小数分隔符),#917?fread添加了一个新段落。如果您位于使用dec=','的国家/地区,那么它应该可以使用。如果没有,您需要阅读该段落以获取额外步骤。如果它以某种方式中断dec='.',则可以使用options(datatable.fread.dec.experiment=FALSE)关闭此新功能。



以前的回答......

由于您使用的是data.table 1.8.11,因此您可以执行以下操作:

fread("sed 's/,/./g' yourfile", sep = ";")

(实际上我认为你甚至不需要在这里指定sep