如何在一个数据集中更改多个变量的格式?

时间:2015-12-08 09:15:26

标签: r

我的数据中有6个变量,一个是日期,另外五个是数字。导入文件时,日期为character,2个数值变量保持numeric,其他3个变量似乎更改为character。我想知道它背后的原因,现在如果我想改变它们的所有格式,我该怎么做?

2 个答案:

答案 0 :(得分:0)

根据您的评论...

kids_store2$month = format(as.Date(d, format = "%d-%m-%Y"),"%m")

这会将月份作为整数返回。

(假设日期为dd-mm-yyyy(“28-04-2015”)格式。)

答案 1 :(得分:0)

导入.csv文件时(我假设它是你所做的),你必须小心一些东西: - 如果有一个或多个单元格标记为"#ERROR" " #DIV / 0" 或任何其他未明确提及的NA字符串。有时,对于分析数据,您会获得检测限制结果,例如"< 0.02" ,并将其解释为文本。 - 角色日期相当可预测,并且经常在导入时发生。

无论如何,如果在导入.csv文件时需要强制某些列到特定的类,那么有一个非常有用的colClasses参数。使用NA时,R会自动选择最佳格式。尝试这样的事情:

df <- read.csv(file="input.csv", na.strings=c("", "#REF", "#DIV/0"), colClasses=c(Date, NA, NA, NA, NA, NA))