我的数据中有6个变量,一个是日期,另外五个是数字。导入文件时,日期为character
,2个数值变量保持numeric
,其他3个变量似乎更改为character
。我想知道它背后的原因,现在如果我想改变它们的所有格式,我该怎么做?
答案 0 :(得分:0)
根据您的评论...
kids_store2$month = format(as.Date(d, format = "%d-%m-%Y"),"%m")
这会将月份作为整数返回。
(假设日期为dd-mm-yyyy(“28-04-2015”)格式。)
答案 1 :(得分:0)
导入.csv文件时(我假设它是你所做的),你必须小心一些东西: - 如果有一个或多个单元格标记为"#ERROR" 或" #DIV / 0" 或任何其他未明确提及的NA字符串。有时,对于分析数据,您会获得检测限制结果,例如"< 0.02" ,并将其解释为文本。 - 角色日期相当可预测,并且经常在导入时发生。
无论如何,如果在导入.csv文件时需要强制某些列到特定的类,那么有一个非常有用的colClasses
参数。使用NA时,R会自动选择最佳格式。尝试这样的事情:
df <- read.csv(file="input.csv", na.strings=c("", "#REF", "#DIV/0"), colClasses=c(Date, NA, NA, NA, NA, NA))