我的数据集中存在从1988年到2019年的数据。
我这样做是为了将其用作因子(用于图表等):
DTA$ANNEE <- as.factor(DTA$ANNEE)
但是,我想在此数据集上使用其他功能,例如:
max(DTA$ANNEE)
max(DTA$ANNEE-1) # By the way, is it the right syntax for : 2019-1 = 2018 ?
max(DTA$ANNEE-2)
max(DTA$ANNEE-3)
max(DTA$ANNEE-4)
max(DTA$ANNEE-5)
我尝试使用DTA$ANNEE <- as.numeric(DTA$ANNEE)
,但是2019变成了“ 1”,2018变成了“ 2”,2017变成了“ 3”,等等。
这样做的目的是获取我的数据集的最后五年并使用其他表上的列重命名。
几年来有特定格式吗?
例如,此功能有效吗?
droplevels(DTA[DTA$ANNEE %in% max(DTA$ANNEE-2), ])
谢谢
答案 0 :(得分:2)
as.numeric(as.character(DTA$ANNEE))
答案 1 :(得分:1)
根据您的描述,简单地在因子和数值数据列中都将很有用。
DTA$ANNEE_factor <- as.factor(DTA$ANNEE)
根据要数字年份还是因子年份,使用正确的列。
注意:一个数字年份应该只是2019。如果该值为'2019'(带引号),它将被视为字符值。
答案 2 :(得分:0)
谢谢大家的反馈,它效果很好:)
在发布结果之前,我需要像这样重命名列:
colnames(base_graphs)[3] <- "ANNEE_" + max(DTA$ANNEE)
它不起作用。.有没有办法在同名中添加“文本” +函数?