使用单独的分隔包含日期格式的列

时间:2019-06-13 16:39:04

标签: r tidyr

我有一个数据集,其中的列包含日期和测试值

Dataset
ColumnA
03.01.19 3,0
02.02.18 2,0
01.03.17 1,0

我需要将它们分隔为日期列和值列:

Dataset
date        value
03.01.19    3,0
02.02.18    2,0
01.03.17    1,0

separate(Dataset, "ColumnA", 
                  into = c("date","value"), 
                         )

但是它给了我这样的新列,并丢弃了其余信息:

Dataset
date        value
03          01
02          02
01          03

我该如何纠正?

我尝试过tidyr

separate(Dataset, "ColumnA", 
                  into = c("date","value")

我也尝试过更改日期和值之间的空格并指定它 sep = ""参数。

ColumnA
03.01.19/3,0
02.02.18/2,0
01.03.17/1,0

separate(Dataset, "ColumnA", 
                  into = c("date","value"), 
                     sep= "/"    )

2 个答案:

答案 0 :(得分:1)

git stash会为您完成此操作,而且我敢肯定还有其他软件包。 git pull是您要寻找的功能。

splitstackshape

答案 1 :(得分:1)

编辑

如稍后所示读取数据后,您可以在tidyverse内进行如下显示(根据需要{rename):

  df %>% 
   mutate(Date=row.names(.)) %>% 
   filter(Date!="ColumnA") %>% 
   select(Date,everything()) %>% 
   rename(date=Date,value=Dataset)

  date      value
1 03.01.19   3,0
2 02.02.18   2,0
3 01.03.17   1,0

原始(纯粹是基数):

我们可以使用read.table

df<-read.table(text="Dataset
ColumnA
03.01.19 3,0
02.02.18 2,0
01.03.17 1,0",header=T,sep=" ",as.is=T,fill=T)

然后(根据需要重命名和重新排序):

df$ColumnA<-row.names(df)
rownames(df)<-NULL
df[2:nrow(df),]
 Dataset   ColumA
2     3,0 03.01.19
3     2,0 02.02.18
4     1,0 01.03.17