我是数据分析初学者,目前正在学习如何在DataCamp中使用R.我想整理一个名为irsi的数据集,可以在R Studio中找到。我想知道我如何逐步清理这个数据集如下:
原件:
head(iris)
Species Sepal.Length Sepal.Width Petal.Length Petal.Width
1 setosa 5.1 3.5 1.4 0.2
2 setosa 4.9 3.0 1.4 0.2
3 setosa 4.7 3.2 1.3 0.2
4 setosa 4.6 3.1 1.5 0.2
5 setosa 5.0 3.6 1.4 0.2
6 setosa 5.4 3.9 1.7 0.4
第1步:
> head(iris.wide)
Species Part Length Width
1 setosa Petal 1.4 0.2
2 setosa Petal 1.4 0.2
3 setosa Petal 1.3 0.2
4 setosa Petal 1.5 0.2
5 setosa Petal 1.4 0.2
6 setosa Petal 1.7 0.4
第2步:
head(iris.tidy)
Species Part Measure Value
1 setosa Sepal Length 5.1
2 setosa Sepal Length 4.9
3 setosa Sepal Length 4.7
4 setosa Sepal Length 4.6
5 setosa Sepal Length 5.0
6 setosa Sepal Length 5.4
如果有什么我没有提及清楚,请随时告诉我。 任何建议都将非常感谢,谢谢!
答案 0 :(得分:4)
这是一个tidyverse
解决方案:
head(iris) %>%
unite(Sepal, Sepal.Length, Sepal.Width) %>%
unite(Petal, Petal.Length, Petal.Width) %>%
gather(Part, Value, 1:2) %>%
separate(Value, into = c("Length", "Width"), sep = "_") %>% # <-- Step 1
gather(Measure, Value, 3:4) # <-- Step 2
或更快:
head(iris) %>%
gather(key, value, 1:4) %>%
separate(key, into = c("Part", "Measure"))
由于您正在学习如何操作/整理数据,我强烈建议您逐步完成此操作,以了解每项操作的作用。