在R中对样本进行分类,并以不同的颜色绘制它们

时间:2012-10-10 07:52:02

标签: r colors ggplot2 categorization

我是学习R的新手。我想知道如何为我在数据框中读到的观察分配一个分类值。例如,我有来自n个样本的m个变量的数据,我想将一些样本分配为组1,将一些样本分配为组2,依此类推。另外,当我绘制它们时,如何以不同的颜色可视化不同的组?

1 个答案:

答案 0 :(得分:5)

假设您有以下数据:

spam = data.frame(value = runif(100))

您可以像这样分配随机组成员资格:

spam[["group"]] = sample(c("group1", "group2"), nrow(spam), replace = TRUE)

> head(spam)
      value  group
1 0.1385715 group1
2 0.1785452 group1
3 0.7407510 group2
4 0.5867080 group1
5 0.1514461 group1
6 0.3009905 group1

使用ggplot2

可以轻松绘制具有不同颜色的组
require(ggplot2)
ggplot(aes(x = 1:nrow(spam), y = value, color = group), data = spam) + 
  geom_point()

enter image description here