为数据集创建虚拟变量

时间:2014-11-14 01:42:45

标签: r

我是r的新手,并且拥有一个包含3个状态(1,2,3)的列的数据集。问题是我不知道将数据集与相应的虚拟变量分开以创建箱形图并最终形成线性模型。    请帮忙!! :'(

2 个答案:

答案 0 :(得分:1)

所以我认为您可以指定哪个功能是分类的。 说

data<- read.csv(filename)
data$feature <- factor(data$feature)

哪个功能是您要转换为分类数据的功能?

这就是你要找的东西吗?

答案 1 :(得分:-2)

如果我遇到了您的问题,您的示例中有2列,其中一列具有因子级别(1,2,3),另一列是响应变量。有吗? (部分数据的示例将非常有用)。在任何情况下,如果您的数据具有此结构,则无需拆分它。对于箱形图,只需运行

boxplot(data$variable~data$factor)

您可以对线性模型使用相同的方法:

lm(data$variable~data$factor)

如果您的数据具有其他结构,则需要在有人提供进一步帮助之前对其进行解释......