如何将包含许多不同字符串的列转换为两级因子列?

时间:2016-03-18 20:16:13

标签: r

我们已经收集了一份车库销售样本,在该样本中有一个名为&#34的栏目;附加说明"由于其可选性,一些条目是空的,其他条目填写。如果我把它变成一个因子列,我最终会有大约五千个不同的级别。相反,我宁愿知道是否有"附加描述"帮助车库出售与否。

因此我想把空行变成因子属性" N"并且非空行进入因子属性" Y"。那么我可以在哪些方面根据自己的喜好转换数据呢?

示例:

数据的外观:

str(data)
$ Additional Description: chr  NA NA NA "New Products" "Outdoor Sale" ...

我希望数据看起来如何:

str(data)
$ Additional Description: Factor w/ 2 levels "N","Y": 1 1 1 1 1 1 1 1 1 1 ...

1 个答案:

答案 0 :(得分:0)

请在发布问题时尝试举例说明。 希望你想把空行设为“N”,将非空行设为“Y”,试试这个:

df$Additional.Description.New[!is.na(df$Additional.Description)] = "Y"
df$Additional.Description.New[is.na(df$Additional.Description)] = "N"