我有一个数据集如下:
Provider=Microsoft.ACE.OLEDB.12.0
包含更多行。所有数据列都是离散的。
我打算在R.中使用 age sex Cond label
range1 M 1 0
range2 M 2 1
range3 F 4 1
,hc
,gs
bn
个软件包。我应该使用哪些数据转换?我应该如何将数据转换为因子?
答案 0 :(得分:0)
关于第二个问题,转换为factor
非常简单。只需使用lapply
循环浏览感兴趣的列,然后应用factor
即可。然后用输出更新原始数据集。
df1[] <- lapply(df1, factor)
如果我们只查找列的子集,例如,&#39; age&#39; sex&#39;,对数据集进行子集,然后循环遍历这些
df1[c('age', 'sex')] <- lapply(df1[c('age', 'sex')], factor)