是否有R函数将分类变量(以字符形式)转换为定量变量?

时间:2019-12-04 19:56:59

标签: r

我有一个分类变量(在字符结构中),该变量以以下xx-xxxx的方式伪编码。伪代码的前两位数字对于响应分类很重要。我希望能够根据前两位数字对响应进行分类。例如,有28个响应伪代码被编码为11-xxxx。我想将所有28个响应合并为一个响应。因此,我希望能够将伪编码的分类变量转换为定量变量,这样我就可以根据前两位数字更有效地对响应进行分类。有进行转换的R函数吗?

Image of the Frequency Distribution of the first few responses for the variable

我是一名初学者,这是我第一次发帖至堆栈溢出。谢谢您的帮助!

dput(data$H4LM18) Sample

1 个答案:

答案 0 :(得分:0)

我能够从服务台获得帮助,并且我们成功地根据虚拟代码的前两位对变量进行了装箱。

以下是用于数据集数据和变量H4LM18的代码:

data $ jobcategory <-data $ H4LM18

data $ jobbracket <-unlist(lapply((strsplit(data $ jobcategory,“-”)),function(x){x [1]}))#[c(T,F)]

通过在破折号(-)处拆分响应的伪代码,我们能够仅根据伪代码的前两位数字对响应进行分类。