我有一个分类变量(在字符结构中),该变量以以下xx-xxxx的方式伪编码。伪代码的前两位数字对于响应分类很重要。我希望能够根据前两位数字对响应进行分类。例如,有28个响应伪代码被编码为11-xxxx。我想将所有28个响应合并为一个响应。因此,我希望能够将伪编码的分类变量转换为定量变量,这样我就可以根据前两位数字更有效地对响应进行分类。有进行转换的R函数吗?
Image of the Frequency Distribution of the first few responses for the variable
我是一名初学者,这是我第一次发帖至堆栈溢出。谢谢您的帮助!
答案 0 :(得分:0)
我能够从服务台获得帮助,并且我们成功地根据虚拟代码的前两位对变量进行了装箱。
以下是用于数据集数据和变量H4LM18的代码:
data $ jobcategory <-data $ H4LM18
data $ jobbracket <-unlist(lapply((strsplit(data $ jobcategory,“-”)),function(x){x [1]}))#[c(T,F)]
通过在破折号(-)处拆分响应的伪代码,我们能够仅根据伪代码的前两位数字对响应进行分类。