这是我的数据集样本
label text
location thyroid
symptoms Depression
location thyroid
name of disease hypothyroidism
location thyroid
location thyroid
我在r中尝试过的代码
library(readr)
notes <- read_csv("some.csv")
notes$label <- as.factor(notes$label) # convert title to factor
dim(notes)[1]*(0.7)
table(notes$label)
t <- transpose(notes)
控制台中的输出
> table(notes$label)
causes location name of disease serious symptoms
8 73 54 12
symptoms
102
writers_matrix <- as.matrix(notes)
ta <- t(writers_matrix)
ta <- as.data.frame(ta)
得到的结果:
我得到249个变量的2个obs,就像一个宽表一样,我想 提取“标签”列中的级别作为列名并产生一个 新的数据帧具有五列,因为每列下有5个级别,这些级别的组值作为行值