如何将每个单元格的名字作为行名称并在表格框架中对数据进行排序?

时间:2015-03-21 00:00:15

标签: r

我的CSV看起来像this

我的预期输出应如下所示:

             channel_count        characteristics_ch1  . . . . . 
GSM1098572       gps                       1
GSM1098573       SRA                       1
GSM1098574       SRA                       1

2 个答案:

答案 0 :(得分:0)

rownames(data)= data $ varname

答案 1 :(得分:0)

好吧,好像你的" csv"文件仍远不是常规的csv"。如果您不是经验丰富的用户,您可能会发现值得探索其他数据清理软件,例如OpenRefine

为了举例说明在R中可以实现的目标,我采取了第一个"行"您的数据并稍微摆弄它。 (这里," txt"是一个包含第一行/大块数据的字符串):

txtsub <- gsub("\\.", "\t", txt) # Turn dots into field separators
txtsub <- gsub(";", "\r\n", txtsub) # Turn semicolons into linebreaks
dat <- read.delim2(text=txtsub,header = FALSE) # read transformed text into a dataframe.

head(dat)

#          V1                  V2
# 1 GSM1098572       channel_count
# 2 GSM1098572 characteristics_ch1
# 3 GSM1098572     contact_address
# 4 GSM1098572        contact_city
# 5 GSM1098572     contact_country
# 6 GSM1098572  contact_department

在达到预期效果之前还有很长的路要走,但我不认为这里有人会为你完成所有这些工作。但如果这可以帮助你开始,那就更好了。如果让你的数据处于良好状态是一件紧迫的事情,那么聘请某人为你做这件事是值得考虑的事情。只是在这里大声思考。

无论如何,祝你好运,并随时与我联系以获取后续问题。