我的CSV看起来像this
我的预期输出应如下所示:
channel_count characteristics_ch1 . . . . .
GSM1098572 gps 1
GSM1098573 SRA 1
GSM1098574 SRA 1
答案 0 :(得分:0)
rownames(data)= data $ varname
答案 1 :(得分:0)
好吧,好像你的" csv"文件仍远不是常规的csv"。如果您不是经验丰富的用户,您可能会发现值得探索其他数据清理软件,例如OpenRefine。
为了举例说明在R中可以实现的目标,我采取了第一个"行"您的数据并稍微摆弄它。 (这里," txt"是一个包含第一行/大块数据的字符串):
txtsub <- gsub("\\.", "\t", txt) # Turn dots into field separators
txtsub <- gsub(";", "\r\n", txtsub) # Turn semicolons into linebreaks
dat <- read.delim2(text=txtsub,header = FALSE) # read transformed text into a dataframe.
head(dat)
# V1 V2
# 1 GSM1098572 channel_count
# 2 GSM1098572 characteristics_ch1
# 3 GSM1098572 contact_address
# 4 GSM1098572 contact_city
# 5 GSM1098572 contact_country
# 6 GSM1098572 contact_department
在达到预期效果之前还有很长的路要走,但我不认为这里有人会为你完成所有这些工作。但如果这可以帮助你开始,那就更好了。如果让你的数据处于良好状态是一件紧迫的事情,那么聘请某人为你做这件事是值得考虑的事情。只是在这里大声思考。
无论如何,祝你好运,并随时与我联系以获取后续问题。