感觉很愚蠢,不能自己解决这个问题,但我现在只想问一下
这是我使用www.google.org/flutrends/about/data/flu/us/data.txt
在excel中保存为.csv的数据
目前我有162列使用数据,我希望融化数据,以便我可以将值分组到区域名称,以便为所有区域并排创建箱图。不幸的是,熔化按字母顺序排序变量名称,我希望保持原始列名称顺序。我不确定如何做到这一点。我想这与我迄今为止在该主题上能够找到的因子水平有关。这是我目前正在使用的代码,data1是read.csv:
data1 <- read.csv('http://www.google.org/flutrends/about/data/flu/us/data.txt', skip = 10)
gr_data1 <- reshape2::melt(data1[-1]) #Group data for all US by area (variable) and flu trend (value)
我尝试运行它,然后检查名称(data1):
names(data1) <- factor(names(data1), levels = unique(names(data1)))
但正如你在下面所看到的那样,并没有真正为我解决任何问题。 这就是我正在制作的情节:
library('ggplot2')
ggplot(na.omit(gr_data1), aes(x = variable, y = value)) + geom_boxplot() + theme(axis.text.x = element_text(angle = 90, hjust = 1))
理想情况下,巴吞鲁日洛杉矶将是最后一个,而美国是第一个
这就是数据的样子。有162列,包括日期。
这就是代码对数据的作用 - &gt; i.stack.imgur.com/CWMbu.png