我有4个实验组的比例响应数据,每组计算2个不同的统计数据。我想要下图(我可以实现):
我使用以下代码获取此图:
Group<-c('a','b','c','d','a','b','c','d')
Statistic<-c('Mean','Mean','Mean','Mean','d','d','d','d')
Val<-c(.75,.83,.79,.69,.5,.02,.1,.3)
dfm2<-data.frame(cbind(Group,Statistic,Val))
ggplot(dfm2,aes(x = Group,y = Val)) +
geom_bar(aes(fill = Statistic),position = dodge',stat='identity')
但是,当我通过添加代码行更改y轴的限制(因为我有比例时为[0,1]):
+ scale_y_continuous(limits=c(0, 1))
我得到了
Error: Discrete value supplied to continuous scale
所以我理解这意味着我有一个非连续的变量。我尝试使用as.numeric()
和无数其他选项转换我的统计变量,但无济于事。如果有人可以帮助我解决这个问题和/或解释是什么导致它,我会非常感激。
答案 0 :(得分:4)
问题是在cbind
内不必要地使用data.frame
。 cbind
创建一个矩阵。矩阵必须具有相同模式的所有值(数字,字符等)。由于至少有一个变量(在这种情况下为两个)是字符模式,cbind
也会将Val
强制为字符。 data.frame
将三个字符变量转换为factor。无论哪种方式,Val
都是离散(分类)值而不是数字,当您使用scale_y_continuous
时会导致错误。
更改为dfm2 <- data.frame(Group,Statistic,Val)
,错误将消失。
您可以按如下方式检查cbind
和data.frame
对数据类型的影响:
cbind(Group, Statistic, Val)
Group Statistic Val
[1,] "a" "Mean" "0.75"
[2,] "b" "Mean" "0.83"
...
[7,] "c" "d" "0.1"
[8,] "d" "d" "0.3"
dfm2<-data.frame(cbind(Group,Statistic,Val))
str(dfm2)
'data.frame': 8 obs. of 3 variables:
$ Group : Factor w/ 4 levels "a","b","c","d": 1 2 3 4 1 2 3 4
$ Statistic: Factor w/ 2 levels "d","Mean": 2 2 2 2 1 1 1 1
$ Val : Factor w/ 8 levels "0.02","0.1","0.3",..: 6 8 7 5 4 1 2 3
dfm2 <- data.frame(Group,Statistic,Val)
str(dfm2)
'data.frame': 8 obs. of 3 variables:
$ Group : Factor w/ 4 levels "a","b","c","d": 1 2 3 4 1 2 3 4
$ Statistic: Factor w/ 2 levels "d","Mean": 2 2 2 2 1 1 1 1
$ Val : num 0.75 0.83 0.79 0.69 0.5 0.02 0.1 0.3
如果您不希望data.frame
将字符串转换为因子,请添加参数stringsAsFactors=FALSE
。
答案 1 :(得分:0)
请尝试以下操作。
ggplot(dfm2,aes(x = Group,y = as.numeric(as.character(Val)))) +
geom_bar(aes(fill = Statistic),position = 'dodge',stat='identity')+
scale_y_continuous(limits=c(0, 1))