前段时间我已经执行了一个图表,其中包含多行具有不同值集的行。结果是这个图像的y轴值为od值:http://imgur.com/a/aLRUC 过了一会儿,我使用完全相同的代码,但只是略微改变了表格中的一些值,输出是带有连续y轴的图像:http://imgur.com/v6DLB09
在这两种情况下,我使用完全相同的代码,但我得到两次不同的输出。我想得到第一个输出,其中y轴显示在部分中,以便更好地显示数值的偏差。谁能建议我怎么做? 我使用的数据是* .csv表,它有6列,其值代表我研究区土地使用的百分比
Sensor Acquisition_time Land Sea Lagoon River
Landsat_4 1992 72.79 19.05 7.56 0.60
Landsat_5 1984 72.96 19.17 7.02 0.85
Landsat_5 1988 72.82 19.41 7.09 0.68
Landsat_5 1996 73.46 19.27 6.71 0.56
Landsat_5 2000 72.72 19.23 7.43 0.62
Landsat_5 2004 72.48 19.05 7.78 0.69
Landsat_5 2008 72.67 19.14 7.49 0.70
Landsat_8 2013 72.66 19.10 7.49 0.75
Landsat_8 2016 72.81 19.03 7.38 0.78
我使用的代码是:
table <- read.csv("results.csv", header=TRUE)
mtbl <- melt(table, id.vars="Acquisition_time", measure.vars = c("Land", "Sea", "Lagoon", "River"))
#draw a graph
ggplot(data=mtbl, aes(x= Acquisition_time, y=value, group=variable, colour=variable)) +
geom_line() +
geom_point( size=4, shape=21, fill="white") +
scale_x_continuous(name="Years", breaks = mtbl$Acquisition_time)
我应该添加什么来获得y轴上的离散值?我之前自动获得?
答案 0 :(得分:1)
它与您的值有关,是第一个示例中的一个因素,第二个示例中是连续值。这是一个可重复的例子:
Acquisition_time <- c(1992,1984,1988,1996,2000,2004,2008,2013,2016)
Land <- c(72.79,72.96,72.82,73.46,72.72,72.48,72.67,72.66,72.81)
Sea <- c(19.05,19.17,19.41,19.27,19.23,19.05,19.14,19.10,19.03)
Lagoon <- c(7.56,7.02,7.09,6.71,7.43,7.78,7.49,7.49,7.38)
River <- c(0.60,0.85,0.68,0.56,0.62,0.69,0.70,0.75,0.78)
table <- data.frame(Acquisition_time, Land, Sea, Lagoon, River)
library(tidyr)
library(dplyr)
library(ggplot2)
mtbl <- table %>% gather(variable, value, -Acquisition_time)
mtblfac <- mtbl %>% mutate(value = factor(value))
# with value as numeric
ggplot(data=mtbl, aes(x= Acquisition_time, y=value, group=variable, colour=variable)) +
geom_line() +
geom_point( size=4, shape=21, fill="white") +
scale_x_continuous(name="Years")
# with value as factor
ggplot(data=mtblfac, aes(x= Acquisition_time, y=value, group=variable, colour=variable)) +
geom_line() +
geom_point( size=4, shape=21, fill="white") +
scale_x_continuous(name="Years")
但是我会建议你使用facet和连续值,如下例所示,因为你保留了值之间的关系,而没有使它们成为绝对的。但是使用scales="free"
选项,您可以区分差异,就像您的第一个示例一样。
# with value as numeric and facets
ggplot(data=mtbl, aes(x= Acquisition_time, y=value, group=variable, colour=variable)) +
geom_line() +
geom_point( size=4, shape=21, fill="white") +
scale_x_continuous(name="Years") +
facet_grid(variable~., scales="free")