目前,我的情节看起来像这样:
我不喜欢x轴上有多奇怪的线条/条形。我怀疑这可能是因为ggplot无法适应x轴上的所有540000个观测值。以下是我用来绘制图表的代码:
data %>%
ggplot() +
geom_point(aes(x = dates_df$date, y = Quantity)) +
theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
labs(x = "Invoice Date", y = "Quantity", title = "Quantity vs Invoice Date")
我可以做些什么来消除/解决x轴上的这个混乱?
答案 0 :(得分:0)
正如在评论中所说的那样,在Date列中似乎有一个混乱,你使用了两个独立的数据框。首先加入数据。我假设他们两个都有一些Id或其他关键名称在列中:
library("dplyr")
left_join(data,dates_df,by="id")
日期也是提到的角色。要将其更改为Date,如果尚未执行此操作,请使用as.Date函数。加入后
data$date<- as.Date(data$date, "%m/%d/%Y")
您可以在此处找到其他日期格式:http://www.statmethods.net/input/dates.html
你说在x轴上有54万个观测值。我的建议是将图表分开,以获得独特的年份。为此,请在ggplot中使用facet_grid函数。
library(lubridate)
ggplot(df, aes(x= df$date,y= df$Quantity))+
geom_point() +
facet_grid(~year(df$date))
希望它有所帮助:)