我有以下数据(在csv文件中)
product release_after_issue release_before_issue
P1 40
P1 100
P1 10
P2 50
P2 300
P2 200
P3 10
P3 20
P3 300
我想使用框图来显示基于release_after_issue
和release_before_issue
的每个产品发布的天数分布(P1,P2等)。 x轴是产品名称,y轴是天。
我现在面临的问题是:每列中的空值以及日期的大数字。
我如何将y轴的天数标准化为月份(易于阅读)?我希望每个产品(Ps)都有自己的箱形图,基于列的数据(release_after_issue
或release_before_issue
)
我试图省略NA值并绘制测试示例,但它不起作用
data <- read.csv("commons-fileupload.csv")
ggplot(data[!is.na(data$release_after_issue),],aes(x=product,y=release_after_issue))
+ geom_point()
任何帮助!