我希望在图表/图表中显示3个不同化妆品品牌之间的客户关系及其12个月的总支出。但我不确定我是否把所有栏目都弄好了,因为我从来没有制作过这种类型的情节,所以请求帮助。
计划在R中绘图。
我想我在问什么是正确的专栏和我应该做的情节类型?
我到目前为止的列是:
CUSTOMER_ID,Brand_Name_Column,12MONTH_SALES
谢谢!
答案 0 :(得分:1)
如果给出绘图函数1参数,它将构成一维条形图。
如果给出绘图函数2的值(必须是数值),它将给出一个标准的水平轴与垂直轴的代数图。
如果你给绘图功能3个值(2个数字,一个因子,那么你可以绘制点,但颜色外套标记它们)然后你让标签对用户显而易见。
使用R的内置数据集" Orange",您可以制作如下图:
> View(Orange)
> summary(Orange)
情节(橙色$年龄,橙色$周长,col =彩虹(5)[橙色$树],pch = 16,主要="通过周长关联树龄#34;,网格(nx = 25, ny = 25)) 传说(" topleft",title ="橘子树",填充=彩虹(5),等级(橙色$ Tree))
注意:彩虹(5)?为什么5?因为列树有1-5个因子。由于你有3个不同的化妆品品牌,你应该做彩虹(3)。
如果它有效,这就是你得到一个线性回归线的方法。您必须使用线性模型(lm)函数:
> model <- lm(Orange$circumference ~ Orange$age)
> summary(model)
> abline(model)
您还可以在网格库中使用xyplot。
> library(xyplot)
> xyplot(circumference ~ age| Tree, data = Orange, type = c("p", "g", "r"), main = "Plots of Orange Age vs Circumference for 5 Orange Trees")
我没有为我的观点涂上颜色,但我并不需要。虽然我喜欢这个情节,但我认为使用绘图功能的彩色涂层更适合进行统计判断,因为它将所有因素都放在同一个图表中。
问题:这些功能如何运作等?
>?plot
>?xyplot
>?Orange
scatterplot3d函数也很酷。你可以用它制作一个三维图,但你如何判断相关性会受到你的角度的影响&#34;您将视图设置为。
您还可以使用xyplot函数制作更酷的图形。一个具有每个因子的多个回归线。
>xyplot(circumference ~ age, data = Orange, groups = Tree, type = c("p", "g", "r"), main = "Plots of Orange Age vs Circumference for 5 Orange Trees", pch = 16, auto.key = TRUE)
我使用auto.key命令的传说非常可怕。它可以改进,我敢肯定!
如果你想绘制两个变量:一个数值变量和一个阶乘变量,你可以这样做:你使用tapply函数。在这里,我使用tapply函数来计算每棵树的所有圆周。然后使用barplot功能。这可能是你想到的。
> sum_table <- tapply(Orange$circumference, Orange$Tree, FUN = sum)
> sum_table <- sort.default(sum_table, decreasing = TRUE, na.last = NA)
> barplot(sum_table, xlab = "Trees", ylab = "Circumference", main = "Sum of Circumferences for all 5 Orange Trees", col = "dodgerblue1"))
好的,当一个数字变量与另一个因子变量一起列出时,不要将绘图函数默认为制作箱图。
> plot(Orange$Tree, Orange$circumference, main = "Boxplots of Orange Circumference vs Orange Trees", xlab = "Orange Trees", ylab = "Circumference")