情节需要什么数据? [R

时间:2017-03-15 19:36:22

标签: r plot information-extraction

我希望在图表/图表中显示3个不同化妆品品牌之间的客户关系及其12个月的总支出。但我不确定我是否把所有栏目都弄好了,因为我从来没有制作过这种类型的情节,所以请求帮助。

计划在R中绘图。

我想我在问什么是正确的专栏和我应该做的情节类型?

我到目前为止的列是:

CUSTOMER_ID,Brand_Name_Column,12MONTH_SALES

谢谢!

1 个答案:

答案 0 :(得分:1)

如果给出绘图函数1参数,它将构成一维条形图。

如果给出绘图函数2的值(必须是数值),它将给出一个标准的水平轴与垂直轴的代数图。

如果你给绘图功能3个值(2个数字,一个因子,那么你可以绘制点,但颜色外套标记它们)然后你让标签对用户显而易见。

使用R的内置数据集" Orange",您可以制作如下图:

> View(Orange)
> summary(Orange)
  

情节(橙色$年龄,橙色$周长,col =彩虹(5)[橙色$树],pch = 16,主要="通过周长关联树龄#34;,网格(nx = 25, ny = 25))   传说(" topleft",title ="橘子树",填充=彩虹(5),等级(橙色$ Tree))

注意:彩虹(5)?为什么5?因为列树有1-5个因子。由于你有3个不同的化妆品品牌,你应该做彩虹(3)。

如果它有效,这就是你得到一个线性回归线的方法。您必须使用线性模型(lm)函数:

> model <- lm(Orange$circumference ~ Orange$age)
> summary(model)
> abline(model) 

Plot Function with grid and regression line

您还可以在网格库中使用xyplot。

> library(xyplot)
> xyplot(circumference ~ age| Tree, data = Orange, type = c("p", "g", "r"), main = "Plots of Orange Age vs Circumference for 5 Orange Trees")

xyplot 3 variable plot

我没有为我的观点涂上颜色,但我并不需要。虽然我喜欢这个情节,但我认为使用绘图功能的彩色涂层更适合进行统计判断,因为它将所有因素都放在同一个图表中。

问题:这些功能如何运作等?

>?plot
>?xyplot
>?Orange 

scatterplot3d函数也很酷。你可以用它制作一个三维图,但你如何判断相关性会受到你的角度的影响&#34;您将视图设置为。

您还可以使用xyplot函数制作更酷的图形。一个具有每个因子的多个回归线。

>xyplot(circumference ~ age, data = Orange, groups = Tree, type = c("p", "g", "r"), main = "Plots of Orange Age vs Circumference for 5 Orange Trees", pch = 16, auto.key = TRUE)

enter image description here

我使用auto.key命令的传说非常可怕。它可以改进,我敢肯定!

如果你想绘制两个变量:一个数值变量和一个阶乘变量,你可以这样做:你使用tapply函数。在这里,我使用tapply函数来计算每棵树的所有圆周。然后使用barplot功能。这可能是你想到的。

> sum_table <- tapply(Orange$circumference, Orange$Tree, FUN = sum)
> sum_table <- sort.default(sum_table, decreasing = TRUE, na.last = NA)
> barplot(sum_table, xlab = "Trees", ylab = "Circumference", main = "Sum of Circumferences for all 5 Orange Trees", col = "dodgerblue1"))

barplot_of_sums

好的,当一个数字变量与另一个因子变量一起列出时,不要将绘图函数默认为制作箱图。

> plot(Orange$Tree, Orange$circumference, main = "Boxplots of Orange Circumference vs Orange Trees", xlab = "Orange Trees", ylab = "Circumference")

Wow! Rplot makes barplots