查找数据帧中数据之间的相关性(包括二进制)

时间:2019-04-12 19:36:08

标签: r

我有一个名为dolls.csv的数据集,我使用它导入了

copy selector

这是数据的片段

dolls <- read.csv("dolls.csv")

我正在尝试对此数据进行一些初步分析。名称是洋娃娃的名字,评论是1-10,年份是年份,其后的所有值都是二进制的,如果具有特征则为1,否则为0。

我跑了

Name  Review Year Strong Skinny Weak Fat Normal
Bell  3.5    1990   1      1      0    0    0
Jan   7.2    1997   0      0      1    0    1
Tweet 7.6    1987   1      1      0    0    0
Sall  9.5    2005   0      0      0    1    0

并获取标题,均值,最小值和最大值。

我正在尝试查看特征与年份之间的相关性,或者查看评分是否相关(例如,查看某些洋娃娃是否具有很高的评分但有不利的性格),不确定如何构造图表或在这种情况下使用什么功能?我正在考虑对离群值和均值的平均值进行ANOVA尾部测试,但不确定如何比较像这样的值(在python中,我会运行if-then语句,但我不知道如何在R中使用)。

这是我想要进行和提高R技能的个人研究。

谢谢!

0 个答案:

没有答案