我有一个名为dolls.csv的数据集,我使用它导入了
copy selector
这是数据的片段
dolls <- read.csv("dolls.csv")
我正在尝试对此数据进行一些初步分析。名称是洋娃娃的名字,评论是1-10,年份是年份,其后的所有值都是二进制的,如果具有特征则为1,否则为0。
我跑了
Name Review Year Strong Skinny Weak Fat Normal
Bell 3.5 1990 1 1 0 0 0
Jan 7.2 1997 0 0 1 0 1
Tweet 7.6 1987 1 1 0 0 0
Sall 9.5 2005 0 0 0 1 0
并获取标题,均值,最小值和最大值。
我正在尝试查看特征与年份之间的相关性,或者查看评分是否相关(例如,查看某些洋娃娃是否具有很高的评分但有不利的性格),不确定如何构造图表或在这种情况下使用什么功能?我正在考虑对离群值和均值的平均值进行ANOVA尾部测试,但不确定如何比较像这样的值(在python中,我会运行if-then语句,但我不知道如何在R中使用)。
这是我想要进行和提高R技能的个人研究。
谢谢!