我有.dta格式的数据集,其中包括棒球运动员的身高和体重。我想计算每个体重值的平均身高。 从我能够找到的,我可以使用dplyr和“group_by”,但我的R脚本无法识别该命令,尽管已经安装并调用了包。
谢谢!
答案 0 :(得分:1)
这是使用从UCLA SOCR MLB HeightsWeights数据集获得的棒球运动员身高和体重数据在基础R中编码的示例。
清理数据后(一名玩家缺少重量),我将其发布到GitHub,无需再次清理即可访问。
theCSVFile <- "https://raw.githubusercontent.com/lgreski/datasciencedepot/gh-pages/data/baseballPlayers.csv"
download.file(theCSVFile,"./data/baseballPlayers.csv",method="curl")
theData <- read.csv("./data/baseballPlayers.csv",header=TRUE,stringsAsFactors=FALSE)
aggData <- aggregate(HeightInInches ~ WeightInPounds,mean,
data=theData)
head(aggData)
...输出为:
> head(aggData)
WeightInPounds HeightInInches
1 150 70.75000
2 155 69.33333
3 156 75.00000
4 160 71.46667
5 163 70.00000
6 164 73.00000
>
的问候,
Len