个别X值的平均值Y.

时间:2017-11-25 16:15:06

标签: r statistics

我有.dta格式的数据集,其中包括棒球运动员的身高和体重。我想计算每个体重值的平均身高。 从我能够找到的,我可以使用dplyr和“group_by”,但我的R脚本无法识别该命令,尽管已经安装并调用了包。

谢谢!

1 个答案:

答案 0 :(得分:1)

这是使用从UCLA SOCR MLB HeightsWeights数据集获得的棒球运动员身高和体重数据在基础R中编码的示例。

清理数据后(一名玩家缺少重量),我将其发布到GitHub,无需再次清理即可访问。

theCSVFile <- "https://raw.githubusercontent.com/lgreski/datasciencedepot/gh-pages/data/baseballPlayers.csv"
download.file(theCSVFile,"./data/baseballPlayers.csv",method="curl")
theData <- read.csv("./data/baseballPlayers.csv",header=TRUE,stringsAsFactors=FALSE)
aggData <- aggregate(HeightInInches ~ WeightInPounds,mean,
                 data=theData)
head(aggData)

...输出为:

> head(aggData)
  WeightInPounds HeightInInches
1            150       70.75000
2            155       69.33333
3            156       75.00000
4            160       71.46667
5            163       70.00000
6            164       73.00000
> 

的问候,

Len