在R

时间:2019-05-15 15:10:49

标签: r

我正在处理一个统计课的问题,该课使用了棒球队的数据,例如出勤率,赢/输以及棒球队的其他统计数据。问题陈述要求创建变量,以包括获胜球队(获胜81场或以上),失利球队(获胜81场以下)以及三个类别(少于200万,介于2-3百万之间)的出勤人数,超过300万。

原始数据按团队名称键入关键字,每行一个团队,然后每列中的统计信息。

然后我需要创建一个表格,其中包含这些维度上的团队数量的计数,例如:

Winning Season    Low Attendance  Med. Attendance  High Attendance  
Yes               3               12               3
No                2               10               2

我们可以使用任何想要完成它的工具,而我试图使用R和RStudio创建表,以便同时获得有关统计信息和R的知识。但是,我不知道如何实现它或使用哪些函数来创建具有这些合计数字的表。

我已经看过data.table和dplyr以及其他,但是我似乎无法弄清楚如何获取每个团队的计数。如果是SQL,我将能够

select count(*) from table where attend < 2000000 and wins < 81 

,然后以编程方式创建表。我不知道如何在R中执行相同的操作。

谢谢您的帮助。

0 个答案:

没有答案