我正在处理一个统计课的问题,该课使用了棒球队的数据,例如出勤率,赢/输以及棒球队的其他统计数据。问题陈述要求创建变量,以包括获胜球队(获胜81场或以上),失利球队(获胜81场以下)以及三个类别(少于200万,介于2-3百万之间)的出勤人数,超过300万。
原始数据按团队名称键入关键字,每行一个团队,然后每列中的统计信息。
然后我需要创建一个表格,其中包含这些维度上的团队数量的计数,例如:
Winning Season Low Attendance Med. Attendance High Attendance
Yes 3 12 3
No 2 10 2
我们可以使用任何想要完成它的工具,而我试图使用R和RStudio创建表,以便同时获得有关统计信息和R的知识。但是,我不知道如何实现它或使用哪些函数来创建具有这些合计数字的表。
我已经看过data.table和dplyr以及其他,但是我似乎无法弄清楚如何获取每个团队的计数。如果是SQL,我将能够
select count(*) from table where attend < 2000000 and wins < 81
,然后以编程方式创建表。我不知道如何在R中执行相同的操作。
谢谢您的帮助。