很抱歉,如果我的问题难以理解,并且无法以最佳方式呈现数据,但是我是一个完全新手,并且几天前才开始学习R。
我有一个数据框,其中包含2000年以来的所有网球比赛记录,带有“比赛”的变量; “日期”; “优胜者”; “失败者”; “ WRank”(获奖者排名); “ LRank”(失败者排名)。使用tidyverse,我创建了一个新的数据框,该数据框仅包含该代前五名网球运动员(费德勒,纳达尔,杰科维奇,穆雷,瓦林卡)打过的比赛
top5.data <- filter (full.data, Winner %in% c("Federer", "Nadal", "Djockovic", "Murray", "Wawrinka") | Loser %in% c("Federer", "Nadal", "Djockovic", "Murray", "Wawrinka"))
第一个目标是使用ggplot并使用此数据制作条形图。 5个小节,每个玩家一个,每个小节在x轴上都有相应玩家的名字,在y轴上,小节的高度由相应玩家拥有的比赛总数表示演奏。但是,我不确定如何进行。这是一种潜在的方法,尽管我不确定这是最好的方法还是可行的:
使用条件语句,用NA替换top5.data $ Winner和top5.data $ Loser中的观测值,除非观测值是前5名玩家中的任何一个(“ Federer”,“ Nadal”,“ Djockovic”,“ Murray ”,“ Wawrinka”)。然后,使用两个变量的合并数据(去掉NA)来绘制图形。有没有办法做到这一点?
ggplot(data = top5.data) + geom_bar(mapping = aes(x = Winner + Loser)
显然,上面的代码是不正确的,但是我只是想弄清楚谁在同一轴上使用两个类别变量的组合数据并删除NA值。
此外,我熟悉的唯一条件语句是ifelse,但是如果满足条件,我不会如何保持该值不变。
任何帮助将不胜感激。 谢谢