我对航空公司航班数据集使用了Twitter情绪分析,它的一列称为否定结果,另一列称为航空公司名称。我需要知道如何计算负值列中“不良航班”值的重复次数,航空公司名称为“ Virgin America”,然后对“ Late Flight”和“ Virgin America”重复此步骤,然后在值之间进行比较选择更大的数字并将其用于绘图。
例如:
负面结果航空公司名称
维珍美国航空不良飞行
维珍美国航空不良飞行
维珍美国航空不良飞行
维珍美国航空晚间航班
维珍美国航空晚间航班
美联航不良
美联航行李损坏
美联航不良
后期联合飞行
后期联合飞行
维珍美国航空不良飞行
维珍美国航空不良飞行
维珍美国航空晚间航班
不良飞行的预期输出为5,延迟飞行的预期输出为3,因此在比较之后,不良飞行将是要绘制的值。
答案 0 :(得分:0)
如果您的数据框名为table(df)
,则可以执行dplyr
。
使用library(dplyr)
df %>%
filter(`Airline Name` == "Virgin America") %>%
group_by(`Negative Result`) %>%
summarize(n = n())
:
{{1}}