我想在具有两个因素的数据集中运行t检验:我已经做到了这一点,但没有消除异常值。
我的想法是使用1.5 * IQR标准删除值。我无法弄清楚如何按照非典型方式(?)进行操作。
这是我所拥有的:
wallSize %>%
select(Time, A, B) %>%
gather(key = variable, value = value, -A, -B) %>%
group_by(A, B, variable) %>%
summarise(value = list(value)) %>%
spread(A, value) %>%
group_by(variable) %>%
mutate(p_value = t.test(unlist(True), unlist(False), paired=TRUE)$p.value,
t_value = t.test(unlist(True), unlist(False), paired=TRUE)$statistic)))
我认为我应该分别散布6个列表中的每一个之后的异常值,但是我不知道如何... R大师的任何建议?
欢呼
编辑:样本数据
分组之前head
的帧:
Display Change Comp TargetType TotalTime SelectionTime Score
<chr> <chr> <chr> <int> <dbl> <dbl> <int>
1 Wall Shape False 1 62.2 53.7 4
2 Wall Shape False 2 14.1 12.6 5
3 Wall Shape True 0 26.3 23.0 5
4 Wall Shape True 0 20.3 14.7 5
5 Wall Shape True 1 23.3 21.6 5
6 Wall Shape False 2 6.55 5.17 5
分组后:
TargetType variable False True
<int> <chr> <list> <list>
1 0 SelectionTime <dbl [28]> <dbl [28]>
2 1 SelectionTime <dbl [28]> <dbl [28]>
3 2 SelectionTime <dbl [28]> <dbl [28]>