我觉得dplyr应该很简单(我认为),但是我似乎找不到解决方法。
我的数据框包含数字和因子。每个观测值由两行表示,这两行在两列(Agg_Entropy和Av_Amplitude)之一中具有值或NA。我想将每个观察值的行合并为一行(不进行汇总),以便将NA替换为相关值。
数据框的简单摘录:
Selection Low High Agg_Entropy Av_Amplitude Filename
<fct> <fct> <fct> <dbl> <dbl> <fct>
1 1 368.2 13747.8 NA -17.5 20180110_182800_Sunset.wav
2 1 368.2 13747.8 5.62 NA 20180110_182800_Sunset.wav
3 2 142 13926.3 NA -17.4 20180110_182800_Sunset.wav
4 2 142 13926.3 5.96 NA 20180110_182800_Sunset.wav
我想要什么:
Selection Low High Agg_Entropy Av_Amplitude Filename
1 1 368.2 13747.8 5.623 -17.5 20180110_182800_Sunset.wav
2 2 142.0 13926.3 5.958 -17.4 20180110_182800_Sunset.wav
非常感谢您的帮助。谢谢!
答案 0 :(得分:2)
在group_by
的“选择”,“文件名”,“低”和“高”列之后,通过删除{{1}的summarise
元素,NA
其他列}。在这里,我们假设组的每一列只有一个非NA元素
na.omit