我正在新墨西哥州处理气候资料,我是R新手。我试图用手段替换NA,但我的df中有37个不同的站点。我想要DF $ STATION.NAME(在第1列中)唯一的列的方法。我不能使用来自一个地方的数据来找到另一个地方的平均值......显然。所以每个月我都应该为每个站点设定一个平均值。
我的数据在第1列中由station.name垂直组织,在下面的列中按月jan-dec读取,包括末尾的总列(右)。读数或观察结果是每个月的每个站点,在几年内(每个新年的新行列出的站点名称。)
我需要在给定的station.name中用给定月份的CLDD的总和替换NAs,我该怎么办?
答案 0 :(得分:0)
尝试在https://stats.stackexchange.com/上提出这个问题(正如statistics标记所建议的那样),那里的R用户可能比一般编程网站上的用户多。我还在您的问题中添加了r标记。
将数据拆分为月份子集,在那里填充缺失值,然后将它们重新组合成一个大矩阵,没有任何问题!
另见: Replace mean or mode for missing values in R
请注意,通过平均值,中位数或模式填充缺失值的常见做法很受欢迎,但可能会淡化您的结果,因为这显然会减少差异。除非你有一个强有力的物理论证,为什么以及如何插入缺失值,如果你能找到一种可以直接处理缺失值的方法,那将更加优雅。