library(tidyr)
df1 %>% complete(ID, nesting(Value=full_seq(Value,1)))

# A tibble: 10 x 3
  ID    Value  freq
  <fct> <dbl> <dbl>
  1 A        1.    1.
  2 A        2.   NA 
  3 A        3.   NA 
  4 A        4.   NA 
  5 A        5.    5.
  6 B        1.   NA 
  7 B        2.    3.
  8 B        3.   NA 
  9 B        4.   NA 
 10 B        5.    3.

Answer 2

使用data.table：

library(data.table)
setDT(df1) 
setkey(df1, ID, Value)

df1[CJ(ID = c("A", "B"), Value = 1:5)]

    ID Value freq
 1:  A     1    1
 2:  A     2   NA
 3:  A     3   NA
 4:  A     4   NA
 5:  A     5    5
 6:  B     1   NA
 7:  B     2    3
 8:  B     3   NA
 9:  B     4   NA
10:  B     5    3

Answer 3

以下方法对您有用吗？

with(data = df1,
     expr = {
         data.frame(Value = rep(wrapr::seqi(min(Value), max(Value)), length(unique(ID))),
                    ID = unique(ID))
     }) %>%
    left_join(y = df1,
              by = c("ID" = "ID", "Value" = "Value")) %>%
    arrange(ID, Value)

结果

   Value ID freq
1      1  A    1
2      2  A   NA
3      3  A   NA
4      4  A   NA
5      5  A    5
6      1  B   NA
7      2  B    3
8      3  B   NA
9      4  B   NA
10     5  B    3

如果我正确地遵循了您的示例，则您的 ID 组的取值范围是1到5。如果是这种情况，我的方法是生成读取的唯一组合都来自原始数据帧。
从原始数据帧携带的唯一变量是 freq ，该变量可能/可能不适用于给定的标准 ID-Value 。我将通过left_join （您似乎喜欢tidyverse）加入该变量
- 在您的示例中，您有 freq 变量，其值分别为1,3,5，但是在示例中，您列出了1,2,5？在我的示例中，我选择了原始的 freq 并退出了。如果您打算这样做，则可以使用普通的dplyr管道对其进行进一步的修改。

通过具有不同ID值的列扩展R中的数据框

3 个答案:

结果

评论