Question

我有这样的df（测试）

现在，如果您查看数据，则第二个周期可以使用6到10个组合，而第一个周期则不可用。因此，当我使用此代码

a_summary <- test %>%
  group_by(from, to) %>%
  summarize(avg = mean(share, na.rm = T)) %>%
  ungroup() %>%
  spread(from, avg, fill = 0)

输出是这样的

现在，看10至6个单元格。因为只有10到6种组合存在一次，所以它的值为1。但是，当我计算平均值时，我想考虑每个时期的所有组合。因此，该10到6个单元格的预期结果为.5，总矩阵列和行总和应为1。

Answer 1

a_summary <- test %>%
group_by(from, to) %>%
summarize(count = sum(n, na.rm = T)) %>%
ungroup() %>%
spread(from, count, fill = 0)

这将为您提供所有组合的所有计数。现在您可以用除以sum(test$n)或使用prop.table()

来归一化该矩阵。