Question

我想帮助获得具有多个索引（或我认为是多个索引）的数据框中两组的比率。我在下面的字典中粘贴了数据框的一小部分。

我想要为值变量“ Tristeza Aparente”获得每个用户的“基础”组与“ t2”组的比率。因此，例如，对于用户21，该比率为4（基础为4，t2为1）。在此数据框中，每个用户都属于安慰剂组或治疗组，并且每个时间段都有两行。

因此，一个具体的问题是：如何为每个用户创建一个新列，以获取时间段之间的值之比？我对Pandas中的多索引有点陌生，还不太清楚如何获得组之间不同值的函数。我查看了有关此主题的其他Stackoverflow问题，而我的情况有所不同。（最终，我将通过比较安慰剂和治疗来进行分组，但现在我只希望能够获得每个用户的比率）。

谢谢，如果有任何疑问，请通知我！

{'01. Tristeza Aparente': {0: 4.0,
  1: 4.0,
  2: 4.0,
  4: 1.0,
  41: 4.0,
  42: 2.0,
  43: 4.0,
  44: 1.0},
 'groupedit': {0: 'placebo',
  1: 'placebo',
  2: 'placebo',
  4: 'placebo',
  41: 'treatment',
  42: 'treatment',
  43: 'treatment',
  44: 'treatment'},
 'subjectedit': {0: 1.0,
  1: 1.0,
  2: 2.0,
  4: 3.0,
  41: 20.0,
  42: 20.0,
  43: 21.0,
  44: 21.0},
 'testday': {0: 'Basal',
  1: 't2',
  2: 'Basal',
  4: 'Basal',
  41: 'Basal',
  42: 't2',
  43: 'Basal',
  44: 't2'}}

Answer 1

您可以通过用户使用名为pivot_table的{{1}}汇总数据，将piv和basal分为几列，以便可以将这些列名彼此分开得到想要的比例
然后，执行所需的计算
最后，将结果合并回原始数据框

t2

熊猫群体比例

1 个答案: