我有一个大型的pandas数据框,用于存储密钥,值对,主要组和一组辅助组。
from random import randint
while 1:
numA = randint(0,9)
numB = randint(0,9)
result = numA * numB
print("\nFirst number:", numA)
print("Second number:", numB)
while 1:
try:
userResult = int(input("Insert your multiplication result: "))
break
except:
print("Error! The given digit is not a number. Retry :")
if userResult == result:
print("Bravo! That's right!")
else:
print("Damn! That's wrong!")
我想获得每个辅助组的每个密钥的平均值。
如果使用主要组,这将很简单:
key | value | primary_group | secondary_groups
height 10 1 set(["B","C"])
width 9 1 set(["A","C"])
width 9 2 set(["B","A"])
etc.
但对于次要群体我很难过 - 最简单的方法似乎是将其标准化并重复每个次要群组的每一行:
df.groupby(["key","primary_group"]).mean()
但这似乎是一种非常浪费的方式 - 我不确定我的数据是否会以这种格式存储在内存中。