想象一下以下DF:
data = {'Person': ['A', 'A', 'B', 'B', 'C', 'C', 'C', 'C', 'C'], 'Field': ['Age', 'Weight', 'Age', 'Height', 'Height', 'year', 'month', 'day', 'city']}
df = pd.DataFrame(data)
Field Person
Age A
Weight A
Age B
Height B
Height C
year C
month C
day C
city C
想象一下,我想减少从每个人那里获取字段所需的查询次数。所以我先把A和B放在一个房间里,问他们的年龄,然后我会问他的身高,然后我可以得到B& C并询问他们的身高,最后向C询问所有剩余的田地。
这可能听起来比单独询问A,B和C更复杂。但想象一下我有:
Field Person
Age A
Age B
Height B
Height B
year B
month B
Age C
Height C
Height C
year C
month C
这里很清楚,向每个人询问这些信息的效果要比将年龄A,B和C以及B和C的身高,体重,年和月要求更低。
我可以想到以编程方式执行此操作的许多方法,但想知道什么是最有效的方法。