我有一个列df
的熊猫数据框Name
。我做到了:
for name in df['Name'].unique ():
X = df[df['Name'] == name]
print (X.head())
但是X包含各种不同的Name
,而不是我想要的唯一名称。
我做错了什么?
非常感谢
答案 0 :(得分:0)
您可能不想在循环的每次迭代中都覆盖X
,而只保留包含df['Name'].unique()
的最后一个值的数据帧。
根据您的数据和目标,您可能希望按照jezrael的建议使用groupby
,或者执行类似df[~df['Name'].duplicated()]
的操作。