所以我制作了一个大型的csv文件,其中包含有关汽车型号的信息,其中有些行是这样的:
101 | land rover 90 2.5 td 4X4 | 148 | 1 | 0.68 | 0.0068 | 0 | 35
101 | land rover 90 2.5 td 4X4 | 148 | 1 | 0.68 | 0.0068 | 9 | 0
我想在第二列(名称)上合并这些行,输出必须如下所示:
101 | land rover 90 2.5 td 4X4 | 148 | 1 | 0.68 | 0.0068 | 9 | 35
我尝试制作一个熊猫数据框并使用groupby函数,但它似乎无法正常工作。任何帮助表示赞赏。
答案 0 :(得分:0)
尝试一下:
import pandas as pd
df = pd.DataFrame([
[101,'land rover 90 2.5 td 4X4', 148, 1, 0.68, 0.0068, 0, 35 ],
[101, 'land rover 90 2.5 td 4X4', 148, 1, 0.68, 0.0068, 9, 0],
],
columns=["col1","col2","col3","col4","col5","col6","col7","col8"])
df_new = df.groupby('col1', as_index=False).max()
答案 1 :(得分:0)
在将两列进行分组后,我尝试对它们进行sum()运算,但这没有用。 max()完成了工作。