我有可用的代码,但没有标题就给我数据,有没有办法我可以编写此代码,以便不删除标题?我知道一种方法是添加标头,但是还有更好的方法吗?
我的代码:
df = pd.read_csv(“_data.csv",skiprows=[0], header=None)
df = df.groupby([2])[10].sum().astype(float)
数据:
A B
1 2
1 1
2 3
2 4
我有类似上面的数据试图得到这个结果:
A B
1 3
2 7
答案 0 :(得分:0)
您应该指定分隔符(在您的情况下为几个空格),并且标题是第一行(使用python索引时为0),而不是根据所需的列进行分组。
df = pd.read_csv("_data.csv", sep='\s*', header=0)
A B
0 1 2
1 1 1
2 2 3
3 2 4
df = df.groupby(['A']).sum()
B
A
1 3
2 7
答案 1 :(得分:0)
尝试在总和后使用函数reset_index
:
data = [{'a': 1, 'b': 2},{'a': 1, 'b': 1},{'a': 2, 'b': 3},{'a': 2, 'b': 4}]
df = pd.DataFrame(data)
df
a b
0 1 2
1 1 1
2 2 3
3 2 4
df.groupby('a').sum().reset_index()
a b
0 1 3
1 2 7