我正在使用Lending Club贷款数据的测试数据集,并尝试使用该集创建一些分析。
将csv加载到数据框后,我只想在整个funding_amnt列上做一个简单的求和。即使整个集合中没有负数,我仍然会收到总金额的负数。怎么会这样?
In[ ]: loans_df['funded_amnt'].sum()
Out[ ]: -1925852142
In[ ]: len(loans_df[loans_df['funded_amnt']<0])
Out[ ]: 0
答案 0 :(得分:0)
这可能是一个溢出问题。但如果没有[mcve],很难分辨......
示例:
pd.DataFrame([2**61]*2).sum()
Out[345]:
0 4611686018427387904
dtype: int64
pd.DataFrame([2**61]*3).sum()
Out[346]:
0 6917529027641081856
dtype: int64
pd.DataFrame([2**61]*4).sum()
Out[347]:
0 -9223372036854775808
dtype: int64
pd.DataFrame([2**61]*5).sum()
Out[348]:
0 -6917529027641081856
dtype: int64