pandas有什么理由在update中将列的类型从int更改为float,我可以阻止它执行吗?以下是问题的一些示例代码
import pandas as pd
import numpy as np
df = pd.DataFrame({'int': [1, 2], 'float': [np.nan, np.nan]})
print('Integer column:')
print(df['int'])
for _, df_sub in df.groupby('int'):
df_sub['float'] = float(df_sub['int'])
df.update(df_sub)
print('NO integer column:')
print(df['int'])
答案 0 :(得分:4)
原因如下:由于您实际上屏蔽了列上的某些值并替换它们(使用您的更新),因此某些值可能会变为`nan
在整数数组中这是不可能的,因此数字dtypes被先验地转换为float(为了效率),因为首先检查比这更加昂贵
更改dtype是可能的......现在不在代码中,因此这是一个错误(虽然修复有点不重要):github.com/pydata/pandas/issues/4094