pandas对于带有基数为10的long()的文字无效

时间:2016-08-12 13:01:53

标签: python pandas dataframe casting int

我正在尝试:df['Num_Detections'] = df['Num_Detections'].astype(int)

我得到以下错误:

  

ValueError:long()的基数为10的文字无效:' 12.0'

我的数据看起来如下:

>>> df['Num_Detections'].head()
Out[6]: 
sku_name
DOBRIY MORS GRAPE-CRANBERRY-RASBERRY 1L     12.0
AQUAMINERALE 5.0L                            9.0
DOBRIY PINEAPPLE 1.5L                        2.0
FRUKT.SAD APPLE 0.95L                      154.0
DOBRIY PEACH-APPLE 0.33L                    71.0
Name: Num_Detections, dtype: object

知道如何正确进行转换吗?

感谢您的帮助。

1 个答案:

答案 0 :(得分:19)

有一些值,无法转换为int

您可以使用to_numeric并获取有价值的NaN

df['Num_Detections'] = pd.to_numeric(df['Num_Detections'], errors='coerce')

如果需要检查有问题值的行,请使用带boolean indexing掩码的isnull

print (df[ pd.to_numeric(df['Num_Detections'], errors='coerce').isnull()])

样品:

df = pd.DataFrame({'Num_Detections':[1,2,'a1']})

print (df)
  Num_Detections
0              1
1              2
2             a1

print (df[ pd.to_numeric(df['Num_Detections'], errors='coerce').isnull()])
  Num_Detections
2             a1

df['Num_Detections'] = pd.to_numeric(df['Num_Detections'], errors='coerce')
print (df)
   Num_Detections
0             1.0
1             2.0
2             NaN