我正在尝试:df['Num_Detections'] = df['Num_Detections'].astype(int)
我得到以下错误:
ValueError:long()的基数为10的文字无效:' 12.0'
我的数据看起来如下:
>>> df['Num_Detections'].head()
Out[6]:
sku_name
DOBRIY MORS GRAPE-CRANBERRY-RASBERRY 1L 12.0
AQUAMINERALE 5.0L 9.0
DOBRIY PINEAPPLE 1.5L 2.0
FRUKT.SAD APPLE 0.95L 154.0
DOBRIY PEACH-APPLE 0.33L 71.0
Name: Num_Detections, dtype: object
知道如何正确进行转换吗?
感谢您的帮助。
答案 0 :(得分:19)
有一些值,无法转换为int
。
您可以使用to_numeric
并获取有价值的NaN
:
df['Num_Detections'] = pd.to_numeric(df['Num_Detections'], errors='coerce')
如果需要检查有问题值的行,请使用带boolean indexing
掩码的isnull
:
print (df[ pd.to_numeric(df['Num_Detections'], errors='coerce').isnull()])
样品:
df = pd.DataFrame({'Num_Detections':[1,2,'a1']})
print (df)
Num_Detections
0 1
1 2
2 a1
print (df[ pd.to_numeric(df['Num_Detections'], errors='coerce').isnull()])
Num_Detections
2 a1
df['Num_Detections'] = pd.to_numeric(df['Num_Detections'], errors='coerce')
print (df)
Num_Detections
0 1.0
1 2.0
2 NaN