我正在将文件读取到数据帧中,并且看到许多列包含“ nan”字符串。我在适当的地方使用了
data[['price','age']].apply(pd.to_numeric, errors='coerce')
但是还有其他包含“字符串”值的列。
我尝试了以下操作,但没有成功。
data['address'].replace('nan', '')
如何将包含字符串的列中的“ nan”值转换为NaN或空字符串或N / A。基本上是一些值,可以方便我检查是否存在值。
编辑:包括最少的可验证代码
import pandas as pd
import numpy as np
dict = {'col-a': ['value-a', 'nan', 'nan'],
'col-b': ['34', '35', '36'],
'col-c': ['24', '25', '26']}
df = pd.DataFrame(dict)
print(df,"\n")
df[['col-b','col-c']] = df[['col-b','col-c']].apply(pd.to_numeric, errors='coerce')
# does not work
df.replace('nan','')
# does not work
df.replace('nan',np.nan)
print(df,"\n")