在包含字符串的熊猫数据框中将字符串“ nan”转换为numpy NaN

时间:2018-10-23 07:46:32

标签: python-3.x pandas dataframe

我正在将文件读取到数据帧中,并且看到许多列包含“ nan”字符串。我在适当的地方使用了

data[['price','age']].apply(pd.to_numeric, errors='coerce')

但是还有其他包含“字符串”值的列。

我尝试了以下操作,但没有成功。

data['address'].replace('nan', '')

如何将包含字符串的列中的“ nan”值转换为NaN或空字符串或N / A。基本上是一些值,可以方便我检查是否存在值。

编辑:包括最少的可验证代码

import pandas as pd
import numpy as np
dict = {'col-a': ['value-a', 'nan', 'nan'],
        'col-b': ['34', '35', '36'],
        'col-c': ['24', '25', '26']}

df = pd.DataFrame(dict)
print(df,"\n")
df[['col-b','col-c']] = df[['col-b','col-c']].apply(pd.to_numeric, errors='coerce')
# does not work
df.replace('nan','')
# does not work
df.replace('nan',np.nan)
print(df,"\n")

0 个答案:

没有答案