如何处理熊猫无法识别的空细胞?

时间:2019-03-29 23:32:33

标签: pandas dataframe

我正在使用nlp技术进行数据预处理。当我尝试从数据框中删除URL链接时,那些具有URL链接的行将变为空白条目或非ASCII字符。当我将数据框下载为csv时,这些空白在excel文件中可见。但是,当我实现以下代码

df.replace('', np.nan, inplace=True) OR
df['columnName'].replace('', np.nan, inplace=True)

此代码输出在数据帧中没有NULL或空值,但实际上存在。如何处理这种情况?我想删除所有这样的空行

1 个答案:

答案 0 :(得分:1)

您可以在str.strip之前先使用replace

df['columnName']=df['columnName'].str.strip().replace('',np.nan)

解决示例

s=pd.Series(['   ','llllll'])
s.str.strip().replace('',np.nan)
0       NaN
1    llllll
dtype: object