我正在使用nlp技术进行数据预处理。当我尝试从数据框中删除URL链接时,那些具有URL链接的行将变为空白条目或非ASCII字符。当我将数据框下载为csv时,这些空白在excel文件中可见。但是,当我实现以下代码
df.replace('', np.nan, inplace=True) OR
df['columnName'].replace('', np.nan, inplace=True)
此代码输出在数据帧中没有NULL或空值,但实际上存在。如何处理这种情况?我想删除所有这样的空行
答案 0 :(得分:1)
您可以在str.strip
之前先使用replace
df['columnName']=df['columnName'].str.strip().replace('',np.nan)
解决示例
s=pd.Series([' ','llllll'])
s.str.strip().replace('',np.nan)
0 NaN
1 llllll
dtype: object