我有一个数据框,其中的列包含一堆手动输入的文本,其中一些包含各种转义字符。
目前,有几行输出会创建一个新行。导致问题最多的是文本中间和末尾的<br/>
。我正在寻找足够的文本以便不创建新行
EDIT 这里有一些导致问题的字符串示例
Example<br/>
Example sentence (number two)\r<br/>That caused an issue
答案 0 :(得分:1)
尝试使用read_csv的转换器,根据您的需要调整以下示例:
def remove_br(x):
return x.replace('<br \>','')
convert_dict = {'col_name':remove_br}
df = pd.read_csv('file.csv', converters=converter_dict)