我有一个要导入的txt文件,但数据包含L\E9on
之类的字符,它转换为Léon
。如何在熊猫中导入此类数据?我尝试将编码用作utf-8
和raw_unicode_escape
。仍然会显示错误multiple repeat at position 2
。
答案 0 :(得分:0)
要处理带重音符号,请尝试encoding='iso-8859-1'
。
答案 1 :(得分:0)
有趣!!!
为重现此问题,我创建了包含由您指定的文本组成的伪数据并将其保存为.txt文件
使用 read_csv 方法
,我可以将此txt文件内容导入到 pandas 数据框中,而不会出现任何问题。df = pd.read_csv('spcl.txt')