Question

有人知道我为什么收到此unicode错误。我正在尝试从csv文件中删除重复项。

import pandas as pd
df = pd.read_csv('new.csv', usecols=['minzoom', 'maxzoom']).drop_duplicates(keep='first').reset_index()
file_name = "C:\Users\kziaj\Desktop\Python Test\newno.csv"
df.to_csv("newno.csv", index=False) # you don't need to set sep in this because to_csv makes it comma delimited.

Answer 1

似乎您的csv文件中包含一些非ASCII字符。我尝试了您的代码，但效果很好。只需尝试创建一个新的csv文件并尝试

new.csv

name,number
aa,1
ab,1
aa,1
ab,2
aa,34
ab,1
ab,25
asd,123
asd,11
aa,1
ab,1
aa,1
ab,2
aa,34
ab,1
ab,25
asd,123
asd,11
aa,1
ab,1
aa,1
ab,2
aa,34
ab,1
ab,25
asd,123
asd,11

然后我运行了您的代码

import pandas as pd
df = pd.read_csv('new.csv').drop_duplicates(keep='first').reset_index()
print(df)
df.to_csv("newno.csv", index=False)

输出为

newno.csv

index,name,number
0,aa,1
1,ab,1
3,ab,2
4,aa,34
6,ab,25
7,asd,123
8,asd,11

Answer 2

该错误表明您的文件路径无效。具体来说，python将单个反斜杠视为转义符，而不是路径分隔符，这是Windows上python编程中的常见错误。为避免这种情况，请使用双反斜杠或原始字符串。

双反斜杠

file_name = "C:\\Users\\kziaj\\Desktop\\Python Test\\newno.csv"

原始字符串

file_name = r"C:\Users\kziaj\Desktop\Python Test\newno.csv"

Python SyntaxError：（unicode错误）“ unicodeescape”编解码器无法解码位置2-3中的字节：截断的\ UXXXXXXXX escap

2 个答案: