我有以下文件:
"j"; "x"; y
"0"; "1"; 5
"1"; "2"; 6
"2"; "3"; 7
"3"; "4"; 8
"4"; "5"; 3
"5"; "5"; 4
我读到的是:
df = pd.read_csv('test.csv', delimiter='; ', engine='python')
然后我打印print df
并看到:
"j" "x" y
0 "0" "1" 5
1 "1" "2" 6
2 "2" "3" 7
3 "3" "4" 8
4 "4" "5" 3
5 "5" "5" 4
相反,我想看看:
j x y
0 0 1 5
1 1 2 6
2 2 3 7
3 3 4 8
4 4 5 3
5 5 5 4
如何删除双引号?
答案 0 :(得分:3)
我是这样做的:
rm_quote = lambda x: x.replace('"', '')
df = pd.read_csv('test.csv', delimiter='; ', engine='python',
converters={'\"j\"': rm_quote,
'\"x\"': rm_quote})
df = df.rename(columns=rm_quote)
答案 1 :(得分:2)
您可以将类型作为参数传递给.errors input, .errors select, .errors textarea {
border: 1px solid #c11;
}
函数。
read_csv
您可以在read_csv
中阅读更多内容此外,您可以使用to_numeric功能。
pd.read_csv('test.csv', delimiter='; ', engine='python', dtype=np.float32)
答案 2 :(得分:0)
使用str.replace
。
如果要更新DataFrame上的列,例如
假设您要删除第一列中的双引号。
只需执行以下操作
df[0] = df[0].str.replace(r"[\"]", '')
这是最终结果