我正在尝试使用$$
作为分隔符导入pandas中的csv,我希望以下命令可以正常工作:
pd.read_csv('data.csv', delimiter="$$")
然而,这会返回以下错误:
回到' python'引擎,因为' c'发动机没有 支持正则表达式分隔符(分隔符> 1个字符,不同于' \ s +' 被解释为正则表达式,但这导致' error_bad_lines'成为 被忽略,因为它不支持' python'发动机。
这项行动甚至可以在熊猫中使用吗?
答案 0 :(得分:3)
您可以$
之前逃离\
:
df = pd.read_csv('data.csv', sep="\$\$", engine='python')
样品:
import pandas as pd
from pandas.compat import StringIO
temp=u"""a$$b
a$$1
s$$2
f$$3"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep="\$\$", engine='python')
print (df)
a b
0 a 1
1 s 2
2 f 3