如何在Pandas.read_csv中指定自定义解析器?

时间:2019-06-11 19:23:21

标签: python pandas csv

我需要在Pandas中打开file.csv。为此,我可以使用pd.read_csv('file.csv')

问题是文件格式不正确:

a b   c
1 2   5
3 4   6

第一个定界符为1个空格,第二个定界符为3个空格。

我在熊猫文档中找不到有关如何执行此操作的方法。

我可以预先处理文件,将其转换为StringIO并用熊猫打开,但是对我来说似乎有点黑。

with open('file.csv', 'r') as f:
    text = f.read()
    text = text.replace('   ', ' ')
    text = StringIO(text)
    df = pd.read_csv(text)

如何直接用熊猫来做到这一点?

1 个答案:

答案 0 :(得分:1)

您尝试过pd.read_csv('file.csv', sep='\s+')吗?