如何在pandas中读取带有分号分隔符的文件

时间:2014-07-07 08:39:49

标签: python csv pandas

我使用pandas在python中导入.csv文件。

以下是.csv

的文件格式
a1;b1;c1;d1;e1;...
a2;b2;c2;d2;e2;...   
.....

这是如何得到它:

from pandas import *
csv_path = "C:...."
data = read_csv(csv_path)

现在,当我打印文件时,我得到了:

0  a1;b1;c1;d1;e1;...
1  a2;b2;c2;d2;e2;...   

等等......所以我需要帮助来阅读文件并将值拆分为列,使用半色字符;

2 个答案:

答案 0 :(得分:26)

read_csv需要sep个参数,在您的情况下只需通过sep=';'

data = read_csv(csv_path, sep=';')

在您的情况下失败的原因是默认值为',',因此它将所有列作为单个列条目进行了搜索。

答案 1 :(得分:0)

针对上述莫里斯的问题: “有没有办法以编程方式判断CSV是否以或分隔;?”

这将告诉您:

import pandas as pd

df_comma = pd.read_csv(your_csv_file_path, nrows=1,sep=",")
df_semi = pd.read_csv(your_csv_file_path, nrows=1, sep=";")
if df_comma.shape[1]>df_semi.shape[1]:
    print("comma delimited")
else:
    print("semicolon delimited")