如何更改以pandas分隔的逗号分隔的制表符

时间:2015-11-04 14:19:09

标签: python pandas

我不知道这是否可能。我试图将12个文件追加到一个文件中。其中一个文件是制表符分隔符,其余的逗号分隔。我将所有12个文件加载到数据帧中,并在循环中逐个将其附加到空数据帧中。

list_of_files = glob.glob('./*.txt')
df = pd.DataFrame()
for filename in list_of_files:
    file = pd.read_csv(filename)
    dfFilename = pd.DataFrame(file)
    df = df.append(dfFilename, ignore_index=True)

但是大文件的格式不是我想要的格式。我认为问题在于制表符分隔文件。我尝试在没有制表符分隔文件的情况下运行代码,并且附加文件的格式正常。所以我在想是否可以将制表符分隔格式更改为使用pandas分隔的逗号。

感谢您的帮助和建议

2 个答案:

答案 0 :(得分:9)

您需要告诉Pandas在导入文件时,该文件是以制表符分隔的。您可以将分隔符传递给read_csv方法,但在您的情况下,由于分隔符按文件更改,您希望传递无 - 这将使Pandas自动检测正确的分隔符。

将read_csv行更改为:

pd.read_csv(filename,sep=None)

答案 1 :(得分:2)

对于以制表符分隔的文件,您应该使用:

Developer -> Add-Ins -> Selecting the Add-In -> Ok

Pandas file = pd.read_csv(filename, sep="\t") 有很多参数,请在docs

中查看