我不知道这是否可能。我试图将12个文件追加到一个文件中。其中一个文件是制表符分隔符,其余的逗号分隔。我将所有12个文件加载到数据帧中,并在循环中逐个将其附加到空数据帧中。
list_of_files = glob.glob('./*.txt')
df = pd.DataFrame()
for filename in list_of_files:
file = pd.read_csv(filename)
dfFilename = pd.DataFrame(file)
df = df.append(dfFilename, ignore_index=True)
但是大文件的格式不是我想要的格式。我认为问题在于制表符分隔文件。我尝试在没有制表符分隔文件的情况下运行代码,并且附加文件的格式正常。所以我在想是否可以将制表符分隔格式更改为使用pandas分隔的逗号。
感谢您的帮助和建议
答案 0 :(得分:9)
您需要告诉Pandas在导入文件时,该文件是以制表符分隔的。您可以将分隔符传递给read_csv方法,但在您的情况下,由于分隔符按文件更改,您希望传递无 - 这将使Pandas自动检测正确的分隔符。
将read_csv行更改为:
pd.read_csv(filename,sep=None)
答案 1 :(得分:2)
对于以制表符分隔的文件,您应该使用:
Developer -> Add-Ins -> Selecting the Add-In -> Ok
Pandas file = pd.read_csv(filename, sep="\t")
有很多参数,请在docs