我有37个不同形状的数据框,我需要将它们连接起来。以下是我尝试过的:
path = '/Users/data_frames/data'
all_files = [os.path.join(path,i) for i in os.listdir(path) if i.endswith('pc.tsv')]
main = []
for files in all_files:
dfs = pd.DataFrame.from_csv(files, sep="\t")
dfs.reset_index(drop=True, inplace=True)
main.append(pc_matrix)
merged_pr_matrix =pd.concat(main,axis=1)
上面的脚本与此行一起运行
dfs.reset_index(drop=True, inplace=True)
但是,我丢失了原始索引值(行名)。我想保留它们。例如,现在我有了连接后的最终矩阵,如下所示:
ABV TCG FGH HKL MK MYT JUJN MTPTA
0 5130132,5 22778,703125 675790,6875 4846942,5 106934,4453125 2884897,25 2777415 3487836
1 3478507,5 898987,375 2825588,5 5006338,5 119250,765625 4393944,5 3111324,25 2594582,75
2 18402,615234375 56879,6484375 524456,3125 323671,4063 166333,4375 78539,921875 233480,0625 35772,69140625
3 2310551,5 587836,1875 241836,5 5488325 29411,296875 517361,46875 190795,078125 67885,640625
4 95646,140625 1106308 1356453 17681780 592893,9375 1857957 1224196 1417179,25
在原始输入中,我想保留索引中的值。