我从一堆文件中读取数据并将其存储在数据框中。我想要一列数据框来指示数据来自哪个文件。如何创建一个具有相同字符串的列,而不是手动输入?
我读入的每个文件都有~100个数据点(但每次都不是相同的数字)。当我读到每一个时,我将沿轴= 0连接到数据帧。它看起来应该是这样的。
import numpy as np
import pandas as pd
numbers = np.random.randn(5) # this data could be of any length, ~100
labels = np.array(['file01','file01','file01','file01','file01'])
tf = pd.DataFrame()
tf['labels'] = labels
tf['numbers'] = numbers
In [8]: tf
Out[8]:
labels numbers
0 file01 -0.176737
1 file01 -1.243871
2 file01 0.154886
3 file01 0.236653
4 file01 -0.195053
(是的,我知道我可以制作&#39; file01&#39;一个列标题,并沿轴= 1附加每个,但有理由我不想这样做。)< / p>
答案 0 :(得分:3)
你去了,你的代码是固定的!实际上,你可以在DataFrame构造函数中使用的dict中放入一个值:)。
Password (leave blank if you don't want to change it)