如何使用重复的字符串值创建数据框列?

时间:2016-02-22 15:44:53

标签: python string pandas dataframe

我从一堆文件中读取数据并将其存储在数据框中。我想要一列数据框来指示数据来自哪个文件。如何创建一个具有相同字符串的列,而不是手动输入?

我读入的每个文件都有~100个数据点(但每次都不是相同的数字)。当我读到每一个时,我将沿轴= 0连接到数据帧。它看起来应该是这样的。

import numpy as np
import pandas as pd
numbers = np.random.randn(5) # this data could be of any length, ~100
labels = np.array(['file01','file01','file01','file01','file01']) 
tf = pd.DataFrame()
tf['labels'] = labels
tf['numbers'] = numbers

In [8]: tf
Out[8]: 
   labels   numbers
0  file01 -0.176737
1  file01 -1.243871
2  file01  0.154886
3  file01  0.236653
4  file01 -0.195053

(是的,我知道我可以制作&#39; file01&#39;一个列标题,并沿轴= 1附加每个,但有理由我不想这样做。)< / p>

1 个答案:

答案 0 :(得分:3)

你去了,你的代码是固定的!实际上,你可以在DataFrame构造函数中使用的dict中放入一个值:)。

Password (leave blank if you don't want to change it)