清洗数据帧-将一个单元格中的值分配给列

时间:2019-07-29 10:34:26

标签: python pandas dataframe

我正在从一个文件夹中将多个CSV文件读取到一个数据框中。我循环搜索文件夹中的所有文件,然后合并数据框以获得最终数据框。 但是,CSV文件有一个摘要行,我要从中提取日期,然后将该csv / dataframe中的所有行添加为新列。

'''

df=pd.read_csv(f,header=None,names=['Inverter',"Day Yield",'month Yield','Year Yield','SpecificYieldDay','SYMth','SYYear','Power'],sep=';', **kwargs)
df['date']=df.loc[[0],['Day Yield']]
df

我希望['date']列中包含该特定CSV中所有行的文件日期,但仅正确填充了第一行。

Refer to image of dataframe. I want all the rows of the 'date' column to be showing 7/25/2019 instead of only the first row.

我还添加了一个我正在读取的csv文件之一的示例 csv file

1 个答案:

答案 0 :(得分:0)

如果我理解正确,您要添加为所有行的新列的值在df.loc[[0],['Day Yield']]中。

如果正确,则可以执行以下操作:

df = df.assign(date=[df.loc[[0],['Day Yield']]]*len(df))