读取文件名并使用它创建一列

时间:2019-10-09 07:11:52

标签: python pandas dataframe

我有一个名为shoes_2016的文件名,如何创建一个名为year的数据框列并根据该文件名提取年份。

1 个答案:

答案 0 :(得分:0)

split提取年份,转换为整数并分配给DataFrame:

filename = 'shoes_2016.csv'

df = pd.read_csv(filename)
df['year'] = int(filename.split('.')[0].split('_')[1])

print (df)

或者:

filename = 'shoes_2016.csv'

df = pd.read_csv(filename).assign(year = int(filename.split('.')[0].split('_')[1]))
print (df)

编辑:

import os

filename = 'c:/users/a/desktop/items/shoes_2016.xlsx'
y = int(os.path.basename(filename).split('.')[0].split('_')[1])
print (y)
2016

或者:

y = int(filename.split('/')[-1].split('.')[0].split('_')[1])
print (y)
2016

df = pd.read_csv(filename).assign(year = y)