我有一个名为shoes_2016的文件名,如何创建一个名为year的数据框列并根据该文件名提取年份。
答案 0 :(得分:0)
用split
提取年份,转换为整数并分配给DataFrame:
filename = 'shoes_2016.csv'
df = pd.read_csv(filename)
df['year'] = int(filename.split('.')[0].split('_')[1])
print (df)
或者:
filename = 'shoes_2016.csv'
df = pd.read_csv(filename).assign(year = int(filename.split('.')[0].split('_')[1]))
print (df)
编辑:
import os
filename = 'c:/users/a/desktop/items/shoes_2016.xlsx'
y = int(os.path.basename(filename).split('.')[0].split('_')[1])
print (y)
2016
或者:
y = int(filename.split('/')[-1].split('.')[0].split('_')[1])
print (y)
2016
df = pd.read_csv(filename).assign(year = y)