我有一堆文件名为
的文件公司名称-date_somenumber.txt
我必须根据公司名称对文件进行排序,然后根据日期对其进行排序,并按照此排序顺序将其内容复制到另一个文本文件中。
这是我正在尝试的方法:
从每个文件名中提取公司名称,然后提取日期,将这两个字段放在字典中,将此字典附加到列表中,然后根据companyname和date的两列对此列表进行排序。
然后,一旦我有了排序顺序,我想我可以根据我刚刚获得的文件顺序搜索文件夹中的文件,然后将每个文件内容复制到一个txt文件中,我将得到我的最终txt文件
这是我到目前为止的代码:
myfiles = [ f for f in listdir(path) if isfile(join(path,f)) ]
file_list=[]
for file1 in myfiles:
# find indices of companyname and date in the file-name
idx1=file1.index('-',0)
idx2=file1.index('_',idx1)
company=file1[0:idx1] # extract companyname
thisdate=file1[idx1+1:idx2] #extract date, which is in format MMDDYY
dict={}
# extract month, date and year from thisdate
m=thisdate[0:2]
d=thisdate[2:4]
y='20'+thisdate[4:6]
# convert into date object
mydate = date(int(y), int(m), int(d))
dict['date']=mydate
dict['company']=company
file_list.append(dict)
我在这段代码的末尾检查了file_list的输出,我想我有我的dicts列表。现在,我如何按公司名称排序,然后按日期排序?我查找了在线按多个键排序但是如何按日期获得增加的订单?
有没有其他方法可以按字符串排序列表,然后是日期字段?
答案 0 :(得分:2)
import os
from datetime import datetime
MY_DIR = 'somedirectory'
# my_files = [ f for f in os.listdir(MY_DIR) if os.path.isfile(os.path.join(MY_DIR,f)) ]
my_files = [
'ABC-031814_01.txt',
'ABC-031214_02.txt',
'DEF-010114_03.txt'
]
file_list = []
for file_name in my_files:
company,_,rhs = file_name.partition('-')
datestr,_,rhs = rhs.partition('_')
file_date = datetime.strptime(datestr,'%m%d%y')
file_list.append(dict(file_date=file_date,file_name=file_name,company=company))
for row in sorted(file_list,key=lambda x: (x.get('company'),x.get('file_date'))):
print row
函数sorted
采用关键字参数key
,该参数是应用于您正在排序的序列中的每个项目的函数。如果此函数返回一个元组,则序列将依次按元组中的项排序。
此处lambda x: (x.get('company'),x.get('file_date'))
允许sorted
按公司名称排序,然后按日期排序。