你如何在python中获得按创建日期排序的目录列表?

时间:2008-10-03 19:10:08

标签: python windows directory

获取目录中所有文件列表的最佳方法是什么,按日期排序[created |修改],在Windows机器上使用python?

17 个答案:

答案 0 :(得分:113)

我以前为Python脚本做了这个,以确定目录中最后更新的文件:

import glob
import os

search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list 
# of files (presumably not including directories)  
files = filter(os.path.isfile, glob.glob(search_dir + "*"))
files.sort(key=lambda x: os.path.getmtime(x))

根据文件mtime,你应该做你正在寻找的东西。

编辑:请注意,如果需要,您也可以使用os.listdir()代替glob.glob() - 我在原始代码中使用glob的原因是我想要使用glob只搜索具有特定文件扩展名的文件,其中glob()更适合。要在这里使用listdir,它会是什么样子:

import os

search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))

答案 1 :(得分:52)

这是@Greg Hewgill's answer的更详细版本。它最符合问题要求。它区分了创建日期和修改日期(至少在Windows上)。

#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time

# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)

# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
           for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date 
#  but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date

for cdate, path in sorted(entries):
    print time.ctime(cdate), os.path.basename(path)

示例:

$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py

答案 2 :(得分:21)

这是我的版本:

def getfiles(dirpath):
    a = [s for s in os.listdir(dirpath)
         if os.path.isfile(os.path.join(dirpath, s))]
    a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
    return a

首先,我们构建一个文件名列表。 isfile()用于跳过目录;如果应该包含目录,则可以省略它。然后,我们使用修改日期作为关键字对列表进行排序。

答案 3 :(得分:21)

有一个os.path.getmtime函数可以给出自纪元以来的秒数 并且应该比os.stat快。

import os 

os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)

答案 4 :(得分:20)

这是一个单行:

import os
import time
from pprint import pprint

pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])

这会调用os.listdir()来获取文件名列表,然后为每个文件名调用os.stat()来获取创建时间,然后根据创建时间进行排序。

请注意,此方法仅为每个文件调用一次os.stat(),这比为排序中的每个比较调用它更有效。

答案 5 :(得分:15)

不改变目录:

import os    

path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)

print time_sorted_list

# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list

答案 6 :(得分:10)

如果您想要按日期顺序读取具有特定扩展名的文件(Python 3),这是我使用glob而不使用过滤器的答案。

dataset_path='/mydir/'   
files = glob.glob(dataset_path+"/morepath/*.extension")   
files.sort(key=os.path.getmtime)

答案 7 :(得分:5)

在python 3.5 +

df

  col1  col2  col3
0     A     1   1.1
1     A     3   1.1
2     A     3   1.1
3     B     2   2.6
4     B     4   2.5
5     B     2   3.4
6     B     5   2.6
7     A     3   2.6
8     B     6   3.4
9     C     3   3.4
10    B     5   2.6
11    D     1   1.1
12    D     1   1.1
13    D     1   3.3

df.groupby(['col1', 'col2'])['col3']\
      .agg(lambda x: x.nlargest(2)).apply(pd.Series)

             0    1
col1 col2          
A    1     1.1  NaN
     3     2.6  1.1
B    2     3.4  2.6
     4     2.5  NaN
     5     2.6  2.6
     6     3.4  NaN
C    3     3.4  NaN
D    1     3.3  1.1

答案 8 :(得分:4)

sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.stat(p).st_mtime)

您可以使用os.walk('.').next()[-1]而不是使用os.path.isfile进行过滤,但会在列表中留下已删除的符号链接,os.stat会失败。

答案 9 :(得分:2)

# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time

import glob,os

lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("\n".join(lst_files))

答案 10 :(得分:1)

这是学习的基本步骤:

import os, stat, sys
import time

dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

listdir = os.listdir(dirpath)

for i in listdir:
    os.chdir(dirpath)
    data_001 = os.path.realpath(i)
    listdir_stat1 = os.stat(data_001)
    listdir_stat2 = ((os.stat(data_001), data_001))
    print time.ctime(listdir_stat1.st_ctime), data_001

答案 11 :(得分:0)

这是一条简单的几行,用于查找扩展并提供排序选项

<asp:TemplateField HeaderText="In Stock" ItemStyle-HorizontalAlign="Center">
                    <ItemTemplate>
                        <asp:Label ID="Label_stock" Text='<%# Eval("product_stock")+" "+Eval("product_stock_unit") %>' runat="server" />
                    </ItemTemplate>                      
                </asp:TemplateField>

答案 12 :(得分:0)

要保证os.scandir的完整性(比pathlib快2倍):

import os
sorted(os.scandir('/tmp/test'), key=lambda d: d.stat().st_mtime)

答案 13 :(得分:0)

from pathlib import Path
import os

sorted(Path('./').iterdir(), key=lambda t: t.stat().st_mtime)

sorted(Path('./').iterdir(), key=os.path.getmtime)

sorted(os.scandir('./'), key=lambda t: t.stat().st_mtime)

其中m时间是修改时间。

答案 14 :(得分:0)

这是我的版本:

import os

folder_path = r'D:\Movies\extra\new\dramas' # your path
os.chdir(folder_path) # make the path active
x = sorted(os.listdir(), key=os.path.getctime)  # sorted using creation time

folder = 0

for folder in range(len(x)):
    print(x[folder]) # print all the foldername inside the folder_path
    folder = +1

答案 15 :(得分:-1)

结果 os.listdir 按最后修改但相反的顺序排序,因此您可以这样做:

import os
last_modified=os.listdir()[::-1]

答案 16 :(得分:-5)

也许你应该使用shell命令。在Unix / Linux中,查找带排序的管道可能会做你想要的。