你如何在python中获得按创建日期排序的目录列表?
题
获取目录中所有文件列表的最佳方法是什么,按日期排序[created |修改],在Windows机器上使用python?
解决方案
这是一个更详细的 @Greg Hewgill
的回答。它最符合问题要求。它区分了创建日期和修改日期(至少在Windows上)。
#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time
# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'
# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)
# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date
# but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date
for cdate, path in sorted(entries):
print time.ctime(cdate), os.path.basename(path)
示例:
$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py
其他提示
我以前为Python脚本做了这个,以确定目录中最后更新的文件:
import glob
import os
search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list
# of files (presumably not including directories)
files = filter(os.path.isfile, glob.glob(search_dir + "*"))
files.sort(key=lambda x: os.path.getmtime(x))
根据文件mtime,你应该做你正在寻找的东西。
编辑:请注意,如果需要,您也可以使用os.listdir()代替glob.glob() - 我在原始代码中使用glob的原因是我想要使用glob只搜索具有特定文件扩展名的文件,其中glob()更适合。要在这里使用listdir,它会是什么样子:
import os
search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))
这是我的版本:
def getfiles(dirpath):
a = [s for s in os.listdir(dirpath)
if os.path.isfile(os.path.join(dirpath, s))]
a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
return a
首先,我们构建一个文件名列表。 isfile()用于跳过目录;如果应该包含目录,则可以省略它。然后,我们使用修改日期作为关键字对列表进行排序。
有一个 os.path.getmtime
函数,它给出了自纪元以来的秒数
并且应该比 os.stat
更快。
import os
os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)
这是一个单行:
import os
import time
from pprint import pprint
pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])
这会调用os.listdir()来获取文件名列表,然后为每个文件名调用os.stat()来获取创建时间,然后根据创建时间进行排序。
请注意,此方法仅为每个文件调用一次os.stat(),这比为排序中的每个比较调用它更有效。
不改变目录:
import os
path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)
print time_sorted_list
# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list
如果您想要按日期顺序读取具有特定扩展名的文件(Python 3),这是我使用glob而不使用过滤器的答案。
dataset_path='/mydir/'
files = glob.glob(dataset_path+"/morepath/*.extension")
files.sort(key=os.path.getmtime)
在python 3.5 +
中from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)
sorted(filter(os.path.isfile, os.listdir('.')),
key=lambda p: os.stat(p).st_mtime)
您可以使用 os.walk('。')。next()[ - 1]
而不是使用 os.path.isfile
进行过滤,但是列表中的符号链接, os.stat
将失败。
这是学习的基本步骤:
import os, stat, sys
import time
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'
listdir = os.listdir(dirpath)
for i in listdir:
os.chdir(dirpath)
data_001 = os.path.realpath(i)
listdir_stat1 = os.stat(data_001)
listdir_stat2 = ((os.stat(data_001), data_001))
print time.ctime(listdir_stat1.st_ctime), data_001
import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')),
key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())
当文件不存在时,使用now(),符号链接将位于列表的最后。
这是一对简单的几行,它们寻找扩展名并提供排序选项
def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False):
files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*\.({}).format(regex_ext), f)]
files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
return files_to_evaluate
也许你应该使用shell命令。在Unix / Linux中,查找带排序的管道可能会做你想要的。