Как вы получаете список каталогов, отсортированных по дате создания в Python?
каков наилучший способ получить список всех файлов в каталоге, отсортированных по дате [created / modified], используя python, на машине windows?
12 ответов:
вот более подробная версия
@Greg Hewgill
' s ответ. Это наиболее соответствует требованиям вопроса. Он делает различие между датами создания и модификации (по крайней мере, в Windows).#!/usr/bin/env python from stat import S_ISREG, ST_CTIME, ST_MODE import os, sys, time # path to the directory (relative or absolute) dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.' # get all entries in the directory w/ stats entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath)) entries = ((os.stat(path), path) for path in entries) # leave only regular files, insert creation date entries = ((stat[ST_CTIME], path) for stat, path in entries if S_ISREG(stat[ST_MODE])) #NOTE: on Windows `ST_CTIME` is a creation date # but on Unix it could be something else #NOTE: use `ST_MTIME` to sort by a modification date for cdate, path in sorted(entries): print time.ctime(cdate), os.path.basename(path)
пример:
$ python stat_creation_date.py Thu Feb 11 13:31:07 2009 stat_creation_date.py
Я делал это в прошлом для скрипта Python, чтобы определить последние обновленные файлы в каталоге:
import glob import os search_dir = "/mydir/" # remove anything from the list that is not a file (directories, symlinks) # thanks to J.F. Sebastion for pointing out that the requirement was a list # of files (presumably not including directories) files = filter(os.path.isfile, glob.glob(search_dir + "*")) files.sort(key=lambda x: os.path.getmtime(x))
Это должно делать то, что вы ищете на основе файла mtime.
EDIT: обратите внимание, что вы также можете использовать ОС.listdir () вместо glob.glob() при желании - причина, по которой я использовал glob в своем исходном коде, заключалась в том, что я хотел использовать glob только для поиска файлов с определенным набором расширений файлов, для которых glob () лучше подходит. К используйте listdir вот как это будет выглядеть:
import os search_dir = "/mydir/" os.chdir(search_dir) files = filter(os.path.isfile, os.listdir(search_dir)) files = [os.path.join(search_dir, f) for f in files] # add path to each file files.sort(key=lambda x: os.path.getmtime(x))
вот один-лайнер:
import os import time from pprint import pprint pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])
это вызовы ОС.listdir (), чтобы получить список имен файлов, затем обращается к ОС.stat () для каждого из них, чтобы получить время создания, а затем сортирует против времени создания.
обратите внимание, что этот метод вызывает только ОС.stat () один раз для каждого файла, что будет более эффективным, чем вызов его для каждого сравнения в сортировке.
вот мой вариант:
def getfiles(dirpath): a = [s for s in os.listdir(dirpath) if os.path.isfile(os.path.join(dirpath, s))] a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s))) return a
во-первых, мы строим список имен файлов. isfile () используется для пропуска каталогов; он может быть опущен, если каталоги должны быть включены. Затем мы сортируем список на месте, используя дату изменения в качестве ключа.
есть
os.path.getmtime
функция, которая дает количество секунд с начала эпохи и должно быть быстрее, чем ОС.статистика.os.chdir(directory) sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)
без изменения каталог:
import os path = '/path/to/files/' name_list = os.listdir(path) full_list = [os.path.join(path,i) for i in name_list] time_sorted_list = sorted(full_list, key=os.path.getmtime) print time_sorted_list # if you want just the filenames sorted, simply remove the dir from each sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list] print sorted_filename_list
вот мой ответ с помощью glob без фильтра, если вы хотите читать файлы с определенным расширением в порядке дат (Python 3).
dataset_path='/mydir/' files = glob.glob(dataset_path+"/morepath/*.extension") files.sort(key=os.path.getmtime)
sorted(filter(os.path.isfile, os.listdir('.')), key=lambda p: os.stat(p).st_mtime)
вы могли бы использовать
os.walk('.').next()[-1]
вместо фильтрации сos.path.isfile
, но это оставляет мертвые ссылки в список, иos.stat
рухнет на них.
это основной шаг для изучения:
import os, stat, sys import time dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.' listdir = os.listdir(dirpath) for i in listdir: os.chdir(dirpath) data_001 = os.path.realpath(i) listdir_stat1 = os.stat(data_001) listdir_stat2 = ((os.stat(data_001), data_001)) print time.ctime(listdir_stat1.st_ctime), data_001
ответ Алекса Ковентри создаст исключение, если файл является символической ссылкой на несуществующий файл, следующий код исправляет этот ответ:
import time import datetime sorted(filter(os.path.isfile, os.listdir('.')), key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())
когда файл не существует, теперь используется (), и символическая ссылка будет идти в самом конце списка.