Pergunta

Como faço para obter uma lista de todos os arquivos (e diretórios) em um determinado diretório em Python?

Foi útil?

Solução

Esta é uma forma de percorrer todos os arquivos e diretórios em uma árvore de diretórios:

import os

for dirname, dirnames, filenames in os.walk('.'):
    # print path to all subdirectories first.
    for subdirname in dirnames:
        print(os.path.join(dirname, subdirname))

    # print path to all filenames.
    for filename in filenames:
        print(os.path.join(dirname, filename))

    # Advanced usage:
    # editing the 'dirnames' list will stop os.walk() from recursing into there.
    if '.git' in dirnames:
        # don't go into any .git directories.
        dirnames.remove('.git')

Outras dicas

Você pode usar

os.listdir(path)

Para referência e mais funções OS veja aqui:

Aqui é uma função auxiliar que eu uso com bastante frequência:

import os

def listdir_fullpath(d):
    return [os.path.join(d, f) for f in os.listdir(d)]
import os

for filename in os.listdir("C:\\temp"):
    print  filename

Se precisar de habilidades englobamento, há um módulo para isso também. Por exemplo:

import glob
glob.glob('./[0-9].*')

retornará algo como:

['./1.gif', './2.txt']

Consulte a documentação do aqui .

Tente isto:

import os
for top, dirs, files in os.walk('./'):
    for nm in files:       
        print os.path.join(top, nm)

Para arquivos no diretório de trabalho atual sem especificar um caminho

Python 2.7:

import os
os.listdir(os.getcwd())

Python 3.x:

import os
os.listdir()

Graças ao Stam Kaly de comentários sobre python 3.x

A aplicação recursiva

import os

def scan_dir(dir):
    for name in os.listdir(dir):
        path = os.path.join(dir, name)
        if os.path.isfile(path):
            print path
        else:
            scan_dir(path)

Eu escrevi uma versão longa, com todas as opções que eu possa precisar: http: // sam.nipl.net/code/python/find.py

Eu acho que vai caber aqui também:

#!/usr/bin/env python

import os
import sys

def ls(dir, hidden=False, relative=True):
    nodes = []
    for nm in os.listdir(dir):
        if not hidden and nm.startswith('.'):
            continue
        if not relative:
            nm = os.path.join(dir, nm)
        nodes.append(nm)
    nodes.sort()
    return nodes

def find(root, files=True, dirs=False, hidden=False, relative=True, topdown=True):
    root = os.path.join(root, '')  # add slash if not there
    for parent, ldirs, lfiles in os.walk(root, topdown=topdown):
        if relative:
            parent = parent[len(root):]
        if dirs and parent:
            yield os.path.join(parent, '')
        if not hidden:
            lfiles   = [nm for nm in lfiles if not nm.startswith('.')]
            ldirs[:] = [nm for nm in ldirs  if not nm.startswith('.')]  # in place
        if files:
            lfiles.sort()
            for nm in lfiles:
                nm = os.path.join(parent, nm)
                yield nm

def test(root):
    print "* directory listing, with hidden files:"
    print ls(root, hidden=True)
    print
    print "* recursive listing, with dirs, but no hidden files:"
    for f in find(root, dirs=True):
        print f
    print

if __name__ == "__main__":
    test(*sys.argv[1:])

Um bom um forro a lista apenas os arquivos de forma recursiva. Eu usei isso no meu directiva package_data setup.py:

import os

[os.path.join(x[0],y) for x in os.walk('<some_directory>') for y in x[2]]

Eu sei que não é a resposta para a pergunta, mas pode vir a calhar

Para Python 2

#!/bin/python2

import os

def scan_dir(path):
    print map(os.path.abspath, os.listdir(pwd))

Para Python 3

Para filtro e mapa, você precisa envolvê-los com list ()

#!/bin/python3

import os

def scan_dir(path):
    print(list(map(os.path.abspath, os.listdir(pwd))))

A recomendação agora é que você substituir o uso de mapa e filtro com expressões geradores ou compreensões lista:

#!/bin/python

import os

def scan_dir(path):
    print([os.path.abspath(f) for f in os.listdir(path)])

Aqui está uma linha versão Pythonic:

import os
dir = 'given_directory_name'
filenames = [os.path.join(os.path.dirname(os.path.abspath(__file__)),dir,i) for i in os.listdir(dir)]

Este código lista o caminho completo de todos os arquivos e diretórios no nome dado diretório.

Aqui é outra opção.

os.scandir(path='.')

Ele retorna um iterador de os.DirEntry objetos correspondentes às entradas (juntamente com informações de atributo de arquivo) no diretório dado pelo caminho.

Exemplo:

with os.scandir(path) as it:
    for entry in it:
        if not entry.name.startswith('.'):
            print(entry.name)

Usando scandir () em vez de listDir () pode aumentar significativamente o desempenho do código que também precisa tipo de arquivo ou informações de atributo de arquivo , porque os.DirEntry objetos expor esta informação se o sistema operacional fornece-lo na digitalização de um diretório. Todos os métodos os.DirEntry pode realizar uma chamada de sistema, mas is_dir () e is_file () normalmente requerem apenas uma chamada de sistema para links simbólicos; os.DirEntry.stat () sempre requer uma chamada de sistema em Unix, mas requer apenas um para links simbólicos no Windows.

Python Docs

#import modules
import os

_CURRENT_DIR = '.'


def rec_tree_traverse(curr_dir, indent):
    "recurcive function to traverse the directory"
    #print "[traverse_tree]"

    try :
        dfList = [os.path.join(curr_dir, f_or_d) for f_or_d in os.listdir(curr_dir)]
    except:
        print "wrong path name/directory name"
        return

    for file_or_dir in dfList:

        if os.path.isdir(file_or_dir):
            #print "dir  : ",
            print indent, file_or_dir,"\\"
            rec_tree_traverse(file_or_dir, indent*2)

        if os.path.isfile(file_or_dir):
            #print "file : ",
            print indent, file_or_dir

    #end if for loop
#end of traverse_tree()

def main():

    base_dir = _CURRENT_DIR

    rec_tree_traverse(base_dir," ")

    raw_input("enter any key to exit....")
#end of main()


if __name__ == '__main__':
    main()

FYI Adicionar um filtro de arquivo de extensão ou ext import os

path = '.'
for dirname, dirnames, filenames in os.walk(path):
    # print path to all filenames with extension py.
    for filename in filenames:
        fname_path = os.path.join(dirname, filename)
        fext = os.path.splitext(fname_path)[1]
        if fext == '.py':
            print fname_path
        else:
            continue
import os, sys

#open files in directory

path = "My Documents"
dirs = os.listdir( path )

# print the files in given directory

for file in dirs:
   print (file)

Se percebi que eu jogar isso na. Forma simples e suja de fazer pesquisas curinga.

import re
import os

[a for a in os.listdir(".") if re.search("^.*\.py$",a)]

Abaixo lista diretórios irá código e os arquivos dentro do dir

def print_directory_contents(sPath):
        import os                                       
        for sChild in os.listdir(sPath):                
            sChildPath = os.path.join(sPath,sChild)
            if os.path.isdir(sChildPath):
                print_directory_contents(sChildPath)
            else:
                print(sChildPath)

Eu sei que isto é uma questão de idade. Esta é uma maneira elegante me deparei se você estiver em uma máquina Liunx.

import subprocess
print(subprocess.check_output(["ls", "/"]).decode("utf8"))

A única trabalhou comigo é uma espécie de uma versão modificada de Saleh resposta acima.

O código é a seguinte:

"dir = 'given_directory_name' nomes = [os.path.abspath (os.path.join (dir, i)) para i em os.listdir (dir)]"

Enquanto os.listdir() é bom para gerar uma lista de nomes de arquivos e dir, muitas vezes você quer fazer mais uma vez você tem esses nomes - e em Python3, pathlib faz as outras tarefas simples. Vamos dar uma olhada e ver se você gosta tanto quanto eu.

para listar o conteúdo de dir, construir um objeto Path e pegue o iterator:

In [16]: Path('/etc').iterdir()
Out[16]: <generator object Path.iterdir at 0x110853fc0>

Se queremos apenas uma lista de nomes de coisas:

In [17]: [x.name for x in Path('/etc').iterdir()]
Out[17]:
['emond.d',
 'ntp-restrict.conf',
 'periodic',

Se você quiser apenas os diretórios:

In [18]: [x.name for x in Path('/etc').iterdir() if x.is_dir()]
Out[18]:
['emond.d',
 'periodic',
 'mach_init.d',

Se você quiser que os nomes de todos os arquivos de conf em que a árvore:

In [20]: [x.name for x in Path('/etc').glob('**/*.conf')]
Out[20]:
['ntp-restrict.conf',
 'dnsextd.conf',
 'syslog.conf',

Se você quer uma lista de arquivos de conf na árvore> = 1K:

In [23]: [x.name for x in Path('/etc').glob('**/*.conf') if x.stat().st_size > 1024]
Out[23]:
['dnsextd.conf',
 'pf.conf',
 'autofs.conf',

Resolver caminhos relativos tornar-se fácil:

In [32]: Path('../Operational Metrics.md').resolve()
Out[32]: PosixPath('/Users/starver/code/xxxx/Operational Metrics.md')

Navegando com um trajeto é bastante claro (embora inesperada):

In [10]: p = Path('.')

In [11]: core = p / 'web' / 'core'

In [13]: [x for x in core.iterdir() if x.is_file()]
Out[13]:
[PosixPath('web/core/metrics.py'),
 PosixPath('web/core/services.py'),
 PosixPath('web/core/querysets.py'),
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top