Python の ftplib を使用してディレクトリのリストを移植可能に取得する

StackOverflow https://stackoverflow.com/questions/111954

  •  02-07-2019
  •  | 
  •  

質問

ftplib を使用すると、Python で FTP を完全にサポートできます。ただし、ディレクトリリストを取得するための推奨される方法は次のとおりです。

# File: ftplib-example-1.py

import ftplib

ftp = ftplib.FTP("www.python.org")
ftp.login("anonymous", "ftplib-example-1")

data = []

ftp.dir(data.append)

ftp.quit()

for line in data:
    print "-", line

これにより、次の結果が得られます。

$ python ftplib-example-1.py
- total 34
- drwxrwxr-x  11 root     4127         512 Sep 14 14:18 .
- drwxrwxr-x  11 root     4127         512 Sep 14 14:18 ..
- drwxrwxr-x   2 root     4127         512 Sep 13 15:18 RCS
- lrwxrwxrwx   1 root     bin           11 Jun 29 14:34 README -> welcome.msg
- drwxr-xr-x   3 root     wheel        512 May 19  1998 bin
- drwxr-sr-x   3 root     1400         512 Jun  9  1997 dev
- drwxrwxr--   2 root     4127         512 Feb  8  1998 dup
- drwxr-xr-x   3 root     wheel        512 May 19  1998 etc
...

結果を解析してディレクトリのリストを取得するという考えだと思います。ただし、このリストは FTP サーバーのリストのフォーマット方法に直接依存します。FTP サーバーがこのリストをフォーマットするさまざまな方法をすべて予測しなければならないため、コードを記述するのは非常に面倒です。

ディレクトリリストを含む配列を取得する移植可能な方法はありますか?

(配列にはフォルダー名のみが含まれている必要があります。)

役に立ちましたか?

解決

使ってみてください ftp.nlst(dir).

ただし、フォルダーが空の場合は、エラーがスローされる可能性があることに注意してください。

files = []

try:
    files = ftp.nlst()
except ftplib.error_perm, resp:
    if str(resp) == "550 No files found":
        print "No files in this directory"
    else:
        raise

for f in files:
    print f

他のヒント

FTP ディレクトリ リストを解析する信頼性の高い標準化された方法は、MLSD コマンドを使用することです。このコマンドは、最近のすべての適切な FTP サーバーでサポートされているはずです。

import ftplib
f = ftplib.FTP()
f.connect("localhost")
f.login()
ls = []
f.retrlines('MLSD', ls.append)
for entry in ls:
    print entry

上記のコードは次のように出力します。

modify=20110723201710;perm=el;size=4096;type=dir;unique=807g4e5a5; tests
modify=20111206092323;perm=el;size=4096;type=dir;unique=807g1008e0; .xchat2
modify=20111022125631;perm=el;size=4096;type=dir;unique=807g10001a; .gconfd
modify=20110808185618;perm=el;size=4096;type=dir;unique=807g160f9a; .skychart
...

Python 3.3 以降、ftplib はこれを行うための特定のメソッドを提供します。

ファイル名、最終変更スタンプ、ファイルサイズなどを取得しようとしてここにたどり着き、コードを追加したいと思いました。解析するループを作成するのに数分しかかかりませんでした。 ftp.dir(dir_list.append) Python std libのようなものを利用する strip() (テキスト行をクリーンアップするため) および split() 配列を作成します。

ftp = FTP('sick.domain.bro')
ftp.login()
ftp.cwd('path/to/data')

dir_list = []
ftp.dir(dir_list.append)

# main thing is identifing which char marks start of good stuff
# '-rw-r--r--   1 ppsrt    ppsrt      545498 Jul 23 12:07 FILENAME.FOO
#                               ^  (that is line[29])

for line in dir_list:
   print line[29:].strip().split(' ') # got yerself an array there bud!
   # EX ['545498', 'Jul', '23', '12:07', 'FILENAME.FOO']

レイアウトに標準はありません LIST 応答。最も一般的なレイアウトを処理するにはコードを記述する必要があります。Linuxから始めたいと思います ls および Windows サーバー DIR フォーマット。それにしても、色々な種類がありますね。

にフォールバックします nlst メソッド (結果を返す) NLST コマンド) 長いリストを解析できない場合。ボーナスポイントを獲得するには、次の方法を使用します。おそらく、既知のファイル名を含む行の最長の数値がその長さになります。

たまたま、MLSD をサポートしていないように見える FTP サーバー (Rackspace Cloud Sites 仮想サーバー) で立ち往生しています。ただし、ファイル名だけでなく、サイズやタイムスタンプなどのファイル情報のいくつかのフィールドが必要なので、DIR コマンドを使用する必要があります。このサーバーでは、DIR の出力は OP と非常によく似ています。誰かの役に立つかもしれないので、そのような出力の行を解析してファイル名、サイズ、タイムスタンプを取得する小さな Python クラスを次に示します。

インポート日時

class FtpDir:
    def parse_dir_line(self, line):
        words = line.split()
        self.filename = words[8]
        self.size = int(words[4])
        t = words[7].split(':')
        ts = words[5] + '-' + words[6] + '-' + datetime.datetime.now().strftime('%Y') + ' ' + t[0] + ':' + t[1]
        self.timestamp = datetime.datetime.strptime(ts, '%b-%d-%Y %H:%M')

移植性はあまり高くありませんが、さまざまな FTP サーバーに対応するために拡張または変更するのは簡単です。

これはPythonドキュメントからのものです

>>> from ftplib import FTP_TLS
>>> ftps = FTP_TLS('ftp.python.org')
>>> ftps.login()           # login anonymously before securing control 
channel
>>> ftps.prot_p()          # switch to secure data connection
>>> ftps.retrlines('LIST') # list directory content securely
total 9
drwxr-xr-x   8 root     wheel        1024 Jan  3  1994 .
drwxr-xr-x   8 root     wheel        1024 Jan  3  1994 ..
drwxr-xr-x   2 root     wheel        1024 Jan  3  1994 bin
drwxr-xr-x   2 root     wheel        1024 Jan  3  1994 etc
d-wxrwxr-x   2 ftp      wheel        1024 Sep  5 13:43 incoming
drwxr-xr-x   2 root     wheel        1024 Nov 17  1993 lib
drwxr-xr-x   6 1094     wheel        1024 Sep 13 19:07 pub
drwxr-xr-x   3 root     wheel        1024 Jan  3  1994 usr
-rw-r--r--   1 root     root          312 Aug  1  1994 welcome.msg

それは私のコードに役立ちました。

ファイルの種類のみをフェルタリングして、各行にテストする条件を追加して画面に表示しようとしたとき。

このような

elif command == 'ls':
    print("directory of ", ftp.pwd())
    data = []
    ftp.dir(data.append)

    for line in data:
        x = line.split(".")
        formats=["gz", "zip", "rar", "tar", "bz2", "xz"]
        if x[-1] in formats:
            print ("-", line)
ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top