Python リストの値を含む .csv ファイルを作成する

https://stackoverflow.com/questions/2084069

21-09-2019
|

質問

Python リストの値を使用して .csv ファイルを作成しようとしています。リスト内の値を出力すると、それらはすべて Unicode (?) になります。彼らはこんな感じです

[u'value 1', u'value 2', ...]

リスト内の値を反復処理すると、つまり for v in mylist: print v それらはプレーンテキストのように見えます。

そして、私は置くことができます , それぞれの間で print ','.join(mylist)

そして、ファイルに出力できます。

myfile = open(...)
print >>myfile, ','.join(mylist)

しかし、CSVに出力し、リスト内の値を区切り文字で囲みたいと考えています。

"value 1", "value 2", ...

書式設定に区切り文字を含める簡単な方法が見つかりません。私は試してみました join 声明。これどうやってするの？

解決

import csv

with open(..., 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)

編集：これは Python 2.x でのみ機能します。

Python 3.xで動作させるには置き換えます wb と w (このSOの回答を参照してください)

with open(..., 'w', newline='') as myfile:
     wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
     wr.writerow(mylist)

他のヒント

ここでアレックスマルテッリのの安全なバージョンがあります：

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)

私が見つけた最良のオプションは、 savetxt から numpy モジュール:

import numpy as np
np.savetxt("file_name.csv", data1, delimiter=",", fmt='%s', header=header)

積み重ねる必要があるリストが複数ある場合

np.savetxt("file_name.csv", np.column_stack((data1, data2)), delimiter=",", fmt='%s', header=header)

別のアプローチでは、あなたが使用することができます DATAFRAME パンダの中に：そして、それだけで簡単に以下のコードのようにCSVデータをダンプすることができます：

import pandas
df = pandas.DataFrame(data={"col1": list_1, "col2": list_2})
df.to_csv("./file.csv", sep=',',index=False)

コンマまたはタブ区切りのファイルを読み書きするための

使用Pythonのcsvモジュール。それはあなたの引用を超える良好な制御を与えるので、csvモジュールが好ましいます。

たとえば、ここであなたのために働いた例です。

import csv
data = ["value %d" % i for i in range(1,4)]

out = csv.writer(open("myfile.csv","w"), delimiter=',',quoting=csv.QUOTE_ALL)
out.writerow(data)

生成します：

"value 1","value 2","value 3"

あなたは、この場合にstring.joinメソッドを使用することができます。

明確にするための行の数以上のスプリット - ここでインタラクティブなセッションです。

>>> a = ['a','b','c']
>>> first = '", "'.join(a)
>>> second = '"%s"' % first
>>> print second
"a", "b", "c"

または単一の行として

>>> print ('"%s"') % '", "'.join(a)
"a", "b", "c"

ただし、問題は、あなたの文字列が埋め込まれた引用符を持っている必要があります。この場合、あなたはそれらをエスケープする方法を決定する必要があります。

CSVモジュールにあなたができるように、あなたのためにこれのすべての世話をすることができます様々な引用のオプションから選択し、どのようにesacpe制御charectersに（すべてのフィールドは、のみ引用符とseperators、唯一の非数値フィールドなどのフィールド）（二重引用符、または文字列をエスケープ）。自分の価値観がシンプルであれば、string.joinはおそらくOKでしょうが、あなたが持っている場合は、エッジケースの多くを管理するモジュール利用できます。

を使用します

Jupyterノートブック

あなたのリストがA

であると言うことができますその後、あなたはcsvファイルとしてそれを持っています以下の広告をコーディングすることができます（列のみ！）

R="\n".join(A)
f = open('Columns.csv','w')
f.write(R)
f.close()

あなたは確かにCSVモジュールを使用する必要がありますが、チャンスはある、あなたはユニコードを記述する必要があります。書き込みunicodeに必要な人のために、これは例のページからクラスを使用すると、utilのモジュールとして使用することができ、次のとおりです。

import csv, codecs, cStringIO

class UTF8Recoder:
    """
    Iterator that reads an encoded stream and reencodes the input to UTF-8
    """
    def __init__(self, f, encoding):
        self.reader = codecs.getreader(encoding)(f)

def __iter__(self):
    return self

def next(self):
    return self.reader.next().encode("utf-8")

class UnicodeReader:
    """
    A CSV reader which will iterate over lines in the CSV file "f",
    which is encoded in the given encoding.
    """

def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
    f = UTF8Recoder(f, encoding)
    self.reader = csv.reader(f, dialect=dialect, **kwds)

def next(self):
    row = self.reader.next()
    return [unicode(s, "utf-8") for s in row]

def __iter__(self):
    return self

class UnicodeWriter:
    """
    A CSV writer which will write rows to CSV file "f",
    which is encoded in the given encoding.
"""

def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
    # Redirect output to a queue
    self.queue = cStringIO.StringIO()
    self.writer = csv.writer(self.queue, dialect=dialect, **kwds)
    self.stream = f
    self.encoder = codecs.getincrementalencoder(encoding)()

def writerow(self, row):
    self.writer.writerow([s.encode("utf-8") for s in row])
    # Fetch UTF-8 output from the queue ...
    data = self.queue.getvalue()
    data = data.decode("utf-8")
    # ... and reencode it into the target encoding
    data = self.encoder.encode(data)
    # write to the target stream
    self.stream.write(data)
    # empty queue
    self.queue.truncate(0)

def writerows(self, rows):
    for row in rows:
        self.writerow(row)

ここでcsvモジュールを必要としない別の解決策がある。

print ', '.join(['"'+i+'"' for i in myList])

例：

>>> myList = [u'value 1', u'value 2', u'value 3']
>>> print ', '.join(['"'+i+'"' for i in myList])
"value 1", "value 2", "value 3"

しかし、最初のリストが含まれている場合は、いくつかの」、彼らはエスケープされません、それが必要な場合、そのようにそれをエスケープする関数を呼び出すことが可能である：ます。

print ', '.join(['"'+myFunction(i)+'"' for i in myList])

このソリューションクレイジーに聞こえるが、作品は蜂蜜

のように滑らか

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL,delimiter='\n')
    wr.writerow(mylist)

ファイルはcsvwriterによって書かれている、したがってCSV特性が維持され、すなわちカンマ区切り。デリミタは、次の行にリスト項目を移動させることにより、本体部内の各時間に役立ちます。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow