Создайте файл .csv со значениями из списка Python

https://stackoverflow.com/questions/2084069

21-09-2019
|

Вопрос

Я пытаюсь создать файл .csv с значениями из списка Python. Когда я печатаю значения в списке, они все Unicode (?), То есть они выглядят примерно так

[u'value 1', u'value 2', ...]

Если я перечисляю значения в списке, т.е. for v in mylist: print v Они кажутся простым текстом.

И я могу положить , между каждым с print ','.join(mylist)

И я могу вывести в файл, т.е.

myfile = open(...)
print >>myfile, ','.join(mylist)

Но я хочу вывести в CSV и иметь разделители вокруг значений в списке, например,

"value 1", "value 2", ...

Я не могу найти простой способ включить разделители в форматирование, например, я пробовал через join утверждение. Как я могу это сделать?

Решение

import csv

with open(..., 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)

РЕДАКТИРОВАТЬ: Это работает только с Python 2.x.

Чтобы заставить его работать с заменой Python 3.x wb с w (Смотрите это так ответь)

with open(..., 'w', newline='') as myfile:
     wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
     wr.writerow(mylist)

Другие советы

Вот безопасная версия Алекса Мартелли:

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)

Лучший вариант, который я нашел savetxt от numpy модуль:

import numpy as np
np.savetxt("file_name.csv", data1, delimiter=",", fmt='%s', header=header)

В случае, если у вас есть несколько списков, которые нужно сложить

np.savetxt("file_name.csv", np.column_stack((data1, data2)), delimiter=",", fmt='%s', header=header)

Для другого подхода вы можете использовать DataFrame в Панды: И это может легко сбросить данные в CSV, как приведенный ниже код:

import pandas
df = pandas.DataFrame(data={"col1": list_1, "col2": list_2})
df.to_csv("./file.csv", sep=',',index=False)

Используйте Python's csv Модуль для чтения и написания запятой или файлов с деликатными вкладками. Модуль CSV является предпочтительным, потому что он дает вам хороший контроль над цитированием.

Например, вот для вас обработанный пример:

import csv
data = ["value %d" % i for i in range(1,4)]

out = csv.writer(open("myfile.csv","w"), delimiter=',',quoting=csv.QUOTE_ALL)
out.writerow(data)

Производит:

"value 1","value 2","value 3"

В этом случае вы можете использовать метод string.join.

Разделите на несколько строк для ясности - вот интерактивная сеанс

>>> a = ['a','b','c']
>>> first = '", "'.join(a)
>>> second = '"%s"' % first
>>> print second
"a", "b", "c"

Или как одна строка

>>> print ('"%s"') % '", "'.join(a)
"a", "b", "c"

Тем не менее, у вас может быть проблема, если ваши строки имеют встроенные цитаты. Если это так, вам нужно решить, как их избежать.

А CSV модуль Можно позаботиться обо всем этом для вас, позволяя вам выбирать между различными вариантами цитирования (все поля, только полями с кавычками и сеператорами, только не числовыми полями и т. Д.), А как управлять шарик -контролями ESACPE (двойные цитаты или сбежать из строк) Анкет Если ваши значения просты, string.join, вероятно, будет в порядке, но если вам придется управлять множеством краевых случаев, используйте доступный модуль.

Жюрит -блокнот

Допустим, ваш список A

Затем вы можете кодировать следующее объявление, у вас будет его в качестве файла CSV (только столбцы!)

R="\n".join(A)
f = open('Columns.csv','w')
f.write(R)
f.close()

Вы должны использовать модуль CSV наверняка, но есть шансы, что вам нужно написать Unicode. Для тех, кому нужно написать Unicode, это класс с примеров, который вы можете использовать в качестве модуля UTIL:

import csv, codecs, cStringIO

class UTF8Recoder:
    """
    Iterator that reads an encoded stream and reencodes the input to UTF-8
    """
    def __init__(self, f, encoding):
        self.reader = codecs.getreader(encoding)(f)

def __iter__(self):
    return self

def next(self):
    return self.reader.next().encode("utf-8")

class UnicodeReader:
    """
    A CSV reader which will iterate over lines in the CSV file "f",
    which is encoded in the given encoding.
    """

def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
    f = UTF8Recoder(f, encoding)
    self.reader = csv.reader(f, dialect=dialect, **kwds)

def next(self):
    row = self.reader.next()
    return [unicode(s, "utf-8") for s in row]

def __iter__(self):
    return self

class UnicodeWriter:
    """
    A CSV writer which will write rows to CSV file "f",
    which is encoded in the given encoding.
"""

def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
    # Redirect output to a queue
    self.queue = cStringIO.StringIO()
    self.writer = csv.writer(self.queue, dialect=dialect, **kwds)
    self.stream = f
    self.encoder = codecs.getincrementalencoder(encoding)()

def writerow(self, row):
    self.writer.writerow([s.encode("utf-8") for s in row])
    # Fetch UTF-8 output from the queue ...
    data = self.queue.getvalue()
    data = data.decode("utf-8")
    # ... and reencode it into the target encoding
    data = self.encoder.encode(data)
    # write to the target stream
    self.stream.write(data)
    # empty queue
    self.queue.truncate(0)

def writerows(self, rows):
    for row in rows:
        self.writerow(row)

Вот еще одно решение, которое не требует csv модуль.

print ', '.join(['"'+i+'"' for i in myList])

Пример :

>>> myList = [u'value 1', u'value 2', u'value 3']
>>> print ', '.join(['"'+i+'"' for i in myList])
"value 1", "value 2", "value 3"

Однако, если первоначальный список содержит некоторые », они не будут сбежать. Если это требуется, можно назвать функцию, чтобы избежать ее так:

print ', '.join(['"'+myFunction(i)+'"' for i in myList])

Это решение звучит безумно, но работает гладко как мед

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL,delimiter='\n')
    wr.writerow(mylist)

Файл написан CSVWriter, следовательно, свойства CSV сохраняются, то есть запятой отдельно. Разделитель помогает в основной части, перемещая элементы списка в следующую строку каждый раз.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow