Создайте файл .csv со значениями из списка Python
Вопрос
Я пытаюсь создать файл .csv с значениями из списка Python. Когда я печатаю значения в списке, они все Unicode (?), То есть они выглядят примерно так
[u'value 1', u'value 2', ...]
Если я перечисляю значения в списке, т.е. for v in mylist: print v
Они кажутся простым текстом.
И я могу положить ,
между каждым с print ','.join(mylist)
И я могу вывести в файл, т.е.
myfile = open(...)
print >>myfile, ','.join(mylist)
Но я хочу вывести в CSV и иметь разделители вокруг значений в списке, например,
"value 1", "value 2", ...
Я не могу найти простой способ включить разделители в форматирование, например, я пробовал через join
утверждение. Как я могу это сделать?
Решение
import csv
with open(..., 'wb') as myfile:
wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
wr.writerow(mylist)
РЕДАКТИРОВАТЬ: Это работает только с Python 2.x.
Чтобы заставить его работать с заменой Python 3.x wb
с w
(Смотрите это так ответь)
with open(..., 'w', newline='') as myfile:
wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
wr.writerow(mylist)
Другие советы
Вот безопасная версия Алекса Мартелли:
import csv
with open('filename', 'wb') as myfile:
wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
wr.writerow(mylist)
Лучший вариант, который я нашел savetxt
от numpy
модуль:
import numpy as np
np.savetxt("file_name.csv", data1, delimiter=",", fmt='%s', header=header)
В случае, если у вас есть несколько списков, которые нужно сложить
np.savetxt("file_name.csv", np.column_stack((data1, data2)), delimiter=",", fmt='%s', header=header)
Используйте Python's csv
Модуль для чтения и написания запятой или файлов с деликатными вкладками. Модуль CSV является предпочтительным, потому что он дает вам хороший контроль над цитированием.
Например, вот для вас обработанный пример:
import csv
data = ["value %d" % i for i in range(1,4)]
out = csv.writer(open("myfile.csv","w"), delimiter=',',quoting=csv.QUOTE_ALL)
out.writerow(data)
Производит:
"value 1","value 2","value 3"
В этом случае вы можете использовать метод string.join.
Разделите на несколько строк для ясности - вот интерактивная сеанс
>>> a = ['a','b','c']
>>> first = '", "'.join(a)
>>> second = '"%s"' % first
>>> print second
"a", "b", "c"
Или как одна строка
>>> print ('"%s"') % '", "'.join(a)
"a", "b", "c"
Тем не менее, у вас может быть проблема, если ваши строки имеют встроенные цитаты. Если это так, вам нужно решить, как их избежать.
А CSV модуль Можно позаботиться обо всем этом для вас, позволяя вам выбирать между различными вариантами цитирования (все поля, только полями с кавычками и сеператорами, только не числовыми полями и т. Д.), А как управлять шарик -контролями ESACPE (двойные цитаты или сбежать из строк) Анкет Если ваши значения просты, string.join, вероятно, будет в порядке, но если вам придется управлять множеством краевых случаев, используйте доступный модуль.
Жюрит -блокнот
Допустим, ваш список A
Затем вы можете кодировать следующее объявление, у вас будет его в качестве файла CSV (только столбцы!)
R="\n".join(A)
f = open('Columns.csv','w')
f.write(R)
f.close()
Вы должны использовать модуль CSV наверняка, но есть шансы, что вам нужно написать Unicode. Для тех, кому нужно написать Unicode, это класс с примеров, который вы можете использовать в качестве модуля UTIL:
import csv, codecs, cStringIO
class UTF8Recoder:
"""
Iterator that reads an encoded stream and reencodes the input to UTF-8
"""
def __init__(self, f, encoding):
self.reader = codecs.getreader(encoding)(f)
def __iter__(self):
return self
def next(self):
return self.reader.next().encode("utf-8")
class UnicodeReader:
"""
A CSV reader which will iterate over lines in the CSV file "f",
which is encoded in the given encoding.
"""
def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
f = UTF8Recoder(f, encoding)
self.reader = csv.reader(f, dialect=dialect, **kwds)
def next(self):
row = self.reader.next()
return [unicode(s, "utf-8") for s in row]
def __iter__(self):
return self
class UnicodeWriter:
"""
A CSV writer which will write rows to CSV file "f",
which is encoded in the given encoding.
"""
def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
# Redirect output to a queue
self.queue = cStringIO.StringIO()
self.writer = csv.writer(self.queue, dialect=dialect, **kwds)
self.stream = f
self.encoder = codecs.getincrementalencoder(encoding)()
def writerow(self, row):
self.writer.writerow([s.encode("utf-8") for s in row])
# Fetch UTF-8 output from the queue ...
data = self.queue.getvalue()
data = data.decode("utf-8")
# ... and reencode it into the target encoding
data = self.encoder.encode(data)
# write to the target stream
self.stream.write(data)
# empty queue
self.queue.truncate(0)
def writerows(self, rows):
for row in rows:
self.writerow(row)
Вот еще одно решение, которое не требует csv
модуль.
print ', '.join(['"'+i+'"' for i in myList])
Пример :
>>> myList = [u'value 1', u'value 2', u'value 3']
>>> print ', '.join(['"'+i+'"' for i in myList])
"value 1", "value 2", "value 3"
Однако, если первоначальный список содержит некоторые », они не будут сбежать. Если это требуется, можно назвать функцию, чтобы избежать ее так:
print ', '.join(['"'+myFunction(i)+'"' for i in myList])
Это решение звучит безумно, но работает гладко как мед
import csv
with open('filename', 'wb') as myfile:
wr = csv.writer(myfile, quoting=csv.QUOTE_ALL,delimiter='\n')
wr.writerow(mylist)
Файл написан CSVWriter, следовательно, свойства CSV сохраняются, то есть запятой отдельно. Разделитель помогает в основной части, перемещая элементы списка в следующую строку каждый раз.