使用 Python 列表中的值创建 .csv 文件

https://stackoverflow.com/questions/2084069

21-09-2019
|

题

我正在尝试使用 Python 列表中的值创建一个 .csv 文件。当我打印列表中的值时，它们都是 unicode (?)，即它们看起来像这样

[u'value 1', u'value 2', ...]

如果我迭代列表中的值，即 for v in mylist: print v 它们似乎是纯文本。

我可以放一个 , 每个之间与 print ','.join(mylist)

我可以输出到一个文件，即

myfile = open(...)
print >>myfile, ','.join(mylist)

但我想输出到 CSV 并在列表中的值周围有分隔符，例如

"value 1", "value 2", ...

我找不到一种简单的方法来在格式中包含分隔符，例如我已经尝试通过 join 陈述。我怎样才能做到这一点？

解决方案

import csv

with open(..., 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)

编辑：这只适用于 python 2.x。

要使其与 python 3.x 一起使用，请替换 wb 和 w (看到这个答案)

with open(..., 'w', newline='') as myfile:
     wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
     wr.writerow(mylist)

其他提示

下面是亚历马尔泰利的一个安全的版本：

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)

我发现的最好的选择是使用 savetxt 来自 numpy 模块:

import numpy as np
np.savetxt("file_name.csv", data1, delimiter=",", fmt='%s', header=header)

如果您有多个需要堆叠的列表

np.savetxt("file_name.csv", np.column_stack((data1, data2)), delimiter=",", fmt='%s', header=header)

有关的另一种方法，可以使用数据帧在大熊猫：并且其可以将数据容易转储到CSV就像代码如下：

import pandas
df = pandas.DataFrame(data={"col1": list_1, "col2": list_2})
df.to_csv("./file.csv", sep=',',index=False)

用于读取和写入逗号或制表符分隔文件使用Python的csv模块。 csv模块是优选的，因为它给你好控制引述。

例如，这里是你的工作示例：

import csv
data = ["value %d" % i for i in range(1,4)]

out = csv.writer(open("myfile.csv","w"), delimiter=',',quoting=csv.QUOTE_ALL)
out.writerow(data)

产地：

"value 1","value 2","value 3"

您可以在这种情况下使用的string.join方法。

分割在几个为清楚起见线 - 这里是一个交互式会话

>>> a = ['a','b','c']
>>> first = '", "'.join(a)
>>> second = '"%s"' % first
>>> print second
"a", "b", "c"

或者作为一个单一的线

>>> print ('"%s"') % '", "'.join(a)
"a", "b", "c"

不过，你可能有一个问题是你的弦已经得到嵌入式引号。如果是这样的话，你需要决定如何躲避他们的。

在 CSV模块可以利用这一切的照顾你，让你各种引用选项中进行选择（所有领域，只能用引号和分隔符，唯一的非数字字段，字段等），以及如何esacpe控制charecters（双引号或转义字符串）。如果你的价值观很简单，将的string.join可能是确定的，但如果你有管理大量的边缘的情况下，使用该模块使用。

Jupyter笔记本

比方说，你的列表是A

然后就可以编写以下广告你将它作为一个CSV文件（仅列！）

R="\n".join(A)
f = open('Columns.csv','w')
f.write(R)
f.close()

你应该使用CSV模块肯定的，但机会是，你需要写的Unicode。对于那些需要写unicode的，这是从示例页面类，你可以作为一个实用程序模块使用：

import csv, codecs, cStringIO

class UTF8Recoder:
    """
    Iterator that reads an encoded stream and reencodes the input to UTF-8
    """
    def __init__(self, f, encoding):
        self.reader = codecs.getreader(encoding)(f)

def __iter__(self):
    return self

def next(self):
    return self.reader.next().encode("utf-8")

class UnicodeReader:
    """
    A CSV reader which will iterate over lines in the CSV file "f",
    which is encoded in the given encoding.
    """

def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
    f = UTF8Recoder(f, encoding)
    self.reader = csv.reader(f, dialect=dialect, **kwds)

def next(self):
    row = self.reader.next()
    return [unicode(s, "utf-8") for s in row]

def __iter__(self):
    return self

class UnicodeWriter:
    """
    A CSV writer which will write rows to CSV file "f",
    which is encoded in the given encoding.
"""

def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
    # Redirect output to a queue
    self.queue = cStringIO.StringIO()
    self.writer = csv.writer(self.queue, dialect=dialect, **kwds)
    self.stream = f
    self.encoder = codecs.getincrementalencoder(encoding)()

def writerow(self, row):
    self.writer.writerow([s.encode("utf-8") for s in row])
    # Fetch UTF-8 output from the queue ...
    data = self.queue.getvalue()
    data = data.decode("utf-8")
    # ... and reencode it into the target encoding
    data = self.encoder.encode(data)
    # write to the target stream
    self.stream.write(data)
    # empty queue
    self.queue.truncate(0)

def writerows(self, rows):
    for row in rows:
        self.writerow(row)

下面是另一种解决方案，它不需要csv模块。

print ', '.join(['"'+i+'"' for i in myList])

示例：

>>> myList = [u'value 1', u'value 2', u'value 3']
>>> print ', '.join(['"'+i+'"' for i in myList])
"value 1", "value 2", "value 3"

然而，如果初始列表包含一些”，他们就不会被转义如果需要，也可以调用一个函数来逃避它这样的：

print ', '.join(['"'+myFunction(i)+'"' for i in myList])

这个解决方案听起来很疯狂，但因为蜂蜜工作顺利

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL,delimiter='\n')
    wr.writerow(mylist)

在文件正在被csvwriter因此CSV属性写入维持即逗号分隔。定界符由移动的列表项目下一行，每次有助于主要部分。

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow