我正在寻找一种在Python中使用quoting
定义自定义csv.writer
的方法。有4种内置的方法来评估值:
csv.QUOTE_ALL, csv.QUOTE_MINIMAL, csv.QUOTE_NONNUMERIC, csv.QUOTE_NONE
但是我需要一个引用机制来模仿Postgres'FORCE QUOTE *
,即它会引用所有非None值。使用csv.QUOTE_ALL
Python会将None转换为''
,但我希望使用空字符串。
是否可以使用内置的csv
模块(我对hacks不感兴趣,我已经这样做了:P)?或者我是否被迫编写/获取一些自定义csv解析器?
通常:是否可以为csv
模块编写自定义引用机制?
答案 0 :(得分:11)
禁用csv
引用并自行添加引号:
def quote(col):
if col is None:
return ''
# uses double-quoting style to escape existing quotes
return '"{}"'.format(str(col).replace('"', '""'))
writer = csv.writer(fileobj, quoting=csv.QUOTE_NONE, escapechar='', quotechar='')
for row in rows:
writer.writerow(map(quote, row))
通过将escapechar
和quotechar
设置为空字符串,您可以避免模块引用已经引用的值。
只要您不在csv值中使用分隔符,上述操作就会起作用。
请注意,到目前为止,自己编写逗号分隔的行会更容易:
with open(filename, 'w'), fd:
for row in rows:
fd.write(','.join(map(quote, row)) + '\r\n')
答案 1 :(得分:5)
我已经编写了自己的csv编写器,它完全符合我的要求:
class PostgresCSVWriter(object):
def __init__(self, stream, quotechar="\"", delimiter=",", escapechar="\\"):
self.stream = stream
self.quotechar = quotechar
self.delimiter = delimiter
self.escapechar = escapechar
self.buffer_size = 16384
def _convert_value(self, obj):
if obj is None:
return ""
value = str(obj)
value = value.replace(self.quotechar, self.quotechar+self.quotechar)
value = value.replace(self.delimiter, self.escapechar+self.delimiter)
return self.quotechar+value+self.quotechar
def _convert_row(self, row):
return self.delimiter.join(self._convert_value(v) for v in row) + "\r\n"
def writerow(self, row):
self.stream.write(self._convert_row(row))
def writerows(self, rows):
data = ""
counter = 0
for row in rows:
buf = self._convert_row(row)
data += buf
counter += len(buf)
if counter >= self.buffer_size:
self.stream.write(data)
data = ""
counter = 0
if data:
self.stream.write(data)
如果有人发现任何问题,请告诉我。我仍然在寻找csv
模块的解决方案。