大型复杂.csv数据集的最佳逗号(,)替代方法

时间:2017-11-15 05:47:47

标签: python database windows csv database-design

而不是逗号(,),在.csv文件中使用的最佳替代单字符或字符串是什么,这些文件经常作为列和行(如表)处理?我的值确实包含一个不可预测的数字和逗号模式。

需要与python(最好是)其他应用程序的兼容性。我的值通常包含逗号.,因此我一直在使用",",或者更确切地说是"value"模式。我现在在用:

"column1","column2","column3" 

但是,在这些情况下使"正常工作通常会很痛苦。

例如使用","重新排序csv列:

import csv

infilename = input('Enter .csv to rearrange: ')

with open(infilename, 'r') as infile, open('reordered__'+ infilename, 'a') as outfile:
    fieldnamesout = ['B', 'C', 'A', 'D']
    fieldnamesin = ['A', 'B', 'C', 'D']
    reader = csv.DictReader(infile, delimiter=',', quotechar='"', fieldnames=fieldnamesin)
    writer = csv.DictWriter(outfile, delimiter=',', quotechar='"', fieldnames=fieldnamesout, quoting=csv.QUOTE_ALL)
    for row in reader:
        writer.writerow(row)

垂直线|或明星*似乎是一个很好的单一字符选择,因为它们在目录和文件名中是不允许的,并且在“常规”中相对罕见“文字。

问:有什么建议用于存储为文本的大型复杂数据库,其中值包含逗号和其他异常字符?使用垂直线(|)而不是逗号(,)?

的任何缺点

0 个答案:

没有答案