Question

有没有办法将NumPy数组转储到CSV文件中？我有一个2D NumPy数组，需要以人类可读的格式转储它。

Answer 1

numpy.savetxt将数组保存到文本文件中。

import numpy
a = numpy.asarray([ [1,2,3], [4,5,6], [7,8,9] ])
numpy.savetxt("foo.csv", a, delimiter=",")

Answer 2

您可以使用pandas。它确实需要一些额外的内存，因此并不总是可行，但它非常快速且易于使用。

import pandas as pd 
pd.DataFrame(np_array).to_csv("path/to/file.csv")

如果您不想要标题或索引，请使用to_csv("/path/to/file.csv", header=None, index=None)

Answer 3

tofile是一个方便的功能：

import numpy as np
a = np.asarray([ [1,2,3], [4,5,6], [7,8,9] ])
a.tofile('foo.csv',sep=',',format='%10.5f')

该手册页有一些有用的注释：

这是一种便于快速存储阵列数据的功能。关于字节序和精度的信息丢失了，所以这种方法不是用于存档数据或传输数据的文件的不错选择在具有不同字节序的机器之间。其中一些问题可以通过输出数据作为文本文件来克服，代价是速度和文件大小。

请注意。此函数不会生成多行csv文件，它会将所有内容保存到一行。

Answer 4

将记录数组写为带有标题的CSV文件需要更多的工作。

此示例读取带有第一行标题的CSV文件，然后写入相同的文件。

import numpy as np

# Write an example CSV file with headers on first line
with open('example.csv', 'w') as fp:
    fp.write('''\
col1,col2,col3
1,100.1,string1
2,222.2,second string
''')

# Read it as a Numpy record array
ar = np.recfromcsv('example.csv')
print(repr(ar))
# rec.array([(1, 100.1, 'string1'), (2, 222.2, 'second string')], 
#           dtype=[('col1', '<i4'), ('col2', '<f8'), ('col3', 'S13')])

# Write as a CSV file with headers on first line
with open('out.csv', 'w') as fp:
    fp.write(','.join(ar.dtype.names) + '\n')
    np.savetxt(fp, ar, '%s', ',')

请注意，此示例不考虑带逗号的字符串。要考虑非数字数据的引号，请使用csv包：

import csv

with open('out2.csv', 'wb') as fp:
    writer = csv.writer(fp, quoting=csv.QUOTE_NONNUMERIC)
    writer.writerow(ar.dtype.names)
    writer.writerows(ar.tolist())

Answer 5

如果您想在列中撰写：

    for x in np.nditer(a.T, order='C'): 
            file.write(str(x))
            file.write("\n")

这里＆＃39; a＆＃39;是numpy数组的名称和＆＃39;文件＆＃39;是要写入文件的变量。

如果您想要排成一行：

    writer= csv.writer(file, delimiter=',')
    for x in np.nditer(a.T, order='C'): 
            row.append(str(x))
    writer.writerow(row)

Answer 6

如上所述，将数组转储到CSV文件中的最佳方法是使用.savetxt(...)方法。但是，有些事情我们应该知道如何正确完成。

例如，如果您有一个编号为dtype = np.int32的numpy数组

   narr = np.array([[1,2],
                 [3,4],
                 [5,6]], dtype=np.int32)

，并希望使用savetxt作为

保存

np.savetxt('values.csv', narr, delimiter=",")

它将以浮点指数格式存储数据

1.000000000000000000e+00,2.000000000000000000e+00
3.000000000000000000e+00,4.000000000000000000e+00
5.000000000000000000e+00,6.000000000000000000e+00

您将不得不使用名为fmt的参数来更改格式

np.savetxt('values.csv', narr, fmt="%d", delimiter=",")

以原始格式存储数据

以gz压缩格式保存数据

此外，savetxt可用于以.gz压缩格式存储数据，这在通过网络传输数据时可能很有用。

我们只需要将文件的扩展名更改为.gz，numpy就会自动处理所有事情

np.savetxt('values.gz', narr, fmt="%d", delimiter=",")

希望有帮助

Answer 7

如果要将numpy数组（例如your_array = np.array([[1,2],[3,4]])）保存到一个单元格，可以先使用your_array.tolist()将其转换。

然后使用delimiter=';'以正常方式将其保存到一个单元格并且csv文件中的单元格看起来像[[1, 2], [2, 4]]

然后你可以像这样恢复你的数组： your_array = np.array(ast.literal_eval(cell_string))

Answer 8

你也可以使用纯python而不使用任何模块。

# format as a block of csv text to do whatever you want
csv_rows = ["{},{}".format(i, j) for i, j in array]
csv_text = "\n".join(csv_rows)

# write it to a file
with open('file.csv', 'w') as f:
    f.write(csv_text)

Answer 9

在Python中，我们使用csv.writer（）模块将数据写入csv文件。此模块类似于csv.reader（）模块。

import csv

person = [['SN', 'Person', 'DOB'],
['1', 'John', '18/1/1997'],
['2', 'Marie','19/2/1998'],
['3', 'Simon','20/3/1999'],
['4', 'Erik', '21/4/2000'],
['5', 'Ana', '22/5/2001']]

csv.register_dialect('myDialect',
delimiter = '|',
quoting=csv.QUOTE_NONE,
skipinitialspace=True)

with open('dob.csv', 'w') as f:
    writer = csv.writer(f, dialect='myDialect')
    for row in person:
       writer.writerow(row)

f.close()

定界符是用于分隔字段的字符串。默认值为comma（，）。

Answer 10

我相信您也可以很简单地完成以下操作：

将Numpy数组转换为Pandas数据框
另存为CSV

例如＃1：

    # Libraries to import
    import pandas as pd
    import nump as np

    #N x N numpy array (dimensions dont matter)
    corr_mat    #your numpy array
    my_df = pd.DataFrame(corr_mat)  #converting it to a pandas dataframe

例如＃2：

    #save as csv 
    my_df.to_csv('foo.csv', index=False)   # "foo" is the name you want to give
                                           # to csv file. Make sure to add ".csv"
                                           # after whatever name like in the code

Answer 11

为了将 NumPy 数组存储到文本文件，首先从 Numpy 模块导入保存文本

考虑您的 Numpy 数组名称是 train_df：

from numpy import savetxt
np.savetxt('train_df.txt', train_df, fmt='%s')

将NumPy数组转储到csv文件中

11 个答案:

以gz压缩格式保存数据