将Excel文件加载到numpy 2D数组中

时间:2013-06-11 20:17:58

标签: python excel numpy

是否有更简单的方法将excel文件直接加载到Numpy数组中?

我查看了numpy文档中的numpy.genfromtxt自动加载功能,但它没有直接加载excel文件。

array = np.genfromtxt("Stats.xlsx")
ValueError: Some errors were detected !
Line #3 (got 2 columns instead of 1)
Line #5 (got 5 columns instead of 1)
......

现在我正在使用openpyxl.reader.excel来读取excel文件,然后附加到numpy 2D数组。这似乎效率低下。 理想情况下,我希望将excel文件直接加载到numpy 2D数组中。

1 个答案:

答案 0 :(得分:15)

老实说,如果您正在使用异构数据(因为电子表格可能包含),使用pandas.DataFrame比直接使用numpy更好。

虽然pandas在某种意义上只是numpy的包装,但它非常好地处理异构数据。 (以及其他许多东西......对于“类似电子表格”的数据,它是蟒蛇世界的黄金标准。)

如果您决定走这条路线,只需使用pandas.read_excel