Question

我有以下.dat文件

https://github.com/lukepolson/School/blob/master/Phys%20411/Assignment%205/JamesBay_temperature.dat

当我使用

在大熊猫中打开它时

df_james = pd.read_csv('JamesBay_temperature.dat', sep=" ",
                        skiprows=[0,1,2], names=['Temperature'])

它包含的值是一个数组数组：

In [18]: df_james.values
Out[18]:
array([[ 4.89],
       [ 4.89],
       [ 4.89],
       ...,
       [14.77],
       [14.67],
       [14.67]])

为什么熊猫要这样做？与我打开的文件有关，还是我使用pd.read_csv错误？

Answer 1

您获得的结果不是数组数组。它是具有float项的单个numpy数组对象：

In [1]: arr = df_james.values

In [2]: type(arr)  # Show object type
Out[2]: numpy.ndarray

In [3]: arr.dtype  # Show data type of array entries
Out[3]: dtype('float64')   

In [4]: arr.shape  # Show number of rows and columns
Out[4]: (2979360, 1)

熊猫以数组形式打开.dat文件

1 个答案: