熊猫以数组形式打开.dat文件

时间:2018-11-28 21:37:10

标签: python pandas csv

我有以下.dat文件

https://github.com/lukepolson/School/blob/master/Phys%20411/Assignment%205/JamesBay_temperature.dat

当我使用

在大熊猫中打开它时
df_james = pd.read_csv('JamesBay_temperature.dat', sep=" ",
                        skiprows=[0,1,2], names=['Temperature'])

它包含的值是一个数组数组:

In [18]: df_james.values
Out[18]:
array([[ 4.89],
       [ 4.89],
       [ 4.89],
       ...,
       [14.77],
       [14.67],
       [14.67]])

为什么熊猫要这样做?与我打开的文件有关,还是我使用pd.read_csv错误?

1 个答案:

答案 0 :(得分:1)

您获得的结果不是数组数组。它是具有float项的单个numpy数组对象:

In [1]: arr = df_james.values

In [2]: type(arr)  # Show object type
Out[2]: numpy.ndarray

In [3]: arr.dtype  # Show data type of array entries
Out[3]: dtype('float64')   

In [4]: arr.shape  # Show number of rows and columns
Out[4]: (2979360, 1)