我有以下.dat文件
https://github.com/lukepolson/School/blob/master/Phys%20411/Assignment%205/JamesBay_temperature.dat
当我使用
在大熊猫中打开它时df_james = pd.read_csv('JamesBay_temperature.dat', sep=" ",
skiprows=[0,1,2], names=['Temperature'])
它包含的值是一个数组数组:
In [18]: df_james.values
Out[18]:
array([[ 4.89],
[ 4.89],
[ 4.89],
...,
[14.77],
[14.67],
[14.67]])
为什么熊猫要这样做?与我打开的文件有关,还是我使用pd.read_csv错误?
答案 0 :(得分:1)
您获得的结果不是数组数组。它是具有float
项的单个numpy数组对象:
In [1]: arr = df_james.values
In [2]: type(arr) # Show object type
Out[2]: numpy.ndarray
In [3]: arr.dtype # Show data type of array entries
Out[3]: dtype('float64')
In [4]: arr.shape # Show number of rows and columns
Out[4]: (2979360, 1)