>>> from io import StringIO
>>> import numpy as np
>>> s = StringIO("1,1.3,abcde")
>>> data = np.genfromtxt(s, dtype=[('myint','i8'),('myfloat','f8'),
... ('mystring','S5')], delimiter=",")
>>> data
array((1, 1.3, 'abcde'),
dtype=[('myint', '<i8'), ('myfloat', '<f8'), ('mystring', '|S5')])
我的问题与dtype
论证有关。
我无法理解dtype="i8,f8,|S5"
代表什么。
我可以看出 i 是一个整数, f 是浮点数而 s 是字符串但是i8中的8是什么?我首先理解它的字节,但是如何才能使s5成为可能。
我了解 dtype 有助于指定数据类型,以便我们可以从CSV文件中读取,但有人可以对数据类型有所了解
答案 0 :(得分:2)
i8
或f8
中的8是字节数。有几种不同的方式来表达相同的datatype in numpy。您从np.genfromtxt
看到的字符串采用紧凑格式。前面的<
或>
符号表示小端或大端(请参阅documentation),后跟i
表示整数,或f
表示浮点数/双精度,以及字节数。
较长的数据类型名称的大小为,而不是字节,这意味着i8
为int64
,f4
为float32
,因此上。 E.g:
>>> np.dtype('i8')
dtype('int64')
>>> np.dtype('f4')
dtype('float32')
默认情况下,这些都是小端。如果你想要大端,据我所知,np.dtype
不会返回长格式:
>>> np.dtype('>c16')
dtype('>c16')
字符串是一种特殊的数据类型,数字表示字符串字符的最大数量。有关详细信息,请参阅this question。