我正在尝试将unicode数据文件读取到几个列表中。我有一个这种格式的混合unicode / integer / float数据文件:
Է 1335 1.1
դ 1380 1.2
32 1.3
ն 1398 1.4
ե 1381 1.5
ր 1408 1.6
根据此问题numpy.genfromtxt我正在使用numpy genfromtxt
阅读该文件:
decodef = lambda x: x.decode("utf-8")
arr = np.genfromtxt("./data_files/data", delimiter="\t", dtype="U1, i4, f8", converters={0: decodef})
这给了我一个numpy.ndarray
不包含空格,但是第一列中空格的空元素:
('Է', 1335, 1.1)
('դ', 1380, 1.2)
('', 32, 1.3)
('ն', 1398, 1.4)
('ե', 1381, 1.5)
('ր', 1408, 1.6)
我已经尝试使用autostrip=False (the default value)
,missing_values=" "
,replace_space='_'
参数来解决空间问题,但仍然会获得具有空格的空项目的相同数组。我猜所有这些参数仅用于分隔符操作?!
任何想法如何克服这个?
正在使用Python版本3.4.5。
答案 0 :(得分:1)
显然genfromtxt方法以某种方式移除了空间。
如果您使用
TIMESTAMP
有效。 我仍然不明白为什么。