Question

我正在尝试将unicode数据文件读取到几个列表中。我有一个这种格式的混合unicode / integer / float数据文件：

Է   1335    1.1
դ   1380    1.2
    32  1.3
ն   1398    1.4
ե   1381    1.5
ր   1408    1.6

根据此问题numpy.genfromtxt我正在使用numpy genfromtxt阅读该文件：

decodef = lambda x: x.decode("utf-8")
arr = np.genfromtxt("./data_files/data", delimiter="\t", dtype="U1, i4, f8", converters={0: decodef})

这给了我一个numpy.ndarray不包含空格，但是第一列中空格的空元素：

('Է', 1335, 1.1)
('դ', 1380, 1.2)
('', 32, 1.3)
('ն', 1398, 1.4)
('ե', 1381, 1.5)
('ր', 1408, 1.6)

我已经尝试使用autostrip=False (the default value)，missing_values=" "，replace_space='_'参数来解决空间问题，但仍然会获得具有空格的空项目的相同数组。我猜所有这些参数仅用于分隔符操作？！

任何想法如何克服这个？

正在使用Python版本3.4.5。

Answer 1

显然genfromtxt方法以某种方式移除了空间。

如果您使用

TIMESTAMP

有效。我仍然不明白为什么。