numpy数组中缺少空格

时间:2017-01-03 14:34:39

标签: python numpy unicode utf-8

我正在尝试将unicode数据文件读取到几个列表中。我有一个这种格式的混合unicode / integer / float数据文件:

Է   1335    1.1
դ   1380    1.2
    32  1.3
ն   1398    1.4
ե   1381    1.5
ր   1408    1.6

根据此问题numpy.genfromtxt我正在使用numpy genfromtxt阅读该文件:

decodef = lambda x: x.decode("utf-8")
arr = np.genfromtxt("./data_files/data", delimiter="\t", dtype="U1, i4, f8", converters={0: decodef})

这给了我一个numpy.ndarray不包含空格,但是第一列中空格的空元素:

('Է', 1335, 1.1)
('դ', 1380, 1.2)
('', 32, 1.3)
('ն', 1398, 1.4)
('ե', 1381, 1.5)
('ր', 1408, 1.6)

我已经尝试使用autostrip=False (the default value)missing_values=" "replace_space='_'参数来解决空间问题,但仍然会获得具有空格的空项目的相同数组。我猜所有这些参数仅用于分隔符操作?!

任何想法如何克服这个?

正在使用Python版本3.4.5。

1 个答案:

答案 0 :(得分:1)

显然genfromtxt方法以某种方式移除了空间。

如果您使用

TIMESTAMP

有效。 我仍然不明白为什么。