此代码设置为读取两列数据,然后将第一列打印到第一个numpy数组中,然后将第二列打印到第二个numpy数组中。
def read2coldata(filename):
import numpy
b = []
f = open(filename,"r")
lines = f.readlines()
f.close()
for line in lines:
a = line.split()
for i in a:
b.append(i)
return (numpy.array(b[::2]),numpy.array(b[1::2]))
然而,这给出了:
(array(['1.5', '8', '16', '17'], dtype='|S3'), array(['4', '5', '6', '6.2'], dtype='|S3'))
如何摆脱dtype="|S3"
部分离开:
(array(["1.5","8","16","17"], array(["4","5","6","6.2"])
答案 0 :(得分:5)
dtype="S3"
你不想“离开”。
当您打印一个numpy数组时,它会为您提供其中的数据类型。它不是数据的一部分,它是关于程序如何存储和理解数据的信息。
在您的特定示例中,您读取了数字,因此您可能希望在计算之后或之后使用它们,在这种情况下,您希望将数据理解为数字(在您的情况下浮动)。
目前它们被存储为字符串,这就是为什么你看到dtype="S3"
这实际上意味着大小为3或更小的字符串类型。 (这个)
我建议你替换你的函数:numpy.genfromtxt
是一个将数据从txt文件加载到numpy数组中的函数。
文档非常好,如果你花20分钟来理解参数,你会发现它非常有用。
array1 = numpy.genfromtxt('path_to_my_file.txt', usecols=0)
array2 = numpy.genfromtxt('path_to_my_file.txt', usecols=1)
这应该让你开始。