将long numpy数组转换为字符串时丢失大多数元素

时间:2017-10-14 10:49:25

标签: python string numpy

我有一个很长的numpy阵列,里面装满了DNA序列。我想将它转换为一个没有任何空格等的字符串。数组长度为100 000个元素,看起来像['T''G''A''A'.....]我想要它作为一个string:TGAA ...我不想将它保存为文件或任何东西,只需将它作为一个字符串,这样我就可以使用string.find()来查找子序列AAAAAAAAAATTTTTTTTTT(基因分隔符)的索引。

但是当我使用numpy_str或numpy2str等时,我只得到了我的序列的缩短版本。 numpy数组位于filedna.seq

string = np.array_str(filedna.seq).replace('','').replace("'",'').replace('[','').replace
(']','')
print(len(filedna.seq), len(string))
print(string)

我得到以下打印输出:

100000 10

TGA ...,GTC

所以字符串只是arrray的缩短版本,带点和逗号。 TGA和GTC确实匹配numpy数组中的第一个和最后三个元素。

如何从包含所有100 000个元素的数组创建一个字符串?

0 个答案:

没有答案