我有一个很长的numpy阵列,里面装满了DNA序列。我想将它转换为一个没有任何空格等的字符串。数组长度为100 000个元素,看起来像['T''G''A''A'.....]我想要它作为一个string:TGAA ...我不想将它保存为文件或任何东西,只需将它作为一个字符串,这样我就可以使用string.find()来查找子序列AAAAAAAAAATTTTTTTTTT(基因分隔符)的索引。
但是当我使用numpy_str或numpy2str等时,我只得到了我的序列的缩短版本。 numpy数组位于filedna.seq
string = np.array_str(filedna.seq).replace('','').replace("'",'').replace('[','').replace
(']','')
print(len(filedna.seq), len(string))
print(string)
我得到以下打印输出:
100000 10
TGA ...,GTC
所以字符串只是arrray的缩短版本,带点和逗号。 TGA和GTC确实匹配numpy数组中的第一个和最后三个元素。
如何从包含所有100 000个元素的数组创建一个字符串?