我需要读入大量的.txt文件,每个文件都包含一个小数(有些是正数,有些是负数),并将这些文件追加到2个数组(基因型和表型)中。随后,我希望在scipy中对这些数组执行一些数学运算,但是负(' - ')符号会导致问题。具体来说,我无法将数组转换为float,因为' - '被读取为字符串,导致以下错误:
ValueError: could not convert string to float:
这是我目前编写的代码:
import linecache
gene_array=[]
phen_array=[]
for i in genotype:
for j in phenotype:
genotype='/path/g.txt'
phenotype='/path/p.txt'
g=linecache.getline(genotype,1)
p=linecache.getline(phenotype,1)
p=p.strip()
g=g.strip()
gene_array.append(g)
phen_array.append(p)
gene_array=map(float,gene_array)
phen_array=map(float,phen_array)
我相当肯定这是导致问题的负面信号,但我不清楚为什么。我在这里使用Linecache是一个问题吗?有没有更好的替代方法?
的结果
print gene_array
是
['-0.0448022516321286', '-0.0236187263814157', '-0.150505384829925', '-0.00338459268479522', '0.0142429109897682', '0.0286253352284279', '-0.0462358095345649', '0.0286232317578776', '-0.00747425206137217', '0.0231790239373428', '-0.00266935581919541', '0.00825077426011094', '0.0272744527203547', '0.0394829854063242', '0.0233109171715023', '0.165841084392078', '0.00259693465334536', '-0.0342590874424289', '0.0124600520095644', '0.0713627590092807', '-0.0189374898081401', '-0.00112750710611284', '-0.0161387333242288', '0.0227226505624106', '0.0382173405035751', '0.0455518646388402', '-0.0453048799717046', '0.0168570746329513']
答案 0 :(得分:3)
问题似乎是空字符串或空格,从错误消息中可以看出
ValueError: could not convert string to float:
要使其有效,请将地图转换为列表理解
gene_array=[float(e) for e in gene_array if e]
phen_array=[float(e) for e in phen_array if e]
空字符串表示
float(" ")
或float("")
会出现值错误,因此如果gene_array
或phen_array
中的任何项目都有空格,则转换为float时会出错/ p>
空字符串可能有很多原因,如
答案 1 :(得分:0)
错误消息中没有任何内容表明-
是问题所在。最可能的原因是gene_array
和/或phen_array
包含空字符串(''
)。
如文档中所述,linecache.getline()
将在错误上返回
''
(对于找到的行,将包含终止换行符。)
答案 2 :(得分:0)
问题绝对不是负号。 Python使用负号转换字符串没有问题。我建议您针对浮动RegEx运行每个条目,看看它们是否全部通过。