问题:我似乎无法解析文本文件中的信息,因为python将其作为完整字符串读取而不是单独的单独字符串。每个变量之间的空格不是\ t,这就是它不分离的原因。有没有办法让python灵活地删除空格并使用逗号或\ t来代替?
示例数据:
MOR125-1 MOR129-1 0.587
MOR125-1 MOR129-3 0.598
MOR129-1 MOR129-3 0.115
我正在使用的代码:
with open("Distance_Data_No_Bootstrap_RAW.txt","rb") as f:
reader = csv.reader(f,delimiter="\t")
d=list(reader)
for i in range(3):
print d[i]
输出:
['MOR125-1 MOR129-1 0.587']
['MOR125-1 MOR129-3 0.598']
['MOR129-1 MOR129-3 0.115']
期望的输出:
['MOR125-1', 'MOR129-1', '0.587']
['MOR125-1', 'MOR129-3', '0.598']
['MOR129-1', 'MOR129-3', '0.115']
答案 0 :(得分:8)
您可以简单地将分隔符声明为空格,并要求csv在分隔符后跳过初始空格。这样,您的分隔符实际上是正则表达式' +'
,即一个或多个空格。
rd = csv.reader(fd, delimiter=' ', skipinitialspace=True)
for row in rd:
print row
['MOR125-1', 'MOR129-1', '0.587']
['MOR125-1', 'MOR129-3', '0.598']
['MOR129-1', 'MOR129-3', '0.115']
答案 1 :(得分:2)
您可以指示csv.reader
使用空格作为分隔符并跳过所有额外空间:
reader = csv.reader(f, delimiter=" ", skipinitialspace=True)
有关可用参数的详细信息,请查看Python docs:
Dialect.delimiter 用于分隔字段的单字符字符串。它默认为','。 Dialect.skipinitialspace 如果为True,则忽略分隔符后面的空格。默认值为False。