如何在读取文本文件时删除多个空格

时间:2016-06-09 14:52:52

标签: python python-2.7 csv

问题:我似乎无法解析文本文件中的信息,因为python将其作为完整字符串读取而不是单独的单独字符串。每个变量之间的空格不是\ t,这就是它不分离的原因。有没有办法让python灵活地删除空格并使用逗号或\ t来代替?

示例数据:

MOR125-1   MOR129-1   0.587
MOR125-1   MOR129-3   0.598
MOR129-1   MOR129-3   0.115

我正在使用的代码:

with open("Distance_Data_No_Bootstrap_RAW.txt","rb") as f:
reader = csv.reader(f,delimiter="\t")
d=list(reader)
for i in range(3):
    print d[i]

输出: ['MOR125-1 MOR129-1 0.587'] ['MOR125-1 MOR129-3 0.598'] ['MOR129-1 MOR129-3 0.115']

期望的输出:

['MOR125-1', 'MOR129-1', '0.587']
['MOR125-1', 'MOR129-3', '0.598']
['MOR129-1', 'MOR129-3', '0.115']

2 个答案:

答案 0 :(得分:8)

您可以简单地将分隔符声明为空格,并要求csv在分隔符后跳过初始空格。这样,您的分隔符实际上是正则表达式' +',即一个或多个空格。

rd = csv.reader(fd, delimiter=' ', skipinitialspace=True)
for row in rd:
    print row
['MOR125-1', 'MOR129-1', '0.587']
['MOR125-1', 'MOR129-3', '0.598']
['MOR129-1', 'MOR129-3', '0.115']

答案 1 :(得分:2)

您可以指示csv.reader使用空格作为分隔符并跳过所有额外空间:

reader = csv.reader(f, delimiter=" ", skipinitialspace=True)

有关可用参数的详细信息,请查看Python docs

  

Dialect.delimiter   用于分隔字段的单字符字符串。它默认为','。   Dialect.skipinitialspace   如果为True,则忽略分隔符后面的空格。默认值为False。