Question

问题：我似乎无法解析文本文件中的信息，因为python将其作为完整字符串读取而不是单独的单独字符串。每个变量之间的空格不是\ t，这就是它不分离的原因。有没有办法让python灵活地删除空格并使用逗号或\ t来代替？

示例数据：

MOR125-1   MOR129-1   0.587
MOR125-1   MOR129-3   0.598
MOR129-1   MOR129-3   0.115

我正在使用的代码：

with open("Distance_Data_No_Bootstrap_RAW.txt","rb") as f:
reader = csv.reader(f,delimiter="\t")
d=list(reader)
for i in range(3):
    print d[i]

输出： ['MOR125-1 MOR129-1 0.587'] ['MOR125-1 MOR129-3 0.598'] ['MOR129-1 MOR129-3 0.115']

期望的输出：

['MOR125-1', 'MOR129-1', '0.587']
['MOR125-1', 'MOR129-3', '0.598']
['MOR129-1', 'MOR129-3', '0.115']

Answer 1

您可以简单地将分隔符声明为空格，并要求csv在分隔符后跳过初始空格。这样，您的分隔符实际上是正则表达式' +'，即一个或多个空格。

rd = csv.reader(fd, delimiter=' ', skipinitialspace=True)
for row in rd:
    print row

['MOR125-1', 'MOR129-1', '0.587']
['MOR125-1', 'MOR129-3', '0.598']
['MOR129-1', 'MOR129-3', '0.115']

Answer 2

您可以指示csv.reader使用空格作为分隔符并跳过所有额外空间：

reader = csv.reader(f, delimiter=" ", skipinitialspace=True)

有关可用参数的详细信息，请查看Python docs：

Dialect.delimiter 用于分隔字段的单字符字符串。它默认为'，'。 Dialect.skipinitialspace 如果为True，则忽略分隔符后面的空格。默认值为False。