Question

我尝试将文件读入熊猫。该文件的值由空格分隔，但具有不同的空格数我试过了：

pd.read_csv('file.csv', delimiter=' ')

但它不起作用

Answer 1

添加delim_whitespace=True参数，它比正则表达式快。

Answer 2

您可以使用正则表达式作为分隔符：

pd.read_csv("whitespace.csv", header=None, delimiter=r"\s+")

Answer 3

如果无法使用接受的答案来进行文本解析（例如，如果您的文本文件包含不统一的行），则值得尝试使用Python的csv库-这是一个使用用户定义的Dialect的示例：

 import csv

 csv.register_dialect('skip_space', skipinitialspace=True)
 with open(my_file, 'r') as f:
      reader=csv.reader(f , delimiter=' ', dialect='skip_space')
      for item in reader:
          print(item)

如何在pandas中读取空格分隔值的文件

3 个答案: