我尝试将文件读入熊猫。 该文件的值由空格分隔,但具有不同的空格数 我试过了:
pd.read_csv('file.csv', delimiter=' ')
但它不起作用
答案 0 :(得分:80)
添加delim_whitespace=True
参数,它比正则表达式快。
答案 1 :(得分:23)
您可以使用正则表达式作为分隔符:
pd.read_csv("whitespace.csv", header=None, delimiter=r"\s+")
答案 2 :(得分:0)
如果无法使用接受的答案来进行文本解析(例如,如果您的文本文件包含不统一的行),则值得尝试使用Python的csv库-这是一个使用用户定义的Dialect的示例:
import csv
csv.register_dialect('skip_space', skipinitialspace=True)
with open(my_file, 'r') as f:
reader=csv.reader(f , delimiter=' ', dialect='skip_space')
for item in reader:
print(item)