在pandas中,让我说我想用read_table阅读以下字符串:
A\tB\tC\t\t\tD\t\tE\t\t\t\t\t\t\t
其中\ t是制表符。如果我像这样使用read_table:
with open('file.dat') as f:
df = pd.read_table(f, delimiter = '\r\n\')
它将读取file.dat中的每一行,但它会从每一行中删除尾随\ t,并且从示例行只保留:
A\tB\tC\t\t\tD\t\tE
另一方面,如果我只是直接从文件中读取这行:
line = []
with open('file.dat') as f:
for l in f:
line.append(l)
我可以确认文件中是否存在。
为什么会发生这种情况,更重要的是我该如何预防呢?
答案 0 :(得分:0)
默认为:
read_table(filepath_or_buffer, sep='\t', delimiter=None,
尝试更改分隔符:
pd.read_table(f, delimiter = '\r\n\', sep=',' )