导入文本文件会出错

时间:2015-03-24 11:05:01

标签: python string file-io floating-point readlines

我有一个包含以下数据的文本文件:

5298    10036   4   360 8
6128    11947   2   385 7
9472    18930   0   233 4
5056    9790    1   293 6

我使用以下代码阅读此文件:

file1 = open("test.txt","r")
lines = file1.readlines()       
BF=[map(float, line.split()) for line in lines]

这给了我以下错误:

could not convert string to float: ÿþ5

为什么我会看到此错误?

更新

print lines 

所示:

['\xff\xfe5\x002\x009\x008\x00\t\x001\x000\x000\x003\x006\x00\t\x004\x00\t\x003\x006\x000\x00\t\x008\x00\r\x00\n', '\x006\x001\x002\x008\x00\t\x001\x001\x009\x004\x007\x00\t\x002\x00\t\x003\x008\x005\x00\t\x007\x00\r\x00\n', '\x009\x004\x007\x002\x00\t\x001\x008\x009\x003\x000\x00\t\x000\x00\t\x002\x003\x003\x00\t\x004\x00\r\x00\n', '\x005\x000\x005\x006\x00\t\x009\x007\x009\x000\x00\t\x001\x00\t\x002\x009\x003\x00\t\x006\x00\r\x00\n', '\x001\x005\x000\x006\x004\x00\t\x003\x000\x001\x006\x000\x00\t\x001\x00\t\x003\x001\x002\x00\t\x008\x00']

3 个答案:

答案 0 :(得分:6)

您有一个utf-16 BOM,0xFE 0xFF被解释为ÿþ,您需要打开该文件并传递编码。

file1 = open("test.txt","r", encoding = "utf-16")

当你使用python 2时,你可以试试这个:

import io
file1 = io.open("test.txt","r", encoding = "utf-16")

答案 1 :(得分:1)

import io
file1 = io.open("test.txt","r",encoding='utf-16')
lines = file1.readlines()
BF=[map(float, line.split()) for line in lines]
print BF

结果:

[[5298.0, 10036.0, 4.0, 360.0, 8.0], [6128.0, 11947.0, 2.0, 385.0, 7.0], [9472.0, 18930.0, 0.0, 233.0, 4.0], [5056.0, 9790.0, 1.0, 293.0, 6.0]]

答案 2 :(得分:1)

如果每一行都有可能在末尾包含换行符,为什么不为行中的每一行打印line.split();只是为了确认数字是否正确分开......