UnicodeEncodeError:'ascii'编解码器无法对位置10-11中的字符进行编码:序数不在范围内(128)

时间:2014-02-10 20:50:00

标签: python excel encoding python-unicode

我正在尝试创建一个脚本。将搜索.xls文件并打印出条件为真的行的脚本。对于那件事我没有任何疑问。但是,当我需要在文件中写入该行时,我会遇到问题。

这是代码:

import xlrd    
import string
dataFile = open('Napadaci.txt', 'w')
workbook = xlrd.open_workbook('TBS_58_pos10_stars75_2014-02-09.xls')
worksheet = workbook.sheet_by_name('Sheet1')
num_rows = worksheet.nrows - 1
num_cells = worksheet.ncols - 1
curr_row = -1
b = 0
new_cell_value = ""
while curr_row < num_rows:
      curr_row += 1
  row = worksheet.row(curr_row)
  curr_cell = 4
  cell_value = worksheet.cell_value(curr_row, curr_cell)
  if cell_value < 17.0:
    curr_cell = 5
    cell_value = worksheet.cell_value(curr_row, curr_cell)
    if cell_value == 95.0:
        curr_cell = 9
        cell_value = worksheet.cell_value(curr_row, curr_cell)
        if cell_value == "Tehnical" or cell_value == "Quick" or cell_value == "Head" or cell_value == "Unpredictable":  
            b += 1
            dataFile.write(str(b)+'\n')
            curr_cell = -1
            while (curr_cell + 1) < num_cells:
                curr_cell += 1
                cell_value = worksheet.cell_value(curr_row, curr_cell)
                new_cell_value=cell_value
                if isinstance(cell_value, str):
                    new_cell_value = cell_value.encode('ascii','ignore')
                dataFile.write(str(new_cell_value)+'\n')
        dataFile.write(str('Trazim sljedeceg')+'\n'+'\n'+'\n'+'\n')

所以,一堆ifs确保行完全正确。 但是,当我尝试运行它时,我得到错误: UnicodeEncodeError:'ascii'编解码器无法对位置10-11中的字符进行编码:序数不在范围内(128) 我用Google搜索并发现这是因为在.xls文件中我有这样的字符:Å¡‡‡等 我将逐个通​​过所有单元格,我认为我只需要在有字符串的单元格中解决这个问题,因此这是最后一个。

我很确定
    new_cell_value = cell_value.encode('ascii','ignore')

行应该修复它,但它不会发生。请帮忙,我不知道我做错了什么。 如果您需要更多额外信息。我有Python 2.7.3,我正在运行ubuntu 12.04

编辑:哦,那些字符对我来说不是很重要,所以如果需要,我可以丢失它们。

1 个答案:

答案 0 :(得分:1)

这里的问题是if语句。

>>> uni = u"\u04533testing"
>>> print uni
ѓ3testing
>>> isinstance(uni, str)
False
>>> type(uni)
<type 'unicode'>

因为此对象不是字符串,所以它是一个unicode字符串。因此,编码永远不会被击中。 你想要

if isinstance(cell_value,unicode):