Question

我正在尝试创建一个脚本。将搜索.xls文件并打印出条件为真的行的脚本。对于那件事我没有任何疑问。但是，当我需要在文件中写入该行时，我会遇到问题。

这是代码：

import xlrd    
import string
dataFile = open('Napadaci.txt', 'w')
workbook = xlrd.open_workbook('TBS_58_pos10_stars75_2014-02-09.xls')
worksheet = workbook.sheet_by_name('Sheet1')
num_rows = worksheet.nrows - 1
num_cells = worksheet.ncols - 1
curr_row = -1
b = 0
new_cell_value = ""
while curr_row < num_rows:
      curr_row += 1
  row = worksheet.row(curr_row)
  curr_cell = 4
  cell_value = worksheet.cell_value(curr_row, curr_cell)
  if cell_value < 17.0:
    curr_cell = 5
    cell_value = worksheet.cell_value(curr_row, curr_cell)
    if cell_value == 95.0:
        curr_cell = 9
        cell_value = worksheet.cell_value(curr_row, curr_cell)
        if cell_value == "Tehnical" or cell_value == "Quick" or cell_value == "Head" or cell_value == "Unpredictable":  
            b += 1
            dataFile.write(str(b)+'\n')
            curr_cell = -1
            while (curr_cell + 1) < num_cells:
                curr_cell += 1
                cell_value = worksheet.cell_value(curr_row, curr_cell)
                new_cell_value=cell_value
                if isinstance(cell_value, str):
                    new_cell_value = cell_value.encode('ascii','ignore')
                dataFile.write(str(new_cell_value)+'\n')
        dataFile.write(str('Trazim sljedeceg')+'\n'+'\n'+'\n'+'\n')

所以，一堆ifs确保行完全正确。但是，当我尝试运行它时，我得到错误： UnicodeEncodeError：'ascii'编解码器无法对位置10-11中的字符进行编码：序数不在范围内（128）我用Google搜索并发现这是因为在.xls文件中我有这样的字符：Å¡‡‡等我将逐个通过所有单元格，我认为我只需要在有字符串的单元格中解决这个问题，因此这是最后一个。

我很确定

    new_cell_value = cell_value.encode('ascii','ignore')

行应该修复它，但它不会发生。请帮忙，我不知道我做错了什么。如果您需要更多额外信息。我有Python 2.7.3，我正在运行ubuntu 12.04

编辑：哦，那些字符对我来说不是很重要，所以如果需要，我可以丢失它们。

Answer 1

这里的问题是if语句。

>>> uni = u"\u04533testing"
>>> print uni
ѓ3testing
>>> isinstance(uni, str)
False
>>> type(uni)
<type 'unicode'>

因为此对象不是字符串，所以它是一个unicode字符串。因此，编码永远不会被击中。你想要

if isinstance(cell_value,unicode):

UnicodeEncodeError：'ascii'编解码器无法对位置10-11中的字符进行编码：序数不在范围内（128）

1 个答案: