我正在尝试创建一个脚本。将搜索.xls文件并打印出条件为真的行的脚本。对于那件事我没有任何疑问。但是,当我需要在文件中写入该行时,我会遇到问题。
这是代码:
import xlrd
import string
dataFile = open('Napadaci.txt', 'w')
workbook = xlrd.open_workbook('TBS_58_pos10_stars75_2014-02-09.xls')
worksheet = workbook.sheet_by_name('Sheet1')
num_rows = worksheet.nrows - 1
num_cells = worksheet.ncols - 1
curr_row = -1
b = 0
new_cell_value = ""
while curr_row < num_rows:
curr_row += 1
row = worksheet.row(curr_row)
curr_cell = 4
cell_value = worksheet.cell_value(curr_row, curr_cell)
if cell_value < 17.0:
curr_cell = 5
cell_value = worksheet.cell_value(curr_row, curr_cell)
if cell_value == 95.0:
curr_cell = 9
cell_value = worksheet.cell_value(curr_row, curr_cell)
if cell_value == "Tehnical" or cell_value == "Quick" or cell_value == "Head" or cell_value == "Unpredictable":
b += 1
dataFile.write(str(b)+'\n')
curr_cell = -1
while (curr_cell + 1) < num_cells:
curr_cell += 1
cell_value = worksheet.cell_value(curr_row, curr_cell)
new_cell_value=cell_value
if isinstance(cell_value, str):
new_cell_value = cell_value.encode('ascii','ignore')
dataFile.write(str(new_cell_value)+'\n')
dataFile.write(str('Trazim sljedeceg')+'\n'+'\n'+'\n'+'\n')
所以,一堆ifs确保行完全正确。 但是,当我尝试运行它时,我得到错误: UnicodeEncodeError:'ascii'编解码器无法对位置10-11中的字符进行编码:序数不在范围内(128) 我用Google搜索并发现这是因为在.xls文件中我有这样的字符:Å¡‡‡等 我将逐个通过所有单元格,我认为我只需要在有字符串的单元格中解决这个问题,因此这是最后一个。
我很确定 new_cell_value = cell_value.encode('ascii','ignore')
行应该修复它,但它不会发生。请帮忙,我不知道我做错了什么。 如果您需要更多额外信息。我有Python 2.7.3,我正在运行ubuntu 12.04
编辑:哦,那些字符对我来说不是很重要,所以如果需要,我可以丢失它们。
答案 0 :(得分:1)
这里的问题是if语句。
>>> uni = u"\u04533testing"
>>> print uni
ѓ3testing
>>> isinstance(uni, str)
False
>>> type(uni)
<type 'unicode'>
因为此对象不是字符串,所以它是一个unicode字符串。因此,编码永远不会被击中。 你想要
if isinstance(cell_value,unicode):