使用python读取SPSS数据集时出现UnicodeDecodeError

时间:2016-12-15 13:40:13

标签: python spss

我正在尝试在SPSS中编写语法来修改值。当我尝试读取我的数据集时,它可以读取前243个条目,但失败并显示读数错误:

UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 253: unexpected end of data

我的代码:

BEGIN PROGRAM.
import json, re, spss

spss.StartDataStep()
datasetObj = spss.Dataset()
for i in range(len(datasetObj.cases)):
   print datasetObj.cases[i,0]
spss.EndDataStep()

END PROGRAM.

如何在没有错误的情况下读取当前数据集?

1 个答案:

答案 0 :(得分:0)

我没有看到在V24中尝试此错误。 0xc3是具有波浪号的大写字母A,但看起来代码期望utf-8。那封信在utf-8中将是C383。

您处于Unicode模式还是代码页模式(SHOW UNICODE)?如果是代码页,那么你的语言环境是什么(SHOW LOCALE)。什么版本的统计数据和什么平台?

如果您未处于Unicode模式,请尝试使用SET UNICODE ON或通过Edit>进行更改。选项>语言。

此外,错误究竟出在哪里?应该有错误显示的追溯。将代码更改为此 x = datasetObj.cases [i,0]
print x

使错误的位置更清晰。