我使用SavReaderWriter将spss文件转换为熊猫。但是在那之后,我的变量名在第一行,就像b'variable_name'。如何只选择变量名?
func.date_trunc
但是结果是b'riable_nam'(b''格式仍然存在)。 我应该怎么做来净化变量名?
答案 0 :(得分:0)
看看这是否可行(我没有看到数据,我想是在这里)
0
0 [1, 2, 3]
1 [1, 2, 3]
2 [1, 2, 3]
答案 1 :(得分:0)
SavReaderWriter在读取SPSS元数据时返回字节。
标签示例:b'Data id'
。
python中的var类型返回:<class 'bytes'>
。
因此解决方案是对其进行解码,示例代码如下:
with rw.SavHeaderReader("tesFile.sav", ioUtf8=False) as header:
metadata = header.all()
varLabels = metadata.varLabels
for var, lab in varLabels.items():
decodedLabel = lab.decode("utf-8")