我下载了Reuters-full-data-set并生成了pkl文件。在Windows 10命令提示符中使用脚本('dump_to_csv.py')将pkl文件转换为csv可以工作到一定程度,但是有时(为了舒适起见很多次),它将抛出错误,现在是代码我正在使用(来自GitHub存储库)已更新,可修复Python 3中的错误,但是错误仍然存在(至少对我而言)。在Windows 10-Pro(64位)中使用Python 3.6.4。 “ dump_to_csv.py”文件的代码位于https://github.com/philipperemy/Reuters-full-data-set/blob/master/dump_to_csv.py
所有错误都很相似,即:
Traceback (most recent call last):
File "dump_to_csv.py", line 41, in <module>
read(sys.argv[1])
File "dump_to_csv.py", line 34, in read
w.write(line)
File "C:\Users\...\AppData\Local\Programs\Python\Python36\lib\encodings\cp1252.py", line 19, in encode
return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode characters in position 31-47: character maps to <undefined>
感谢您的帮助。