我正在使用Stata 12.我遇到了以下问题。我使用insheet
命令将一堆.csv文件导入Stata。数据集可以包括俄语,克罗地亚语,土耳其语等。我认为它们以“UTF-8”编码。在.csv文件中,它们是正确的。将它们导入Stata后,原始字符串不正确并成为奇怪的字符。你能帮帮我吗? Stat-Transfer能否解决问题?它是否支持.csv格式?
例如, 原始文件如下:
我的代码如下: 使用name.csv,c n的insheet 保存name.dta,替换
结果如下:
我尝试在fonts选项中调整脚本,但这不起作用。
答案 0 :(得分:2)
正如@Nick Cox先前评论的那样,问题是Stata不支持Unicode / UTF-8编码。 不,StatTransfer无法解决问题(请参阅this explanation)。
您可以使用在线解码器或MS Word来完成这项工作。让我们首先用一种语言来做,比如说,你的截图中有俄语。查看克罗地亚语,土耳其语和其他语言的正确编码。
根据您的操作系统,您可能需要先安装所有相应的语言 希望它有所帮助。