我想使用数据集here中的数据。我想这是来自西班牙的数据集,来自秘鲁。可以以多种格式下载它,但是它们似乎都存在相同的问题。这是问题的一个示例-maÌ_z
。这应该是maíz
。我首先想到的是字体编码问题。但是我尝试使用RStudio Reopen with Encoding
选项尝试几种字体编码选项,这些选项有时用于西班牙语文档(例如UTF-8,WINDOWS-1252,ISO-8859-1)。其中某些字符表示会更改,但不会更改为适当的í
。其他一些例子
Cimarr?_n
,c??scara
,m??shka
。我想我可以进行搜索和替换,但希望查找编码修复。
答案 0 :(得分:0)
您是否尝试在myDate = new Date(); // or whatever
函数中直接使用encoding
参数?这是一个示例:
read()
当我使用法语数据时,我必须这样做。
很有可能原始文件未使用UTF-8编码,因此您在读取文件之前也可能已经对其进行了编码。