Question

我想使用数据集here中的数据。我想这是来自西班牙的数据集，来自秘鲁。可以以多种格式下载它，但是它们似乎都存在相同的问题。这是问题的一个示例-maÌ_z。这应该是maíz。我首先想到的是字体编码问题。但是我尝试使用RStudio Reopen with Encoding选项尝试几种字体编码选项，这些选项有时用于西班牙语文档（例如UTF-8，WINDOWS-1252，ISO-8859-1）。其中某些字符表示会更改，但不会更改为适当的í。其他一些例子 Cimarr?_n，c??scara，m??shka。我想我可以进行搜索和替换，但希望查找编码修复。

Answer 1

您是否尝试在myDate = new Date(); // or whatever函数中直接使用encoding参数？这是一个示例：

read()

当我使用法语数据时，我必须这样做。

很有可能原始文件未使用UTF-8编码，因此您在读取文件之前也可能已经对其进行了编码。

R如何阅读或替换西班牙的特殊字符

1 个答案: