Unidecode无法识别UTF-8字符串

时间:2019-02-13 14:21:18

标签: r unicode encoding utf-8

我有一个俄语编码为UTF-8的变量,未使用软件包UnidecodeR中的unidecode函数进行翻译

应用unknown函数时,回购中提供的示例将获得Encoding。 有没有一种方法可以将我的“ UTF-8”字符串转换为“未知”?

我尝试使用iconv。 还尝试将字符串发送到.txt,但是我还没有找到导出具有正确编码的.txt文件的方法,即读取txt中的俄语单词。

这是一个代码示例:

d <- "брянский"
Encoding(d)  # It shows UTF-8
d_ascii <- unidecode(data = d, language = "ru")
cat(d_ascii)

这是结果

> cat(d_ascii)
брянский

和预期的

> cat(d_ascii)
bryanckij

编辑: 正如@ user2554330所评论的那样,我运行sessionInfo()

R version 3.5.1 (2018-07-02)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)

Matrix products: default

locale:
[1] LC_COLLATE=Spanish_Spain.1252  LC_CTYPE=Spanish_Spain.1252    LC_MONETARY=Spanish_Spain.1252 LC_NUMERIC=C                  
[5] LC_TIME=Spanish_Spain.1252    

0 个答案:

没有答案