将JSON数据加载到R时编码错误

时间:2018-09-19 15:05:13

标签: r json encoding utf-8

我正在尝试根据从JSON文件加载的数据框构建单词语料库。在执行此操作时,R不会看到诸如“ř”之类的特殊符号(在原始json数据中可见,编码为u​​tf-8)。我尝试使用源代码编辑器和Encoding(x)在R中进行编码,但是它们都不起作用。 我想将符号更改为拉丁字母。例如ř-> r,但是使用gsub函数的r会完全破坏我的数据帧。 您有解决办法的想法吗?

.as-console-wrapper { max-height: 100% !important; top: 0; }

1 个答案:

答案 0 :(得分:0)

欢迎来到SO。请记住,您应该提供一个可重复的示例,以便我们为您解决问题。

我了解您正在寻找一种将符号更改为拉丁字母的方法。可以通过stringi::stri_trans_general完成:

require(stringi) # load library

a <- "ř" # assign your weird character to variable

newA <- stri_trans_general(a, "latin-ascii") # convert to latin 

newA
> "r"

如果您认为此答案有帮助,请考虑在投票下方的标记上打上这样的标记。