我正在尝试根据从JSON文件加载的数据框构建单词语料库。在执行此操作时,R不会看到诸如“ř”之类的特殊符号(在原始json数据中可见,编码为utf-8)。我尝试使用源代码编辑器和Encoding(x)在R中进行编码,但是它们都不起作用。 我想将符号更改为拉丁字母。例如ř-> r,但是使用gsub函数的r会完全破坏我的数据帧。 您有解决办法的想法吗?
.as-console-wrapper { max-height: 100% !important; top: 0; }
答案 0 :(得分:0)
欢迎来到SO。请记住,您应该提供一个可重复的示例,以便我们为您解决问题。
我了解您正在寻找一种将符号更改为拉丁字母的方法。可以通过stringi::stri_trans_general
完成:
require(stringi) # load library
a <- "ř" # assign your weird character to variable
newA <- stri_trans_general(a, "latin-ascii") # convert to latin
newA
> "r"
如果您认为此答案有帮助,请考虑在投票下方的标记上打上这样的标记。