如何更改不同语言环境中的字母?

时间:2018-09-25 08:47:21

标签: r text character-encoding locale

我使用以下命令阅读HTML文本:  text <- read_html("linkoftext") 结果是:

"Veri analizi, farklı iş, bilim ve sosyal bilim alanlarında çeşitli isimler altında çeşitli teknikleri kapsayan çok yönlü ve farklı yaklaşımlara sahiptir. Veri entegrasyonu veri analizinin öncüsüdür."

此文本包含“şçüöı”之类的字母。我需要用“ s c o o i”代替它们。我写了以下代码:

string <- "ş ç ı ğ ü ö f s x q"
chartr("ş ç ı ğ ü ö", "s c i g u o", string)

由于我仍然将这些字母作为chartr的输出,如何将上面的代码应用于我的文本?

1 个答案:

答案 0 :(得分:0)

您的语言环境设置与本地语言(即土耳其语)不同。因此,要更改语言环境,您可以使用Sys.setlocale函数,请参见下面的代码:

Sys.setlocale("LC_CTYPE", "Turkish") # switch to Turkish locale
string <- "ş ç ı ğ ü ö f s x q"
string
# [1] "ş ç ı ğ ü ö f s x q"

chartr("şçığüö", "sciguo", string)
# [1] "s c i g u o f s x q"

Sys.setlocale("LC_CTYPE", "") # switch to native locale