我使用以下命令阅读HTML文本:
text <- read_html("linkoftext")
结果是:
"Veri analizi, farklı iş, bilim ve sosyal bilim alanlarında çeşitli isimler altında çeşitli teknikleri kapsayan çok yönlü ve farklı yaklaşımlara sahiptir. Veri entegrasyonu veri analizinin öncüsüdür."
此文本包含“şçüöı”之类的字母。我需要用“ s c o o i”代替它们。我写了以下代码:
string <- "ş ç ı ğ ü ö f s x q"
chartr("ş ç ı ğ ü ö", "s c i g u o", string)
由于我仍然将这些字母作为chartr
的输出,如何将上面的代码应用于我的文本?
答案 0 :(得分:0)
您的语言环境设置与本地语言(即土耳其语)不同。因此,要更改语言环境,您可以使用Sys.setlocale
函数,请参见下面的代码:
Sys.setlocale("LC_CTYPE", "Turkish") # switch to Turkish locale
string <- "ş ç ı ğ ü ö f s x q"
string
# [1] "ş ç ı ğ ü ö f s x q"
chartr("şçığüö", "sciguo", string)
# [1] "s c i g u o f s x q"
Sys.setlocale("LC_CTYPE", "") # switch to native locale