用R更改土耳其语文本中的特定字母

时间:2018-09-06 15:13:52

标签: r

我正在分析土耳其语文本。我需要更改文本中的一些字母。由于在土耳其语中有“ççığüö”字母。我想用s c g g o更改它们。我该如何处理?

我用下面的字母表示一个字母,但没有用,文本没有变化。 gsub(“ s”,“ş”,文本)

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:2)

我们可以使用chartr。例子

> string <- "ş ç ı ğ ü ö f s x q"
> chartr("ş ç ı ğ ü ö", "s c i g u o", string)
[1] "s c i g u o f s x q"

另一种替代方法是来自stringi软件包的stri_trans_general

> library(stringi)
> stri_trans_general(string, "latin-ascii")
[1] "s c i g u o f s x q"