R中包含俄语字符的字符串操作

时间:2018-04-30 07:37:44

标签: r string kaggle

我正在使用Avito's Kaggle Challenge data,但我遇到了字符串操作问题。我正在尝试创建一个包含大写字符数的新列。我正在使用此代码:

sum(str_count(description[1], "[А-Я]"))

dput(description[1]) "Кокон для сна малыша,пользовались меньше месяца.цвет серый"

但它不起作用(返回0)。另一方面,如果我使用

sum(str_count("Кокон для сна малыша,пользовались меньше месяца.цвет серый", "[А-Я]"))

它返回1,基本上告诉我,如果我从data.frame获取单元格,它将无法工作,但如果我实际写出它,它就可以工作。我认为这对班级来说会有问题,但他们都是小孩子。我该怎么办?

0 个答案:

没有答案