如何使用R中的()中的函数与塞尔维亚拉丁字母的值?

时间:2017-12-25 10:58:26

标签: r encoding

我有一个变量 x ,其值包含塞尔维亚拉丁字母(č,ć,ž,š,đ),我需要提取包含行的索引一个特定的价值。当我使用函数(数据$ x ==“包含塞尔维亚拉丁字母”的值)时,我得到结果,但是当我使用时其中(数据$ x ==“值 DO 包含塞尔维亚拉丁字母”),我得到的结果是整数(0)

如果有人能给我任何暗示,我将不胜感激。

UPDATE:

假设我有数据框数据和变量 x ,其值为“žaba”,“ptica”,“žaba”,“žaba”,“ptica”

我想得到值“žaba”的元素索引,分别为1,3和4。 我尝试使用函数(数据$ x ==“žaba”)

当我在R控制台中创建数据时它起作用,但是当我从Excel导入数据时它不起作用。

更新2:

除塞尔维亚字母问题外,连字符也存在问题。当我用相应的拉丁字母替换塞尔维亚字母时,当我删除连字符时,我对公式没有任何问题。

无论如何,如果有办法在没有数据修改的情况下克服这个问题,我宁愿这样做。

1 个答案:

答案 0 :(得分:0)

我认为你在R处理Windows上的原生文本时遇到了一个错误(例如,参见https://github.com/patperry/r-corpus/issues/5)。这已在R的开发版本中修复,但与此同时,您可以使用as_utf8包中的utf8处理问题

# install.packages("utf8")
which(data$x == utf8::as_utf8("žaba"))