我有一个变量 x ,其值包含塞尔维亚拉丁字母(č,ć,ž,š,đ),我需要提取包含行的索引一个特定的价值。当我使用函数(数据$ x ==“不包含塞尔维亚拉丁字母”的值)时,我得到结果,但是当我使用时其中(数据$ x ==“值 DO 包含塞尔维亚拉丁字母”),我得到的结果是整数(0)。
如果有人能给我任何暗示,我将不胜感激。
假设我有数据框数据和变量 x ,其值为“žaba”,“ptica”,“žaba”,“žaba”,“ptica”
我想得到值“žaba”的元素索引,分别为1,3和4。 我尝试使用函数(数据$ x ==“žaba”)。
当我在R控制台中创建数据时它起作用,但是当我从Excel导入数据时它不起作用。
除塞尔维亚字母问题外,连字符也存在问题。当我用相应的拉丁字母替换塞尔维亚字母时,当我删除连字符时,我对公式没有任何问题。
无论如何,如果有办法在没有数据修改的情况下克服这个问题,我宁愿这样做。
答案 0 :(得分:0)
我认为你在R处理Windows上的原生文本时遇到了一个错误(例如,参见https://github.com/patperry/r-corpus/issues/5)。这已在R的开发版本中修复,但与此同时,您可以使用as_utf8
包中的utf8
处理问题
# install.packages("utf8")
which(data$x == utf8::as_utf8("žaba"))