Question

我有一个变量 x ，其值包含塞尔维亚拉丁字母（č，ć，ž，š，đ），我需要提取包含行的索引一个特定的价值。当我使用函数（数据$ x ==“不包含塞尔维亚拉丁字母”的值）时，我得到结果，但是当我使用时其中（数据$ x ==“值 DO 包含塞尔维亚拉丁字母”），我得到的结果是整数（0）。

如果有人能给我任何暗示，我将不胜感激。

UPDATE：

假设我有数据框数据和变量 x ，其值为“žaba”，“ptica”，“žaba”，“žaba”，“ptica”

我想得到值“žaba”的元素索引，分别为1,3和4。我尝试使用函数（数据$ x ==“žaba”）。

当我在R控制台中创建数据时它起作用，但是当我从Excel导入数据时它不起作用。

更新2：

除塞尔维亚字母问题外，连字符也存在问题。当我用相应的拉丁字母替换塞尔维亚字母时，当我删除连字符时，我对公式没有任何问题。

无论如何，如果有办法在没有数据修改的情况下克服这个问题，我宁愿这样做。

Answer 1

我认为你在R处理Windows上的原生文本时遇到了一个错误（例如，参见https://github.com/patperry/r-corpus/issues/5）。这已在R的开发版本中修复，但与此同时，您可以使用as_utf8包中的utf8处理问题

# install.packages("utf8")
which(data$x == utf8::as_utf8("žaba"))

如何使用R中的（）中的函数与塞尔维亚拉丁字母的值？

UPDATE：

更新2：

1 个答案: