在Windows计算机上从包加载数据,会破坏编码。
require(vegdata)
tax_dbf <- load.taxlist("GermanSL 1.3", detailed=TRUE)
tax_dbf[33,"BEGRUEND"]
[1]““Einfügeneiner Zwischenebene””
我可以解决这个问题:
Encoding(tax_dbf$BEGRUEND) <- "UTF-8"
tax_dbf[33,"BEGRUEND"]
[1]“Einfügeneiner Zwischenebene”
但是,我没有设法找到一种简单的方法来声明df中所有字符列的编码,而且我的SO搜索foo今天也很弱。 这很令人困惑。
tidyverse中的每个人都为我的散文写一个单子?
答案 0 :(得分:1)
无需使用tidyverse
。只需循环满足条件的列即可:
set.seed(1)
df <- data.frame(a = rep("Einfügen einer Zwischenebene", 5), b = runif(5), c = rep("Einfügen einer Zwischenebene", 5), stringsAsFactors = F)
cols <- names(df)
for(i in seq_along(cols)){
if(!is.character(df[, cols[[i]]])) next
Encoding(df[, cols[[i]]]) <- "UTF-8"
}
结果:
> df
a b c
1 Einfügen einer Zwischenebene 0.2655087 Einfügen einer Zwischenebene
2 Einfügen einer Zwischenebene 0.3721239 Einfügen einer Zwischenebene
3 Einfügen einer Zwischenebene 0.5728534 Einfügen einer Zwischenebene
4 Einfügen einer Zwischenebene 0.9082078 Einfügen einer Zwischenebene
5 Einfügen einer Zwischenebene 0.2016819 Einfügen einer Zwischenebene
dplyr::mutate_if(df, is.character, .funs = function(x){return(`Encoding<-`(x, "UTF-8"))})