我创建了一个删除en和em破折号的函数。大!但是当我尝试将其上传到github然后重新安装为一个软件包时会发生一些事情。它用一些高耸的角色替换破折号。这通常意味着unicode的东西。我希望能够导出该功能。
我尝试用\\–
和\u2013
替换0x2013
。还使用了fixed
和perl
个参数。没有运气。
的这里是: 的
代码:
#What I exported
incomp <- function (text.var){
x <- gsub("\\–", "|", x)
x <- gsub("\\—", "|", x)
return(x)
}
#here it is in action working well
x <- c("I like...", "well?.", "–", "—")
incomp(x)
#[1] "I like..." "well?." "|" "|" #what I look like (ain't I pretty?)
#what the exported function looks like when the package compiles
incomp <- function (text.var){
x <- gsub("[–]", "|", x)
x <- gsub("[—]", "|", x)
return(x)
}
#I don't work anymore
x <- c("I like...", "well?.", "(–", "—") #I'm broken
incomp(x)
搜索r和unicode会显示大量信息,但我似乎无法正确应用于我的情况。
这篇文章是在talkstats.com上发布的。我一般不会越过帖子,但我会在枪口下解决这个问题。我将链接两个线程。 LINK TO THE TALKSTATS THREAD
提前谢谢。
答案 0 :(得分:0)
导出R的语言环境时的默认值设置为“C”我猜。您的语言环境可能不同。 也许您可以在包中使用Sys.setlocale?