导出包的unicode字符

时间:2012-06-10 13:02:22

标签: r unicode

我创建了一个删除en和em破折号的函数。大!但是当我尝试将其上传到github然后重新安装为一个软件包时会发生一些事情。它用一些高耸的角色替换破折号。这通常意味着unicode的东西。我希望能够导出该功能。

我尝试用\\–\u2013替换0x2013。还使用了fixedperl个参数。没有运气。

这里是:

  1. 有效的功能
  2. 一个测试用例
  3. 我在
  4. 中导入后的样子

    代码:

    #What I exported
    incomp <- function (text.var){
        x <- gsub("\\–", "|", x)
        x <- gsub("\\—", "|", x)
        return(x)
    }
    
    #here it is in action working well
    x <- c("I like...", "well?.", "–", "—")
    incomp(x)
    
    #[1] "I like..." "well?."    "|"  "|"   #what I look like (ain't I pretty?)
    
    #what the exported function looks like when the package compiles
    incomp <- function (text.var){   
        x <- gsub("[–]", "|", x)
        x <- gsub("[—]", "|", x)
        return(x)
    }
    
    #I don't work anymore
    x <- c("I like...", "well?.", "(–", "—")   #I'm broken
    incomp(x)
    

    搜索r和unicode会显示大量信息,但我似乎无法正确应用于我的情况。

    The unicodes are

    • u2013 for en dash
    • u2014 for the em dash

    这篇文章是在talkstats.com上发布的。我一般不会越过帖子,但我会在枪口下解决这个问题。我将链接两个线程。 LINK TO THE TALKSTATS THREAD

    提前谢谢。

1 个答案:

答案 0 :(得分:0)

导出R的语言环境时的默认值设置为“C”我猜。您的语言环境可能不同。 也许您可以在包中使用Sys.setlocale?