R - Emoji unicode to character

时间:2018-01-04 20:09:08

标签: r encoding character-encoding emoji emoticons

我在R中编码。让我们说我有一个表情符号的unicode值

wink_emoji <- "\U0001f609"

或者,作为

wink_emoji <- "U+1f609"

是否有可用于将实际表情符号字符打印到控制台的功能?像这样:

[1] ""

作为HTML字符实体怎么样?

[1] "&#128521;"

此外,如果我有这样的字符串:

test <- "This is a test U+1f609 U+1F469 U+200D U+2764 U+FE0F U+200D U+1F48B U+200D U+1F469"

我可以通过一个函数运行它来匹配所有表情符号并返回:

[1] "This is a test ‍❤️‍‍"

1 个答案:

答案 0 :(得分:2)

使用utf8_print包中的utf8进行打印,utf8ToInt以获取代码点的整数值:

wink_emoji <- "\U0001f609"
utf8::utf8_print(wink_emoji)
#> [1] "​"
utf8ToInt(wink_emoji)
#> [1] 128521

(打印表情符号仅适用于MacOS和Linux,不适用于Windows。)