使用ggplot2和特殊字符

时间:2015-10-28 22:49:00

标签: r excel ggplot2 special-characters

我正在从网站上读取数据,文本标识每一行。我只是将数据复制并粘贴到Excel中,然后由R读取该文件。其中一行包含德国城市的名称“Würzburg”,其中包括带有变音符号的小写u。我在网上或Excel上看到特殊字符没有问题。问题是,当这个单词传递给ggplot2时,它在图中显示为“WÃzburg”,在首都A上方有一个波形.RStudio根据显示的区域显示两种形式。我假设ggplot2使用不同的语言来解释特殊字符。

有没有办法告诉ggplot如何阅读,解释和显示特殊字符?我不想只为这个城市编写专门的代码,而是为了解决这个问题。随着时间的推移,我可能会遇到其他角色。

3 个答案:

答案 0 :(得分:2)

按如下方式阅读文件

library('data.table')
fread('path_to_file', ..., encoding = 'UTF-8')

答案 1 :(得分:2)

当我使用硬编码的ggplot2时,我遇到了类似的错误data.frame(即我会写Großbritannien(英国)并且它会被编码为某些乱码)。

我的解决方案是包括

Sys.setlocale("LC_ALL", "German")
options(encoding = "UTF-8")

在剧本的开头。

答案 2 :(得分:0)

我对此问题的解决方法是切换到cairo进行pdf绘图。 ggplot2正确显示所有特殊字符。将这行代码放在knitr设置中就足够了:

knitr::opts_chunk$set(dev='cairo_pdf')