我正在从网站上读取数据,文本标识每一行。我只是将数据复制并粘贴到Excel中,然后由R读取该文件。其中一行包含德国城市的名称“Würzburg”,其中包括带有变音符号的小写u。我在网上或Excel上看到特殊字符没有问题。问题是,当这个单词传递给ggplot2时,它在图中显示为“WÃzburg”,在首都A上方有一个波形.RStudio根据显示的区域显示两种形式。我假设ggplot2
使用不同的语言来解释特殊字符。
有没有办法告诉ggplot如何阅读,解释和显示特殊字符?我不想只为这个城市编写专门的代码,而是为了解决这个问题。随着时间的推移,我可能会遇到其他角色。
答案 0 :(得分:2)
按如下方式阅读文件
library('data.table')
fread('path_to_file', ..., encoding = 'UTF-8')
答案 1 :(得分:2)
当我使用硬编码的ggplot2
时,我遇到了类似的错误data.frame
(即我会写Großbritannien(英国)并且它会被编码为某些乱码)。
我的解决方案是包括
Sys.setlocale("LC_ALL", "German")
options(encoding = "UTF-8")
在剧本的开头。
答案 2 :(得分:0)
我对此问题的解决方法是切换到cairo进行pdf绘图。 ggplot2正确显示所有特殊字符。将这行代码放在knitr设置中就足够了:
knitr::opts_chunk$set(dev='cairo_pdf')