Question

我在ggplot2的帮助下制作一个数字线图，并面对文本标签相互重叠的问题。我还使用geom_text_repel包来避免文本重叠，但随着越来越多的因子级别具有相邻的平均分数，它变得越来越混乱。我提供了以下代码示例以及主要使用的数据。

Category    Dimension1
AcademicWriting -0.7
Brd.Discussions 0.6
Brd.Interviews  -2.4
Brd.News    8.3
Brd.Talks   0
BusinessLetters 2.4
ClassLessons    0.2
Commentaries    -12.9
Comments    -1.2
CreativeWriting 1.4
Documentaries   -1.4
F2FConversations    -1.8
FBGroups    0.4
FBSt.Updates    -1
Ind.Blogs   0.1
Inst.Writing    0.9
NBrd.Talks  -0.1
NewsBlogs   0.4
NewsReports 7.1
Pol.Debates -1.4
PopularWriting  0.5
PressEditorials 1.8
SocialLetters   0.6
Speeches    3
StudentWriting  -2
TechBlogs   1.7
ThesesPresentations -0.8
Tweets  -2.8

代码：

library(ggplot2)
library(ggrepel)
library(extrafont)
loadfonts(device = "win")
plot_graph <- function(d1, label_below = "", label_above = "")
{
  d1 <- d1[order(-d1[,2]),]
  d1$X <- rep(0, each=length(d1$Dimension1))
  attach(d1)
  plot1 <- ggplot(data=d1, aes(x=X, y=Dimension1, label=Category)) +
    geom_point() +
    geom_text_repel(aes(label=Category), direction = "x", family="Times New Roman", size=4, max.iter = 2e2) +
    theme_bw()+
    theme(axis.text.x = element_text(colour="black"), axis.text.y = element_text(colour="black"))+
    theme(text=element_text(family="Times New Roman"), panel.grid.major.y = element_blank(), panel.grid.minor.y = element_blank(), panel.grid.major.x = element_blank(), panel.grid.minor.x = element_blank(), axis.title.x=element_blank(), axis.title.y=element_blank(), axis.text.x = element_blank(), axis.ticks.x = element_blank()) +
    geom_vline(xintercept = 0, linetype = 1) +
    coord_cartesian(xlim = c(-3, 3)) +
    geom_segment(aes(x = -2, y = 5+min(Dimension1), xend = -2, yend = max(Dimension1)-5), arrow = arrow(ends = "both"), alpha=0.5, size=0.5) +
    geom_text(aes(x = -2, y = 6+min(Dimension1), label = label_below)) +
    geom_text(aes(x = -2, y = max(Dimension1)-4, label = label_above))
  detach(d1)
  plot1
}

plot4 <- plot_graph(d1 = d1, label_below = "", label_above = "")
plot4

结果如下图：在查看多个类似的线程后，我不知道是否有解决方案来解决这个问题。但我有一个想法是将因子水平分组，即标签根据它们的相邻平均分数，例如学术写作，FBSt.Updates（示例中的第1和第7个因子级别）可以在将它们各自的平均分数四舍五入到-1之后组合在一起。它们可以显示在用逗号分隔的水平线上。但我无法想出一种将它们分组的方法。这就是为什么我要求你的帮助，或任何其他方式来解决重叠问题。

Answer 1

这是一个想法：

在您想要的任意数量的组中剪切Dimension1列，按形成的剪切变量进行分组，粘贴类别名称并计算y坐标。我将文本和点映射到相同的颜色，但没有必要。

b"error".decode("utf-8")

分组因子水平以避免ggplot2中的重叠

1 个答案: