我拥有所有营销活动(点击链接等),他们的“营销渠道”以及他们的“参与度”的数据。
参与职位如下:首先触摸[他们第一次与我们互动],领导创建[当他们形成填充并给我们足够的信息],机会创造[在机会创建之前发生的参与] ,并且关闭赢了[签署和购买之前发生的订婚]。
我想要做的是通过我们的营销渠道采取这些“路径”,并创建一个流程图,该流程图将映射某人可能采取的所有可能的营销路径。
我拥有的数据包含参与度,渠道和位置ID,如下所示:
______________________________
| id | channel | position |
| 1 | direct | FT |
| 1 | SEM | LC |
| 1 | email | OC |
| 1 | video | CW |
______________________________
这将成为一个前景“营销路径”的一个例子,我有几十条这些独特的路径。这个特定的领先优势将直接进入> SEM>电子邮件>视频 - 这将是一条路。
我想通过让频道成为“目的地”来确定这一点,并且位置决定了运动的顺序,其中最常见的路径是最大胆(或最亮),最不常见的是最粗体(或最平坦的颜色) - 可能在ggplot2中完成
我理解这有点宽泛,但我在可视化“映射”类型的数据集方面的经验非常有限,所以我甚至不知道哪些包对我有用。
我正在使用R
答案 0 :(得分:1)
这是使用ggplot的尝试。首先,制作一些示例数据:
library(tidyverse)
tbl1 <- tibble(
id=1:100,
channel = sample(c("direct", "SEM", "email", "video"),
size=100, replace=TRUE, prob=c(.1,.2,.3,.4)),
position = "1-FT")
tbl2 <- tibble(
id=1:100,
channel = sample(c("direct", "SEM", "email", "video"),
size=100, replace=TRUE, prob=c(.2,.1,.3,.4)),
position = "2-LC")
tbl3 <- tibble(
id=1:100,
channel = sample(c("direct", "SEM", "email", "video"),
size=100, replace=TRUE, prob=c(.3,.2,.1,.4)),
position = "3-OC")
tbl4 <- tibble(
id=1:100,
channel = sample(c("direct", "SEM", "email", "video"),
size=100, replace=TRUE, prob=c(.4, .3,.2,.1)),
position = "4-CW")
tbl= bind_rows(tbl1, tbl2, tbl3, tbl4)
然后,制作示例图表:
ggplot(tbl, aes(x=position, y=channel, group=id)) +
geom_line(alpha=.1, size=3)
我认为根据计数改变大小会更酷;另一个选择是使用带计数的色标。在这里,我使用单个alpha值作为规模的黑客。