总结R改变数据输出

时间:2017-11-01 20:08:44

标签: r dplyr summarization

我正在尝试总结一种产品类型,其中每个元素都用" - "分开。代码如下所示:

testAct <- pipeline %>%
    group_by(Unique.Opportunity.ID) %>%
    filter(row_number() == 1) %>%
    ungroup() %>%
    group_by(Company.Name, Sales.Team) %>%
    summarize(Product.Family = paste(c(Product.Family), collapse="-"))
seqAct <- testAct %>%
    ungroup() %>%
    group_by(Product.Family) %>%
    summarize(count = n())

输出显示&#34; product.family&#34;变量为&#39; 1-6&#39;,其中应该类似于&#39; FDS-RDS&#39; ...我不确定为什么它将它转换为整数。

                          Company.Name             Sales.Team Product.Family
                                <fctr>                 <fctr>          <chr>
                             Example1               Americas             1-6
                             Example1               Americas             1-7
                             Example1                WEMEA 2             8-7
                             Example1                    CEE         3-3-4-7
                             Example1                WEMEA 1             7-7
                             Example1               Americas             1-6
                             Example1                WEMEA 1             7-7
                             Example1                WEMEA 2             8-7
                             Example1                    CEE         3-3-6-4

对此的任何帮助都会非常有帮助!

1 个答案:

答案 0 :(得分:1)

如果没有你输入数据很难说,如果可以的话,请在你的问题中添加以下输出:

dput(head(df,20))

我的猜测是变量是因子,它出于某种原因写下与因子相关的数字。在您引用的列上,我会在运行代码之前执行此操作:

df$column <- as.character(df$column)

再次。没有看到数据就难以提供帮助。