R:dplyr :: group_by在pxR数据帧上失败

时间:2017-08-09 09:53:40

标签: r dplyr janitor

dplyr::group_by()无法对pc轴文件中包含的以下data.frame的变量进行分组:

library("pacman")
pacman::p_load(pxR, dplyr, janitor)
px_file <- "https://www.pxweb.bfs.admin.ch/DownloadFile.aspx?file=px-x-1502040100_131"
pxR::read.px(base::url(px_file))$DATA$value %>% # the data.frame
  janitor::clean_names() %>%
  dplyr::select (student_level = studienstufe, 
                 year = jahr, 
                 counts = value) %>% # dplyr::rename() also fails
  dplyr::group_by (year, student_level) %>% # not grouping!
  dplyr::summarise(totals = sum (counts))

我认为这可能是由于编码问题,但我找不到问题。有任何想法吗?感谢。

1 个答案:

答案 0 :(得分:1)

我唯一能找到的错误是您使用select代替rename。你写道rename不适合你。这对我有用:

library("pacman")
library("dplyr")
library("janitor")

# Loading your data
pacman::p_load(pxR, dplyr, janitor)
px_file <- "https://www.pxweb.bfs.admin.ch/DownloadFile.aspx?file=px-x-1502040100_131"
px <- pxR::read.px(base::url(px_file))$DATA$value

# Cleaning the column names
px1 <- px %>% janitor::clean_names()

# Rename the columns
px2 <- px1 %>%
  dplyr::rename (student_level = studienstufe, 
                 sex = geschlecht,
                 year = jahr, 
                 counts = value) 

# Grouping data
px3 <- px2 %>%
  dplyr::group_by (year, student_level) %>%
  dplyr::summarise(totals = sum (counts))

我将每一步拆分成一个自己的数据帧来查看结果。这不是必要的。

如果这不起作用,您可以上传会话信息。

P.S。我还重命名了列geschlecht:)