警告:因子包含隐式NA

时间:2019-03-05 09:44:26

标签: r shiny na missing-data

我是R和Shiny的新手,我正在尝试使用ggplot2创建一个交互式绘图。当用户选中该复选框时,他可以访问多个选择字段以自定义绘图。

原始数据帧包含在"N/A"Publisher列中标识为Year的缺失值。我用complete.cases删除了包含NA的行,因此它不应该有NA。

我运行我的应用程序:好的。我进入默认图:好。我选中以下复选框:Warning: Factor 'Publisher' contains implicit NA, consider using 'forcats::fct_explicit_na'

我想删除此警告,至少可以理解。如果您有其他意见,请这样做:我的目标是变得更好。

app.R:

df<-read.csv("vgsales.csv")
df$Year[df$Year=="N/A"]<-NA
df$Year<-factor(df$Year)
df$Publisher[df$Publisher=="N/A"]<-NA
df$Publisher<-factor(df$Publisher)
df<-df[complete.cases(df),]

pubSales<-na.omit(df
    %>% group_by(Publisher, Year) 
    %>% summarise(Global_Sales=sum(Global_Sales))
)
pubSales<-pubSales[order(pubSales$Year),]

top5Pub<-head(unique(pubSales[order(-pubSales$Global_Sales),]$Publisher),5)

ui <- navbarPage("Video Games Sales",
    tabPanel("Publishers",
        mainPanel(
            titlePanel(
                title = "Publishers sales"
            ),
            sidebarPanel(
                radioButtons(
                    "pubOptions",
                    "Options",
                    c("Top 5 Publishers"="topFivePub",
                      "Custom Publishers"="customPub"),
                    selected="topFivePub"
                ),
                uiOutput("customPubUI")
            ),
            mainPanel(
                plotOutput("pubPlot")
            ),
            width=12
        )
    )
)

server <- function(input, output, session) {

    output$customPubUI<-renderUI({
        if(input$pubOptions=="customPub"){
            selectInput(
                "selectedPub",
                "Editeurs",
                pubSales$Publisher,
                multiple=TRUE
            )
        }
    })

    output$pubSales<-renderTable(pubSales)
    output$pubPlot<-renderPlot({
        ggplot()+
            if(input$pubOptions=="customPub"){
                geom_line(
                    data=pubSales[pubSales$Publisher %in% input$selectedPub,],
                    aes(x=Year,y=Global_Sales,colour=Publisher,group=Publisher)
                )
            }else{
                geom_line(
                    data=pubSales[pubSales$Publisher %in% top5Pub,],
                    aes(x=Year,y=Global_Sales,colour=Publisher,group=Publisher)
                )
            }
    })

}

shinyApp(ui, server)

3 个答案:

答案 0 :(得分:0)

使用:

require(shiny)
require(tidyverse)

# Create some sample data:
year <- rep(2000:2018, each=3)

publ <- rep(strrep(c("Pub 1", "Pub2", "pub3"), 1), 19)

Global_Sales <- rep(sample(1:100,19),3)
# Create a observation with NA:
newline <- c(NA, NA, 33)

df <- data.frame(Year = year, Publisher = publ, Global_Sales = Global_Sales)
df <- rbind(df,newline)
df <- na.omit(df)

pubSales<-df %>%  group_by(Publisher, Year)  %>%
  summarise(Global_Sales=sum(Global_Sales)) 

pubSales$Publisher <- as.character(pubSales$Publisher) 

该错误不再出现。只要您使用的数据不包含因素(“隐式NA”来自何处),我的样本数据就不会出现该错误。

答案 1 :(得分:0)

由于NA不是一个因素水平,因此弹出警告。它只是缺少。该警告会提醒您因素中存在“隐藏”级别,当您对该因素执行操作时,该级别将不会显示。

例如,一个基本因素:

a.factor <- as.factor(c('a', 'b', 'c', NA))

当我们打印或在快速表格中进行汇总时,只有3个级别:

> print(a.factor)
[1] a    b    c    <NA>
Levels: a b c

> table(a.factor)
a.factor
a b c 
1 1 1 

答案 2 :(得分:0)

如果您的数据框包含未使用的因子水平,我将使用

pubSales <- droplevels(pubSales)

这为我消除了未使用的级别和错误。