绘制来自多个列的多个响应的箱形图

时间:2018-10-17 13:26:29

标签: r statistics boxplot

大家好! 我在使用r绘制箱线图时处于堆栈状态。我的数据集具有“作物列”,“响应”和“技术”类型。在各列中,有多个响应:是,否和不确定。现在,我想从“是”和“无响应”的“作物”列中绘制箱线图,而忽略“不确定”。我应该如何在r中这样做?

2 个答案:

答案 0 :(得分:0)

由于您未提供任何示例数据,因此无法根据您的数据回答您的问题。 但是,我想这样可以解决您的问题:

# import libraries
import urllib2
from bs4 import BeautifulSoup

# specify the url
quote_page = 'https://www.propertytribes.com/memberlist.php'

# query the website and return the html to the variable 'page'
page = urllib2.urlopen(quote_page)

# parse the html using beautiful soap and store in variable `soup`
soup = BeautifulSoup(page, 'html.parser')

# Take out the <div> of name and get its value
name_box = soup.find(attrs={'class': 'data-area'})

name = name_box.text.strip() # strip() is used to remove starting and        trailing
print name  

您必须先为数据建立索引,才能删除所有“不确定”的案例。 然后,在本示例中,通过R的基本绘图系统创建箱形图。 这是您要找的吗?

答案 1 :(得分:0)

除了基数R,您还可以使用dplyr和ggplot,如下所示:

library(tidyverse)

myplot <- your_data %>% filter(Crops != "Not sure") %>%
        ggplot(aes(x=Crops, y=Response)) +
        geom_boxplot()
plot(myplot)