Boxplot公式或变量定义

时间:2017-10-04 13:00:02

标签: r plot

我有一个csv文件有4列标记为AGE,DIASTOLIC,BMI和EVER.PREGNANT以及700行。最后一列仅包含是或否。我希望绘制数据BMI与EVER.PREGNANT的对比,目的是比较第四列中为yes的BMI和同一列中的否。我应该编写什么代码来获取所需的boxplot? 我尝试了以下代码:

Sheet=read.csv(/Downloads/1739230_1284354330_PIMA.csv - 1739230_1284354330_PIMA.csv.csv, sep=",")
boxplot(BMI~EVER.PREGNANT,data=sheet, main="BMI vs PREG",xlab="BMI",ylab="PREGNANT")

我得到的错误是

Error in eval(expr,envr,enclos): object 'Sheet' not found

同样,可以对AGE与DIASTOLIC进行哪些修改,其中两列都是数字?我会很好地得到700个奇数值吗?

1 个答案:

答案 0 :(得分:1)

我在这里回答,因为它告诉我不要延长讨论:-)。

我认为您没有正确加载数据集。您需要在加载时添加Sheet=read.csv("/Downloads/1739230_1284354330_PIMA.csv", sep=",", header = T) 以告诉程序您的第一行与变量的名称相对应。

data = {}

for key, group in itertools.groupby(r, lambda item: item['b_id']):
    data[key] = [x['a_id'] for x in group]