我有一个csv文件有4列标记为AGE,DIASTOLIC,BMI和EVER.PREGNANT以及700行。最后一列仅包含是或否。我希望绘制数据BMI与EVER.PREGNANT的对比,目的是比较第四列中为yes的BMI和同一列中的否。我应该编写什么代码来获取所需的boxplot? 我尝试了以下代码:
Sheet=read.csv(/Downloads/1739230_1284354330_PIMA.csv - 1739230_1284354330_PIMA.csv.csv, sep=",")
boxplot(BMI~EVER.PREGNANT,data=sheet, main="BMI vs PREG",xlab="BMI",ylab="PREGNANT")
我得到的错误是
Error in eval(expr,envr,enclos): object 'Sheet' not found
同样,可以对AGE与DIASTOLIC进行哪些修改,其中两列都是数字?我会很好地得到700个奇数值吗?
答案 0 :(得分:1)
我在这里回答,因为它告诉我不要延长讨论:-)。
我认为您没有正确加载数据集。您需要在加载时添加Sheet=read.csv("/Downloads/1739230_1284354330_PIMA.csv", sep=",", header = T)
以告诉程序您的第一行与变量的名称相对应。
data = {}
for key, group in itertools.groupby(r, lambda item: item['b_id']):
data[key] = [x['a_id'] for x in group]