这是一个程序,我计算了置信区间,然后我试图比较数据帧值并尝试打印上限和下限内的记录。
%matplotlib inline
import numpy as np
import pandas as pd
import scipy.stats as stats
import matplotlib.pyplot as plt
df = pd.read_csv('/Users/amuly/Desktop/Student_Weight_Status_Category_Reporting_Results__Beginning_2010.csv')
#confidence interval for number of obese
margin=df["NO. OBESE"].sem()*1.96
upper_limit=df["NO. OBESE"].mean()+margin
lower_limit=df["NO. OBESE"].mean()-margin
print(lower_limit,upper_limit)
我在这里得到正确的输出......
接下来我试图只有那些在我的置信区间内的值
错误是 - 系列的真值是模糊的。使用a.empty,a.bool(),a.item(),a.any()或a.all()
if (df["NO. OBESE"]>=lower_limit) & (df["NO. OBESE"]<=upper_limit):
correlate_data=pd.DataFrame(df)
我是熊猫新手。请帮助。感谢
答案 0 :(得分:1)
exec </dev/tty