我有包含符号,出价和要价的刻度数据。我能够找到每个符号的平均值和标准差。
我想为每个符号创建置信区间,并让最终的DataFrame输出具有列
我该怎么做?这是我能够获得的目标:
df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv',
dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice': np.float64, 'afterHours': str},
usecols=['ticker', 'bidPrice', 'askPrice', 'afterHours'],
nrows=3000000
)
df = df[df.afterHours == "False"]
df = df[df.bidPrice != 0]
df = df[df.askPrice != 0]
df['spread'] = (df.askPrice - df.bidPrice)
print(df.groupby(['ticker'])['spread'].mean())
print(df.groupby(['ticker'])['spread'].std(ddof=0) * 1.96)
答案 0 :(得分:0)
只需在其上调用pd.dataframe即可。
new_df = pd.dataframe(df.groupby(['ticker'])['spread'].mean())
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.html