Question

我有包含符号，出价和要价的刻度数据。我能够找到每个符号的平均值和标准差。

我想为每个符号创建置信区间，并让最终的DataFrame输出具有列

股票代码
平均价差
下限95％置信度
上限95％置信度

我该怎么做？这是我能够获得的目标：

df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv',
                 dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice': np.float64, 'afterHours': str},
                 usecols=['ticker', 'bidPrice', 'askPrice', 'afterHours'],
                 nrows=3000000
                 )

df = df[df.afterHours == "False"]
df = df[df.bidPrice != 0]
df = df[df.askPrice != 0]
df['spread'] = (df.askPrice - df.bidPrice)

print(df.groupby(['ticker'])['spread'].mean())
print(df.groupby(['ticker'])['spread'].std(ddof=0) * 1.96)

Answer 1

只需在其上调用pd.dataframe即可。

new_df = pd.dataframe(df.groupby(['ticker'])['spread'].mean()) http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.html

如何使用其他数据框的分组输出创建新数据框？

1 个答案: