如何使用其他数据框的分组输出创建新数据框?

时间:2016-06-17 04:24:33

标签: pandas

我有包含符号,出价和要价的刻度数据。我能够找到每个符号的平均值和标准差。

我想为每个符号创建置信区间,并让最终的DataFrame输出具有列

  • 股票代码
  • 平均价差
  • 下限95%置信度
  • 上限95%置信度

我该怎么做?这是我能够获得的目标:

df = pd.read_csv('C:\\Users\\William\\Desktop\\tickdata.csv',
                 dtype={'ticker': str, 'bidPrice': np.float64, 'askPrice': np.float64, 'afterHours': str},
                 usecols=['ticker', 'bidPrice', 'askPrice', 'afterHours'],
                 nrows=3000000
                 )

df = df[df.afterHours == "False"]
df = df[df.bidPrice != 0]
df = df[df.askPrice != 0]
df['spread'] = (df.askPrice - df.bidPrice)

print(df.groupby(['ticker'])['spread'].mean())
print(df.groupby(['ticker'])['spread'].std(ddof=0) * 1.96)

1 个答案:

答案 0 :(得分:0)

只需在其上调用pd.dataframe即可。

new_df = pd.dataframe(df.groupby(['ticker'])['spread'].mean()) http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.html