我一直在对已有的数据帧进行一些分组,并将结果保存在变量中。但是,我只是注意到变量实际上被保存为系列而不是数据帧。
我看过有关如何将系列转换为数据框的教程/文档,但是它们都只显示静态数据(通过将每个值手动键入到数组中),这对我来说不是一个选择,因为我的数据框中有超过200万行。
如果我有
TopCustomers = raw_data.groupby(raw_data['Company'])['Total Records'].sum()
Top10Customers = TopCustomers.sort_values().tail(10)
如何将Top10Customers转换为数据框?我需要它是因为并非所有地块都可用于系列。
语法frame = { 'Col 1': series1, 'Col 2': series2 }
不起作用,因为我只有1个序列
答案 0 :(得分:0)
您可以使用.to_frame()
方法,它将变成pd.DataFrame
。
答案 1 :(得分:0)
下面是一个带有数据的小例子:
import pandas as pd
raw_data = pd.DataFrame({'Company':['A', 'A','B', 'B', 'C', 'C'], 'Total Records':[2,3,6,4,5,10]})
TopCustomers = raw_data.groupby(raw_data['Company'])['Total Records'].sum()
实际上type(TopCustomers)
是pandas.core.series.Series
下面将其转换为DataFrame:
pd.DataFrame(TopCustomers)
否则.to_frame()
的效果与上面所述的一样。