“解包”熊猫数据框的最快方法

时间:2020-10-15 13:30:02

标签: python pandas

希望标题不会引起误解。 我照常将Excel文件加载到熊猫数据框中

df = pd.read_excel('complete.xlsx')

这就是里面的东西(通常已经订购了-这是一个非常小的样本)

df
Out[21]: 
    Country       City First Name  Last Name  Ref
0   England     London       John      Smith   34
1   England     London       Bill       Owen  332
2   England   Brighton        Max      Crowe   25
3   England   Brighton      Steve      Grant   55
4    France      Paris     Roland      Tomas   44
5    France      Paris    Anatole     Donnet  534
6    France       Lyon     Paulin     Botrel  234
7     Spain     Madrid      Oriol  Abarquero   34
8     Spain     Madrid    Alberto    Olloqui  534
9     Spain  Barcelona      Ander     Moreno  254
10    Spain  Barcelona      Cesar     Aranda  222

我需要做的是自动导出数据,为每个国家/地区创建一个sqlite数据库(即“ England.sqlite”),该数据库将包含一个用于evey城市的表(例如,伦敦和布赖顿),并且每个表都有相关人员信息。

sqlite没问题,我只是想弄清楚如何以最快速,最“ pythonic”的方式“解包”数据框

谢谢

1 个答案:

答案 0 :(得分:2)

您可以按DataFrame.groupby对象进行循环:

for i, subdf in df.groupby('Country'):
     print (i)
     print (subdf)
     #processing