Question

希望标题不会引起误解。我照常将Excel文件加载到熊猫数据框中

df = pd.read_excel('complete.xlsx')

这就是里面的东西（通常已经订购了-这是一个非常小的样本）

df
Out[21]: 
    Country       City First Name  Last Name  Ref
0   England     London       John      Smith   34
1   England     London       Bill       Owen  332
2   England   Brighton        Max      Crowe   25
3   England   Brighton      Steve      Grant   55
4    France      Paris     Roland      Tomas   44
5    France      Paris    Anatole     Donnet  534
6    France       Lyon     Paulin     Botrel  234
7     Spain     Madrid      Oriol  Abarquero   34
8     Spain     Madrid    Alberto    Olloqui  534
9     Spain  Barcelona      Ander     Moreno  254
10    Spain  Barcelona      Cesar     Aranda  222

我需要做的是自动导出数据，为每个国家/地区创建一个sqlite数据库（即“ England.sqlite”），该数据库将包含一个用于evey城市的表（例如，伦敦和布赖顿），并且每个表都有相关人员信息。

sqlite没问题，我只是想弄清楚如何以最快速，最“ pythonic”的方式“解包”数据框

谢谢

Answer 1

您可以按DataFrame.groupby对象进行循环：

for i, subdf in df.groupby('Country'):
     print (i)
     print (subdf)
     #processing

“解包”熊猫数据框的最快方法

1 个答案: