希望标题不会引起误解。 我照常将Excel文件加载到熊猫数据框中
df = pd.read_excel('complete.xlsx')
这就是里面的东西(通常已经订购了-这是一个非常小的样本)
df
Out[21]:
Country City First Name Last Name Ref
0 England London John Smith 34
1 England London Bill Owen 332
2 England Brighton Max Crowe 25
3 England Brighton Steve Grant 55
4 France Paris Roland Tomas 44
5 France Paris Anatole Donnet 534
6 France Lyon Paulin Botrel 234
7 Spain Madrid Oriol Abarquero 34
8 Spain Madrid Alberto Olloqui 534
9 Spain Barcelona Ander Moreno 254
10 Spain Barcelona Cesar Aranda 222
我需要做的是自动导出数据,为每个国家/地区创建一个sqlite数据库(即“ England.sqlite”),该数据库将包含一个用于evey城市的表(例如,伦敦和布赖顿),并且每个表都有相关人员信息。
sqlite没问题,我只是想弄清楚如何以最快速,最“ pythonic”的方式“解包”数据框
谢谢
答案 0 :(得分:2)
您可以按DataFrame.groupby
对象进行循环:
for i, subdf in df.groupby('Country'):
print (i)
print (subdf)
#processing