import pandas as pd
from pandasql import sqldf
pysqldf=lambda query:sqldf(query=query,env=globals())
df=pd.read_csv('https://s3.amazonaws.com/content.udacity-data.com/courses/ud359/weather_underground.csv')
query="SELECT fog,maxtempi from df GROUP BY fog"
print(pysqldf(query))
输出
fog maxtempi
0 0 86
1 1 81
在此我理解表格按组雾分组为2类,但我不明白为什么maxtempi得到这些值,因为我没有明确指定返回最高温度。