我将数据框分为两组native-country
和salary
,但是在hours-per-week
上的输出太大,无法找到特定的国家/地区。
df.groupby(by=['native-country', 'salary'])['hours-per-week']
如何按国家/地区名称选择分组,例如“日本”?
答案 0 :(得分:2)
如果您不尝试执行任何聚合/转换,为什么要使用groupby
?只需:
df.query("'native-country' == 'Japan'")\
.loc[:, ["native_country", "salary", "hours-per-week"]]
答案 1 :(得分:1)
newdf = ddf.groupby('country').**size()/all()/count()/...**
result = newdf.filter(lambda x : True if x.country == 'japan' else False)lt
print result