Question

我将数据框分为两组native-country和salary，但是在hours-per-week上的输出太大，无法找到特定的国家/地区。

df.groupby(by=['native-country', 'salary'])['hours-per-week']

如何按国家/地区名称选择分组，例如“日本”？

Answer 1

如果您不尝试执行任何聚合/转换，为什么要使用groupby？只需：

df.query("'native-country' == 'Japan'")\
  .loc[:, ["native_country", "salary", "hours-per-week"]]

Answer 2

   newdf = ddf.groupby('country').**size()/all()/count()/...**

   result = newdf.filter(lambda x : True if x.country == 'japan' else False)lt

   print result

熊猫-从groupby中选择组（by = [group1，group2]）

2 个答案: