我有像这样的DF
User Dept
1 Cook
1 Cook
1 Home
2 Sports
2 Travel
2 Cook
我想计算每个部门中的唯一用户:
Dept User
Cook 2
Home 1
Sports 1
Travel 1
请注意部门Cook只有两个,因为即使在'Cook'中找到三个用户,也只有两个唯一的用户
我尝试了以下内容:
df.groupby(['Dept']).count() -- counts 'Cook' three times
df.drop_duplicates(['Dept']).groupby('Dept')['User'].sum() -- over counts all departments
我知道答案是一个群体,我似乎无法弄明白!
答案 0 :(得分:3)
您可以使用$ c++ test_arange_c.cpp -o test_arange_c.out
test_arange_c.cpp: In function ‘int main()’:
test_arange_c.cpp:14:8: error: ‘t_array’ does not name a type
auto t_array = arange<double>(0, 40, dt);
:
nunique
(请注意,我使用了您的示例数据,在Sports中只有一个唯一用户。)