我有一个包含报告编号,用户和管理员的数据集,我正在尝试收集一些信息。
我希望获得前25名最常用,最低25名最少使用报告数
以下是数据的外观:
UserName Manager Report1 Report2 Report3...560 columns
Luke Luke's MGR ReportA ReportB ReportC
David David's MGR ReportB ReportC ReportD
Alan Alan's MGR ReportC ReportG ReportF
. . . . .
. . . . .
167 rows
此数据持续167行和~560列。
我还有一组如下所示的数据:
Report Username Additional Columns
ReportA Luke
ReportB Tom
ReportC Alan
ReportB Alan
ReportF Tom
ReportB Luke
这两个都包含相同的信息。第一个数据集具有垂直列出的报告,因此行长度仅与实际用户的唯一数量一样长(即1个用户 - 没有重复)
第二个数据集更长(约4200行),因为报告和用户有多个重复,并且它不区分每个个体经理是一个问题。
我想要的是从此列表中获得前25个最常用和最少25个最少使用的报告。我创建了一个数据透视表来获取最多/最少使用的报告,但我无法用它来提取名称/经理名称。我更喜欢使用第一个数据集,但似乎可能更难以使用这个数据集。
理想情况下,我的输出看起来像这样:
Report# MNGR1 MNGR2 Username1 Username2 Username3
ReportA Bridgett Luke Zach Mitch Calli
. MNGR2 MNGR3
. MNGR4 MNGR5
ReportZ Ron Andy . . .
底部25只由一个人使用,前25个可以由多达38个人使用。
可能无法执行管理器部分,但如果我至少可以通过上/下25个最常用的报告获得用户名,这将是很好的。我可以手动完成,但这将非常繁琐。
This is how I got to the first table of data I posted FROM the second set.