我正在处理一个关于来自研究电子知识库的学术图书出版物的大量数据集,其中有超过10万行。我被要求提取每个发布者的出版物数量,并使用数据集创建前20名。我们只对计算社会科学分类的标题感兴趣。但是数据集允许最多4种不同的分类,因此如果它是社会科学出版物,它可以列在分类1,2,3或4列中。例如:
Example of Publishers and the Classification columns
所以我希望最终产品计算列B:E中具有“社会科学”值的行,然后按列A中的值对这些行进行分组。我觉得答案就在我面前面对但我只是看不到它。我已经尝试过数据透视表,过滤器,COUNTIF,COUNTA,似乎没有什么能以干净的方式给我我想要的东西。我知道一位遥远的同事在2年前使用相同类型的数据集做了这件事,但我还没有收到他们的回复。
非常感谢任何帮助。感谢。
编辑:我对高级过滤的尝试似乎摆脱了一切。这是一个例子:
答案 0 :(得分:1)
因此我发现我最初的过滤不起作用的原因是因为我忘记了' ='与文本要求一起。傻,我知道,但它现在已经修好并且工作得很漂亮。谢谢你帮我说说。