所以我有一个excel问题并且不太知道如何处理它,如果我能得到一些反馈会很好。基本上我有2个文件:
N1)海量数据库,重要的列是ID,ProductName,Score。 N2)排名DB。 1每个城市的表格,每个表格有24个产品的排名,大约有40个城市。
因此,对于DB N2中的每个表,我必须搜索每个产品并手动设置得分,所以最后,当我转到DB N1并按城市过滤并按分数排序时,24个第一个条目是24出现在该城市的DB N2上的相应产品。如果产品在不同的城市,可以获得相同的分数,没问题。所以你肯定可以为每个排名位置设置一个分数(1 = 9999,2 = 9998等)。
我面临的一些棘手的事情:
1)有40个城市。我想尽可能地自动化这个过程,所以我可以在未来添加新的城市。有什么想法吗?
2)DB N2上出现的某些产品不在DB N1中,因此我必须指出ProductName及其应有的分数(如果城市XYZ的产品排名#3不在DB N1上,i应该注意它应该得分为9997),所以我可以在未来的DB上手动更新它。
我有点想知道如何单独做这些事情,但我很难将所有东西放在一起并面对“棘手”的部分。
非常感谢任何帮助。
答案 0 :(得分:1)
您可以使用Power Query / Power Pivot使每个表N2和所有N1表成为数据模型的一部分,然后创建数据透视表以查询所需的信息。通过简单地将它们添加到数据模型然后与ID相关联,可以轻松添加未来城市。
您可能需要在数据模型中使用一些计算字段来完成您不在N2中的分数所需的内容,并将城市作为数据字段来处理。
答案 1 :(得分:0)
我最终使用免费工具“Rapidminer”来玩Set Sets,如Substract,append,Join等。这样我就可以用图形方式完成它,而不需要触摸代码,所以最后它很好。对我们来说,这也是一个真正可扩展的解决方案。
非常感谢您的建议!