首先,我对Firebase和BigQuery相对较新......所以有点天真...
背景:
我正在开发一个项目,我们有许多不同的移动应用程序 - 每个国家/地区一个,每个操作系统(iOS,Android) - 所有原始事件数据都被推送到同一个项目中的BigQuery数据集中。按国家/地区分别开发应用程序的理由与监管要求有关。
对于仪表板的目的,我原本希望能够将所有数据集合并到一个聚合数据集(每年有表格),按日期通过" partition_date"我添加的专栏。我的目标是利用BigQuery嵌套结构的功能,并维护原始Firebase表中的原始嵌套字段。
我在过去一个月左右的时间里一直在搜索,但我还没有遇到任何其他用户正在处理许多数据集的用例。
问题:
COUNT_DISTINCT(user_dim.app_info.app_instance_id)
)最终目标是授权任何用户(例如,不了解SQL的人)能够回答所有应用程序中的简单问题(例如,昨天有多少用户打开了应用程序),并让我们结束用户在仪表板界面中使用日期范围过滤器。
我已经能够通过查询所有数据集来编写即席查询以获得答案,但我找不到一个好的解决方案,这将使仪表板内的非技术用户更容易。
此外,这是我的第一个Stack Overflow问题...如果我太模糊,包括太多问题或者滥用平台,请告诉我。
提前感谢任何想法。
答案 0 :(得分:1)
如果您的最终目标是让用户能够回答简单的问题,那么汇总KPI数据对我来说是有意义的。我可能会通过设置一个计划的每日作业来选择所有数据集中的相关数据并将其加载到新数据集中,然后可以在Data Studio中使用。新数据集可以具有默认的Firebase日期表后缀,以支持日期范围过滤器。
我对BigQuery和Firebase也比较陌生,所以也许有更好的方法。
您可以在此处找到有关在BigQuery中进行日程安排的更多信息:Schedule query in BigQuery