我们正在设置BigQuery项目并讨论nested and repeated fields的使用。 我们不确定围绕重复记录的值更新的最佳做法
想象一下,我们有一个超级英雄表,看起来像
super_hero_id | powers | Date
----------------| -------------------|-------------
5 | Fly | 2020-08-01
| Change Skin Color |
----------------|--------------------|-------------
6 | Shoot Lasers | 2020 -08-01
| Attract Metal |
| Become Transparent |
----------------|--------------------|-------------
现在假设“超级英雄5”发现了他的原始血统,并且意识到他也具有“塑造水”的能力,将这些信息添加到分析表的最佳实践是什么?
我们看到的两个选项是
super_hero_id | powers | Date
----------------| -------------------|-------------
5 | Fly | 2020-08-01
| Change Skin Color |
----------------|--------------------|--------------
6 | Shoot Lasers | 2020 -08-01
| Attract Metal |
| Become Transparent |
----------------|--------------------|-------------
5 | Fly | 2020-08-01
| Change Skin Color |
| Shape Water |
----------------|--------------------|--------------
由于我们的宇宙定律,我们不能使用确定性的日期列来确定最近的行,而必须使用Row Number功能来确定我们的最新行。
所以我们有两个大问题
推荐的方法是什么。
感谢您的阅读。任何输入表示赞赏