我的公司正在组建一个数据科学团队,目前我是唯一的一支。我在机器学习方面有一些经验,但是一切都在本地完成。现在,我需要使用Google Cloud构建一个项目,重点是:我应该从哪里开始?
- 定义数据处理体系结构?哪一个?例如Lambda或Kappa。
- 我应该将Apache Beam与Dataflow一起使用吗?有哪些常用方法?
- 接下来我该怎么办?
所以我正在寻找一个以前有经验的人,可以帮助我告诉我应该采取的步骤。
我已经尝试过使用Cloud Dataprep和Big Query。我在计算机引擎上使用实例化的jupyter笔记本进行的机器学习部分。
谢谢。