我应该采取什么步骤从零开始构建数据科学项目?

时间:2019-07-11 20:11:09

标签: machine-learning architecture bigdata data-science

我的公司正在组建一个数据科学团队,目前我是唯一的一支。我在机器学习方面有一些经验,但是一切都在本地完成。现在,我需要使用Google Cloud构建一个项目,重点是:我应该从哪里开始?

  • 定义数据处理体系结构?哪一个?例如Lambda或Kappa。
  • 我应该将Apache Beam与Dataflow一起使用吗?有哪些常用方法?
  • 接下来我该怎么办?

所以我正在寻找一个以前有经验的人,可以帮助我告诉我应该采取的步骤。

我已经尝试过使用Cloud Dataprep和Big Query。我在计算机引擎上使用实例化的jupyter笔记本进行的机器学习部分。

谢谢。

0 个答案:

没有答案