跑步机学习本地。我应该使用Datalab的本地实例,还是Jupyter?

时间:2017-05-05 08:33:24

标签: google-cloud-datalab

我正在对Google Analytics和其他来源的数据进行一些机器学习和数据分析。

我设法在本地部署Cloud Datalab并连接到我的BigQuery,但我不确定这是否是最好的做事方式。我可以看到,只使用带有Pandas的香草Jupyter笔记本,我仍然可以连接到BigQuery。常规Jupyter的优点是它可以在没有Docker的情况下运行,并且还具有Python 3。

所以我想知道除了SQL语法突出显示之外,使用Cloud Datalab在本地执行此操作是否有任何好处?简而言之,Cloud Datalab的所有优势是否仅与云计算相关,或者它是否也为Jupyter带来了本地部署的任何优势?

谢谢!

1 个答案:

答案 0 :(得分:2)

即使您使用常规Jupyter,您仍然可以安装Datalab python package以使用大部分datalab功能。

我在本地运行时使用Datalab而不是Jupyter的原因是:

  1. 运行码头工具带来了经过良好测试的环境。
  2. PyDatalab带来了BigQuery API和魔法,它们创造了一个很好的BigQuery游乐场。 google.datalab.bigquery提供的不仅仅是从查询中创建数据帧。
  3. BigQuery与图表的集成(%%图表可以进行BQ查询)。
  4. 机器学习工具和MLToolbox。
  5. 不同的用户界面。
  6. Jupyter + Datalab包为您提供2,3和4。