我是StackOverflow的新手,出于为何选择 Google BigQuery 和 Jupyter Notebooks 来创建新变量并为机器学习项目准备数据的原因,我进行了很多研究。到目前为止,我在使用Jupyter Notebooks(喜欢python!)进行数据科学项目方面拥有丰富的经验,但是现在我们在办公室与GCP一起工作,没有人能够回答为什么(或何时)选择一个更好的选择。另外一个。
Datalab在Jupyter Notebooks上做得很好,我们现在拥有的数据一部分存储在GCS中,一部分存储在Cloud SQL中(我仅从那里检索数据并开始使用变量)。
非常感谢!
答案 0 :(得分:1)
BigQuery是一个数据湖,一个大型数据库。对于您的问题,您需要使用Cloud SQL / GCS之类的数据源。您需要将行存储在BQ中并在工具中使用以编写图表/算法。
BigQuery不能与Jupyter Notebook进行比较,因为它只是两种不同的产品。