来自Google Datalab的Google Cloud Dataproc

时间:2016-07-10 18:04:41

标签: google-cloud-dataproc google-cloud-datalab

是否可以在Dataproc群集上运行位于Google Cloud Datalab中的代码?

我们的想法是使用Datalab的强大交互性和界面来运行Apache Spark代码。

2 个答案:

答案 0 :(得分:3)

这是我们的雷达,但尚未完全启用为Dataproc群集的初始化操作。

感谢。 Dinesh Kulkarni 产品经理,Datalab&机器学习,GCP

答案 1 :(得分:1)

现在可以使用此命令创建数据集群:

gcloud dataproc clusters create $CLUSTERNAME \
    --project $PROJECT \
    --num-workers $WORKERS \
    --bucket $BUCKET \
    --metadata startup-script-url=gs://$BUCKET/setup/setup_env.sh,BUCKET=$BUCKET \
    --master-machine-type $VMMASTER \
    --worker-machine-type $VMWORKER \
    --initialization-actions \
         gs://dataproc-initialization-actions/datalab/datalab.sh \
    --scopes cloud-platform

为了让您更轻松,您可以使用此脚本:https://github.com/kanjih-ciandt/script-dataproc-datalab/tree/master