我们正在开发一种自动化在GCP上运行Dataproc的过程的方法(从启动集群到提交作业,终止集群),以进行基因组分析。最终,我们希望了解Dataproc的这些自动“运行”花费了多少,特别是当我们向其他用户开放我们的程序时。因此,我们还希望自动化(如果可能)将Dataproc成本归因于某个GCP用户(“运行”)的过程。这样,在每个月末,我们可以看到每个用户花了多少钱,特别是个人项目。实施这个的好策略是什么?
我考虑过为每个用户/客户创建一个单独的GCP项目,并将它们绑定到特定的结算帐户,但有没有更好的方法来管理它?
答案 0 :(得分:2)
推荐的方法是在您的资源上应用标签[1]。结算数据可以通过标签过滤和分段[2]。
在您的示例中,用户和客户端都是Cluster和Job资源上的标签。仅对群集资源进行计费。
如果您的自动化实际上只是一次性的create-cluster / submit-job / delete-cluster流程,那么请考虑使用Workflow Templates来实现自动化。特别是内联模板是为这种自动化量身定制的。
[2] https://cloud.google.com/billing/docs/how-to/export-data-bigquery