在AWS EC2上的Apache Spark中保护数据摄取

时间:2016-11-29 15:18:49

标签: amazon-web-services apache-spark amazon-s3 amazon-ec2 amazon-vpc

我打算使用(https://spark.apache.org/docs/1.6.2/ec2-scripts.html)在AWS EC2实例上启动Spark群集。这计划在自定义VPC中的私有子网中。

在此背景下,我看到了两种从Internet上获取安全数据的选项:

  1. 使用S3作为登陆区域,并使用VPC S3端点将数据移动到Spark主节点。将有与POST / GET请求相关的费用
  2. 在单独的公有子网中使用NAT实例,并将数据直接置于spark群集的主节点中。除了额外的EC2 NAT实例/ NAT网关之外,不会有任何费用。
  3. 您认为两种选择都安全吗?如果是这样,你更喜欢哪一个?

0 个答案:

没有答案