假设在我的presto集群中,我有两个数据源HIVE和Cassandra。即我有一个连接到Hive源的Hive目录和一个连接到Cassandra源的Cassandra目录。两个团队分别在每个团队上工作。
如果团队同时提交单独的查询,则工作人员将为每个查询创建任务。正如在每个任务工作者的presto中创建一个新线程,这意味着两个查询的任务都驻留在同一个JVM(Heap)中。由于两个团队都希望他们的数据非常安全,他们希望对他们的任务进行内存隔离(他们不想冒任何代码注入的风险)。
有没有办法,所以每个源的所有任务都在单独的JVM(Heap)中运行。我的意思是我们可以运行多个工作进程:每个进程对应一个数据源吗?像一些工人组或其他什么。
PS.Not expert in thestst.just now now。
答案 0 :(得分:2)
没有办法做到这一点,但工作很简单;只需运行两个集群。