我使用Apache Beam和Flink runner使用Java SDK。似乎将工作部署到Flink意味着构建一个80兆字节的胖罐,然后上传到Flink工作经理。 有没有办法轻松部署轻量级SQL来运行Beam SQL?也许部署了可以soemhow获取和运行即席查询的工作?
答案 0 :(得分:2)
如果我理解你的问题,我认为目前不可能。现在,Beam SDK将始终构建一个胖jar,它将实现管道并包含所有管道依赖项,并且它将无法接受轻量级即席查询。
如果您对更具互动性的体验感兴趣,那么您可以看看正在进行的使Beam更具互动性的努力,例如:
SQL shell:https://s.apache.org/beam-sql-packaging。这描述了一个正在进行中的Beam SQL shell,它允许您在REPL环境中本地快速执行小型SQL查询,以便您可以交互式地浏览数据,并在提交长时间运行的作业之前设计管道。但这并没有改变工作如何提交给Flink(或任何其他跑步者)的方式。因此,在提交了长时间运行的作业之后,您可能仍需要使用当前必须使用的常规作业管理工具来控制它。
Python:https://s.apache.org/interactive-beam。描述将现有跑步者包装成交互式包装器的方法。