我可以通过Zeppelin笔记本在Athena上成功执行查询,但是我不知道如何保存结果集。
以下代码显示一个表格
%athena
select * from table_name limit 5;
我的目标是将结果保存到熊猫数据框中,以便将来进行转换。
我能够另存为CSV并手动将其导入,但这似乎不是很有效。
我正在使用Zeppelin 0.8.0和AthenaJDBC42-2.0.2.jar
答案 0 :(得分:0)
我发现这是使用 athena 进行试验并使用 spark 执行的最佳方式。 所以基本上:
%spark.pyspark
df = pd.read_sql("select * from table_name limit 5", conn)