我开发了2个代码,但目标是相同的。 首先,它通过pydrill向apache drill提交查询。在这种情况下,查询是很多选择命令和它们之间的并集,然后将结果保存在数据框中。 第二个代码,它提交了很多查询(每个查询都是一个选择),我将结果追加到数据帧中。 两种解决方案都不遵循列顺序。 例如:选择column [1]作为A,选择column [2]作为B 结果是一个大数据框,其标头是B,A 在我的情况下,数据框有7列,顺序与子句选择不同。 列之一是fqn属性(来自Apache钻取),用于获取当前文件的路径。