我正在使用PySpark连接到我的Kudu数据库。我想在一组带有一组谓词的列中检索最小值。似乎无法在API中找到一个选项
client = kudu.connect(host="myhost", port=1234)
table = client.table("impala::mydb.mytable")
scanner = table.scanner()
scanner.add_predicates([table['col1'] == 'test'])
scanner.set_project_column_names(['amount'])
myList = scanner.open().read_all_tuples()
以上将检索一个列表,但我不知道如何指定我想要数量列的MIN值。
尝试
scanner.set_project_column_names([MIN('amount')])
但是导致MIN未定义错误。
答案 0 :(得分:0)
在您的示例中,您好像已经在使用Impala。您可以在Impala SQL中使用MIN函数来获取最小值。例如:
SELECT MIN(amount) FROM mydb.mytable