当我找到要将其保存到变量的最大日期时,我在spark中创建了一个数据框。只是想弄清楚如何获得结果,这是一个字符串,并将其保存到变量。
到目前为止代码:
sqlDF = spark.sql("SELECT MAX(date) FROM account")
sqlDF.show()
结果看起来像:
+--------------------+
| max(date)|
+--------------------+
|2018-04-19T14:11:...|
+--------------------+
感谢
答案 0 :(得分:2)
假设您正在计算全局聚合(其中输出将有一行)并且正在使用PySpark,则以下内容应该有效:
datetime
我相信这会返回一个SELECT CAST(MAX(DATE) as string)
对象,但您可以将其转换为驱动程序代码中的字符串,或者改为;server=yourCOMPUTERname\\SQLEXPRESS
。
答案 1 :(得分:0)
假设sqlDF是一个pandas数据帧,你想得到的值是索引0:
max_date = str(sqlDF.get_value(0, 'max(date)'))
答案 2 :(得分:0)
尝试这样的事情:
EVENT TYPE=CLICK XPATH="//*[@class='thumbActBar']/a"
last_delta将为您提供一个值,在此示例中为数据框中的ingest_date列的最大值。