将数据帧结果值保存到字符串变量?

时间:2018-04-20 18:36:31

标签: python dataframe spark-dataframe pyspark-sql databricks

当我找到要将其保存到变量的最大日期时,我在spark中创建了一个数据框。只是想弄清楚如何获得结果,这是一个字符串,并将其保存到变量。

到目前为止

代码:

sqlDF = spark.sql("SELECT MAX(date) FROM account")
sqlDF.show()

结果看起来像:

+--------------------+
| max(date)|
+--------------------+
|2018-04-19T14:11:...|
+--------------------+

感谢

3 个答案:

答案 0 :(得分:2)

假设您正在计算全局聚合(其中输出将有一行)并且正在使用PySpark,则以下内容应该有效:

datetime

我相信这会返回一个SELECT CAST(MAX(DATE) as string)对象,但您可以将其转换为驱动程序代码中的字符串,或者改为;server=yourCOMPUTERname\\SQLEXPRESS

答案 1 :(得分:0)

假设sqlDF是一个pandas数据帧,你想得到的值是索引0:

max_date = str(sqlDF.get_value(0, 'max(date)'))

答案 2 :(得分:0)

尝试这样的事情:

EVENT TYPE=CLICK XPATH="//*[@class='thumbActBar']/a"

last_delta将为您提供一个值,在此示例中为数据框中的ingest_date列的最大值。