pyspark数据框连接两个数据框

时间:2018-11-22 12:52:34

标签: apache-spark dataframe pyspark data-science

我有两个数据帧,分别为df1df2df1的字段为CI_NAMECLOSE_TIMECH_ID df2的字段为NAMETIMESTAMPMEM_CONSUMED。 基本上df1拥有对系统进行的软件更新的记录,df2具有系统的监视记录。

我需要在df1中添加一个名为cpu_util_avg_before_update的字段,方法是将CI_NAMENAME的{​​{1}}字段与df2 {1}}-7天和CLOSE_TIME,然后取TIMESTAMP的平均值。

我该怎么做,在我尝试TIMESTAMP的过程中,我们将不胜感激,但是这并不是将dataframe作为输入。 谢谢

这是我尝试过的代码:

MEM_CONSUMED

但这不能正常工作,并且会引发如下错误:

  

“ DataFrame”对象没有属性“ _get_object_id”

0 个答案:

没有答案