如何在Pyspark中获取不在另一个数据框中的元素?

时间:2017-06-19 08:03:29

标签: sql join dataframe pyspark apache-spark-sql

我有两个数据帧,df1和df2,我想得到另一个数据帧,其中df1的元素不在df2中。我怎么能得到它?

1 个答案:

答案 0 :(得分:1)

SQL中等效的EXCEPT子句是下一个:

    var myObj = {
        $res:null,
        init: function() {
          this.cacheDom();
          this.bindEvents();
        },
        cacheDom: function() {
          $res = $('#result');
        },
        bindEvents: function() {
          $res.on('click', 'button[name=print]', this.sendData.bind(this));
        },
        sendData: function(event) {
          var $row = $(event.target).closest('tr');   
          var $myName = $row.find('td:eq(0)').text();
          console.log($row);
          console.log($myName); 
        }
      };
      myObj.init();

这样,df3会将那些元素存储在df1中,而不是df2。