Spark Java:在数据集1中查找数据,而不在数据集2中查找数据

时间:2018-08-20 19:58:54

标签: java apache-spark apache-spark-sql dataset

我有2个数据集-具有40列的ds1和具有10列的ds2。他们两个都有共同的id列。如何使用ds1中而不是ds2中的数据构建新的数据集?

1 个答案:

答案 0 :(得分:0)

执行左外部联接。您可以执行以下操作(我假设源数据为csv格式)

<div class="menu-trigger" (click)="showList = true"></div>
<ul class="list" *ngIf="showList" (clickOutside)="showGiftList = false">
  <li>item 1</li>
  <li>item 2</li>
  <li>item 3</li>
  <li>item 4</li>
</ul>