仅从一个数据帧火花中删除重复项

时间:2018-06-27 12:33:29

标签: apache-spark apache-spark-sql

我有2个数据框。

df1:

as

df2:

View::share

两个数据框都有一些常见的 AusID ,但我只想从 df2 中删除重复项,而 AusID 是相同的,而无需修改 df1 。生成的 df2 应该是:

use View;

class NavController extends Controller {
    function __construct() {
        View::share('tags', Tag::all());
    }
    public function posts()
    {
        $posts = Post::all();
        return view('posts')->with('posts', => $posts);
    }
    public function users()
    {
        $users = User::all();
        return view('users')->with('users', => $users);
    }
}

我通过分配标签尝试了以下方法,但是没有用:

|AusID|ProjectId|
+-----+----------
|529  |20034    |
|973  |20035    |
|521  |20034    |
|543  |20035    |

如果有人可以提供一些提示,那就太好了。

0 个答案:

没有答案