使用Pig从文件中获取第二条记录

时间:2017-10-31 12:53:14

标签: apache-pig

我的数据是这样的:

Import-Module ActiveDirectory

$users = get-content C:\users-input.txt

foreach($users in $users){

Get-ADUser -Filter {EmailAddress -eq "$_"} -properties SamAccountName | Select-Object SamAccountName | Export-CSV -Path "c:\users.csv"

}

我想创建一个仅包含第二个记录数据的关系(Mac,2,Maths,Chemistry,Botany)然后我想进行进一步的操作。 我尝试使用LIMIT命令,但我会得到一些记录而不是特定记录。

2 个答案:

答案 0 :(得分:0)

使用过滤器获取特定记录。假设您与样本数据集有关系A,那么下面的Pig语句将为您提供您要查找的记录。

B = FILTER A BY (A.$0 == 'Mac');

答案 1 :(得分:0)

这可能会起到作用。

a = load '<your data>';
b = rank a;
c = filter b by $0 == 2;

希望这有帮助!