我想在U-SQL Azure数据工厂中只从.csv文件中选择几列

时间:2017-05-17 10:32:25

标签: azure-data-lake

我想在U-SQL Azure数据工厂中只从.csv文件中选择几列。

我的csv文件中有10列我想只选择5列并写入新文件

1 个答案:

答案 0 :(得分:1)

使用内置提取器时,您必须指定所有列,但使用行集变量只选择您想要的列(也称为projection)很简单,如下所示:

// Do the initial extract for all columns
@input =
    EXTRACT colA string,
            colB string,
            colC string,
            colD string,
            colE string,
            colF string,
            colG string,
            colH string,
            colI string,
            colJ string

    FROM "/input/input57.csv"
    USING Extractors.Csv();


// Pick (project) the columns you need
@output =
    SELECT colA,
           colB,
           colC,
           colD,
           colE
    FROM @input;


// Output the columns you need
OUTPUT @output
TO "/output/output.csv"
USING Outputters.Csv();