如何使用U-SQL

时间:2018-02-28 14:25:41

标签: text jobs azure-data-lake u-sql

我有一个大约130MB的大文件,每行包含10个A字符,而在第10个“A”字符的末尾是\ t,我想提取此文本文件然后将所有A更改为B.任何人都可以帮助它的代码片段吗?

这是我到现在为止所写的内容

USE DATABASE imodelanalytics;

@searchlog =
 EXTRACT characters string
 FROM "/iModelAnalytics/Samples/Data/dummy.txt"
 USING Extractors.Text(delimiter: '\t', skipFirstNRows: 1);


@modify = 
SELECT characters  AS line
FROM @searchlog;

OUTPUT @modify 
TO "/iModelAnalytics/Samples/Data/B.txt" 
USING Outputters.Text();

我是新手,所以任何建议都会有所帮助!感谢

1 个答案:

答案 0 :(得分:0)

假设所有字段都是AAAAAAAAAA,那么你可以写:

@modify = SELECT "BBBBBBBBBB" AS characters FROM @searchlog;

如果只有一些是A个,那么你可以在SELECT子句中执行:

@modify = 
  SELECT (characters == "AAAAAAAAAA" ? "BBBBBBBBBB" : characters) AS characters 
  FROM @searchlog;

如果AAAAAAAAAA周围还有其他字符,那么您将使用更多的C#字符串函数来查找它们并以类似的模式替换它们。