天蓝色数据湖-验证CSV中的必填字段

时间:2020-06-11 01:07:21

标签: azure azure-data-factory azure-data-lake u-sql azure-data-lake-gen2

我正在开始使用大数据。假设我将收到多个将保存在Azure Data Lake上的csv文件,并且它们具有已定义的架构,那么最好的方法是:

-验证是否将在CSV中提供必填字段(并非所有字段都是必填项)

-获取与定义的架构成功匹配的记录

-获取与定义的架构不匹配的记录

我研究了USQL及其合并/提取/分组数据的速度,但是它并没有被视为逐行验证的正确工具。我也看过Azure数据工厂,但是我不确定这是否是正确的工具或如何实现。

预先感谢

0 个答案:

没有答案