标签: azure azure-data-factory azure-data-lake u-sql azure-data-lake-gen2
我正在开始使用大数据。假设我将收到多个将保存在Azure Data Lake上的csv文件,并且它们具有已定义的架构,那么最好的方法是:
-验证是否将在CSV中提供必填字段(并非所有字段都是必填项)
-获取与定义的架构成功匹配的记录
-获取与定义的架构不匹配的记录
我研究了USQL及其合并/提取/分组数据的速度,但是它并没有被视为逐行验证的正确工具。我也看过Azure数据工厂,但是我不确定这是否是正确的工具或如何实现。
预先感谢