我正在使用Azure数据工厂将数据从Azure Cosmos DB复制到Azure数据湖。我的管道包含一个复制活动,该复制活动将数据复制到Data Lake Sink。
这是我对源数据集的查询:
Optional<T> findById(ID id)
我要在触发时间之前的最后15分钟获取数据。
现在,如果查询没有检索到任何数据,则复制活动将生成一个空文件并将其存储在数据湖中。我想防止这种情况。我有什么办法可以做到这一点?
答案 0 :(得分:2)
答案 1 :(得分:0)
答案 2 :(得分:0)
这是一个较旧的线程,但是有人可以用一种更优雅的方式来处理以上问题,即使有0条记录,ADF也会生成文件。这是我对“查找”方法或进行后处理清理空文件的关注。