我正在尝试从Azure blob存储中的数据中的另一列创建派生列;关于我应该从哪里开始的任何指示。我正在处理的数据集是结构化的数据集。
input dataset= [col_a, col_b, col_c]
output_dataset= [col_a, col_a^2, col_a*3, col_b]
答案 0 :(得分:0)
如果数据集的大小不是很大,您可以尝试以下步骤。
否则,您需要从Azure blob存储中读取数据集,计算新列的值并将其逐行保存到新位置,这取决于您如何将数据集存储在blob中。