pyspark:如何使用滚动窗口对所有数据集进行分区并在每个分区上运行特定算法?

时间:2019-05-28 15:23:07

标签: time pyspark window partition

我想在Spark中以CSV格式对ECG信号进行分类,但我需要将所有数据集与时间戳列划分为相等的范围,并对每个数据集运行pan-tompking算法以提取特征并保存到另一个数据集中,请帮助我能做到吗?

0 个答案:

没有答案