问题背景:我有一个时间与大气温度的数据集。在500天的时间内,这几乎是500个数据点。该数据包括明显的噪声。
目的是使一组b样条函数拟合,以通过二次编程实现对数据进行正则化。
方法:
在第一个日期和第500个日期之间选择一组20个等距的结。
在节点上定义3级的Bspline函数。
Bspline函数在每个日期进行评估。这将导致一个Bspline函数代表每个日期。
在温度和日期样条函数之间定义了一种关系。实施了用于最小化的二次程序以获取规则化数据集。
问题:我发现正则化的结果很大程度上取决于我对结的选择。结数过多会导致产生大量噪点,结数较少会导致平滑现象很多 您能否提供有关专门用于Python的结选择的算法的帮助?