我有一个特定的问题,我需要一个适合一组数据的方程式,我可以提取一个通用函数(可能很复杂),它会给我一个尽可能接近数据的Y值 - 如如果我将数据用作查找表。
我一直在阅读各种方法,多变量自适应回归样条[MARS]似乎是一个很好的候选人。我遇到的问题是它没有在数据的一个非常重要的部分检测/拟合铰链。
我主要在地球包中使用R,意图将等式放入Excel中。我可以使用其他语言或包,如果它能给我我需要的结果。
问题: 在我的数据的低端,我有一小组值,这是一个重要的下限,需要放置一个铰链或结。
其余数据应具有自动铰链/结检测。
实施例: X Y. 0 130 1 130 10000 130 X的剩余时间超过10000,并以不同的速率增加Y.
它会将0到10,000的范围平均为增加的Y值,如果是的话 预测(模型,5000)我可能会说150结果。该线需要一个平坦的线性段,然后铰接在10000处。这种缺少铰链会导致所有高值X在MARS模型输出中非常准确,但X的低值会显着偏离基础数据。
我宁愿不手动放置这个,因为下端可能会改变,我想要一个通用的方法。
有没有人知道类似于MARS的方法可以提供
MARS方法适用于数据中的所有其他断点,但由于下限的“范围”有限,即使关闭修剪,它也不会在那里放置铰链。
有谁知道更好的方法?