为什么两个具有不同基数的流明对数模型产生相同的预测?

时间:2019-05-13 03:59:49

标签: r lm

我正在尝试使用lm()和predict()函数预测值,并且两个不同的函数会产生相同的值

考虑data.frame

<h2>Four Equal Columns</h2>

<div class="row">
  <div class="column" style="background-color:#aaa;">
    <h2>Column 1</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#bbb;">
    <h2>Column 2</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#ccc;">
    <h2>Column 3</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#ddd;">
    <h2>Column 4</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#aaa;">
    <h2>Column 1</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#bbb;">
    <h2>Column 2</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#ccc;">
    <h2>Column 3</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#ddd;">
    <h2>Column 4</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#aaa;">
    <h2>Column 1</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#bbb;">
    <h2>Column 2</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#ccc;">
    <h2>Column 3</h2>
    <p>Some text..</p>
  </div>
  <div class="column" style="background-color:#ddd;">
    <h2>Column 4</h2>
    <p>Some text..</p>
  </div>
</div>

我正在生产两个具有不同基础的单独模型。模型实际上是不同的

d <- structure(list(sample_number = 1:9, 
                    cumSum = c(200.903, 296.329, 370.018, 431.59, 485.14, 533.233, 576.595, 616.536, 654)), 
                    class = "data.frame", row.names = c(NA, 9L))

但是,预测是相同的

lmEBase2 <- lm(cumSum~log(sample_number, base = 2),data=d)
lmEBase3 <- lm(cumSum~log(sample_number, base = 3),data=d)
logPredBase2 <- predict(lmEBase2, newdata=data.frame(sample_number=1:20))
logPredBase3 <- predict(lmEBase3, newdata=data.frame(sample_number=1:20))

为什么?

我希望对数基准的对数曲线形状不同,如Wikipedia中所示

https://en.wikipedia.org/wiki/Logarithm

1 个答案:

答案 0 :(得分:0)

进行线性回归时,我们用以下公式拟合一条线

其中

这证明了为什么截距相等。

类似地,

这就是为什么229.4*log(2,base = 3) = 144.7其中229.4是第二个拟合系数,而144.7是第一个拟合系数的原因。而且截距相等。

这说明了执行的两个回归之间的关系。

现在,如果Fit1是

健身2是

再次使用base的变化,我们可以看到Fit2等于Fit1。

由于我们使用的只是基数的变化,所以我们使用什么基数都没有关系,所有拟合都将相同。