我有一个统计问题,我试图解决,我知道之前已经解决了,但不幸的是我不知道该搜索什么。这就是我想做的事情:
我想区分两个数字,但结果会根据数字的大小而有所不同。
例如,(58 - 56 = 2)和(100002 - 100000 = 2)。
在第一个等式中,“2”的差异比第二个等式更重要,因为数字的比例更小。我的直接反应是建立一个非线性方程来将结果映射到它上面,但我想先研究一个“正确”的解决方案。
这有名字吗?有人能指出我正确的方向吗?
谢谢!
修改;解决方案: MvG建议相对差异就行了。我试图解决的具体问题是网络速度的差异。因此(58kbps - 56kbps = 2kbps)比(10000002kbps - 10000000kbps = 2kbps)更显着。这解决了我试图解决的特殊问题。谢谢大家!
答案 0 :(得分:2)
我称之为relative difference。在某些情况下,术语relative error也是合适的。
正如维基百科文章正确指出的那样,没有相对差异的唯一定义。常见的对称解决方案(不完全如维基百科上列出的那样,但我自己的直觉被引入)包括
(A-B)/abs((A + B)/2) # average value as reference
(A-B)/((abs(A) + abs(B))/2) # average magnitude as reference
(A-B)/max(abs(A), abs(B)) # greater magnitude as reference
(A-B)/min(abs(A), abs(B)) # smaller magnitude as reference
(A-B)/abs(max(A, B)) # greater value as reference
(A-B)/abs(min(A, B)) # smaller value as reference
如果您的两个值不是同一类型,例如一个是预期值,另一个是观察值,那么使用它们中的一个作为参考可能是有意义的,从而导致相对变化而不是相对差异。这不像上面那样对称。
如果您知道所有值都是正数,则可以在上面删除一些绝对值计算,并且几个定义将变得相同。