我正在寻找有关C ++中加权中值算法和/或样本代码计算的优秀学习资料。我的中位数的权重是0到1之间的值。你能推荐一些链接吗?
答案 0 :(得分:18)
加权中位数的定义如下:
如果x
是N
元素的排序数组,而w
是权重数组,总权重W
,那么加权中位数是最后一个{ {1}} x[i]
和之前所有权重的总和小于或等于w[i]
。
在C ++中,可以这样表达(假设S/2
,x
和w
定义如上)
W
所以我似乎匆匆回答了这个问题并犯了一些错误。我从R documentation找到了加权中位数的简洁描述,它描述如下:
对于
double sum = 0; int i; for(i = 0; i < N; ++i) { sum += w[i]; if(sum > W/2) break; } double median = x[i-1];
元素n
为正面 权重x = c(x[1], x[2], ..., x[n])
使w = c(w[1], w[2], ..., w[n])
,{。}} 加权中位数定义为初始值为sum(w) = S
的元素 所有元素x[k]
的总权重小于或等于x[i] < x[k]
并且所有元素S/2
的总重量较少 或等于x[i] > x[k]
。
从这个描述中,我们有一个非常直接的算法实现。如果我们从S/2
开始,则k == 0
之前没有元素,因此元素x[k]
的总权重将小于x[i] < x[k]
。根据数据,元素S/2
的总重量可能会小于x[i] > x[k]
,也可能不会小于S/2
。因此,我们可以向前移动数组,直到第二个总和小于或等于S/2
:
#include <cstddef>
#include <numeric>
#include <iostream>
int main()
{
std::size_t const N = 5;
double x[N] = {0, 1, 2, 3, 4};
double w[N] = {.1, .2, .3, .4, .5};
double S = std::accumulate(w, w+N, 0.0); // the total weight
int k = 0;
double sum = S - w[0]; // sum is the total weight of all `x[i] > x[k]`
while(sum > S/2)
{
++k;
sum -= w[k];
}
std::cout << x[k] << std::endl;
}
请注意,如果中位数是最后一个元素(medianIndex == N-1
),那么sum == 0
,则条件sum > S/2
会失败。因此,k
永远不会超出范围(除非N == 0
!)。此外,如果有两个元素满足条件,则算法始终选择第一个。
答案 1 :(得分:2)
这是最初未分类矢量的加权中值的实现。它建立在@Ken Wayne VanderLinde对中位数计算以及this thread中给出的索引排序器的非常好的答案的基础上。
template <typename VectorType>
auto sort_indexes(VectorType const& v)
{
std::vector<int> idx(v.size());
std::iota(std::begin(idx), std::end(idx), 0);
std::sort(std::begin(idx), std::end(idx), [&v](int i1, int i2) {return v[i1] < v[i2];});
return idx;
}
template<typename VectorType1, typename VectorType2>
auto weightedMedian(VectorType1 const& x, VectorType2 const& weight)
{
double totalWeight = 0.0;
for (int i = 0; i < static_cast<int>(x.size()); ++i)
{
totalWeight += weight[i];
}
auto ind = sort_indexes(x);
int k = ind[0];
double sum = totalWeight - weight[k];
for (int i = 1; i < static_cast<int>(ind.size()); ++i)
{
k = ind[i];
sum -= weight[k];
if (sum <= 0.5 * totalWeight)
{
break;
}
}
return x[k];
}
适用于支持operator[](int)
和size()
的任何矢量类型(因此不会使用std::accumulate
等。)