在上一篇文章column vector with row means -- with std::accumulate?中,我询问是否有可能使用STL功能来计算矩阵的行均值
vector< vector<double> > data ( rows, vector<double> ( columns ) );
@benjaminlindley的最佳答案不仅仅是我所寻找的,它还是一件美丽的事情。永远充满希望我认为计算列方法会很容易,所以STL相当于
vector<double> colmeans( data[0].size() );
for ( int i=0; i<data.size(); i++ )
for ( int j=0; j<data[i].size(); j++ )
colmeans[j] += data[i][j]/data.size();
其中均值不在每个vector<double>
内计算,而是在所有向量中的相同索引中计算:
colmeans[0] == ( data[0][0] + data[1][0] + ... data[rows][0] ) / rows
colmeans[1] == ( data[0][1] + data[1][1] + ... data[rows][1] ) / rows
colmeans[2] == ( data[0][2] + data[1][2] + ... data[rows][2] ) / rows
...
colmeans[columns] == ( data[0] [columns] +
data[1] [columns] +
...
data[rows][columns] ) / rows
事实证明是完全不同的 - 累积不想对矢量矢量起作用。是否可以使用[]
运算符累积?我甚至无法提出一个中间形式(摆脱for i
或for j
循环)似乎不对。
accumulate
和[]
运营商的某些内容?或bind
?
答案 0 :(得分:6)
这是我提出的一些内容,使用for_each
和transform
:
std::vector<std::vector<double>> data { {1,2,3}, {1,2,3}, {1,2,3} };
std::vector<double> colsums( data[0].size() ); // initialize the size
// to number of columns
std::for_each(data.begin(), data.end(),
[&](const std::vector<double>& row)
{
// Use transform overload that takes two input ranges.
// Note that colsums is the second input range as well as the output range.
// We take each element of the row and add it to the corresponding
// element of colsums vector:
std::transform(row.begin(), row.end(), colsums.begin(), colsums.begin(),
[](double d1, double d2) { return d1 + d2; });
});
std::cout << "Column means: ";
std::transform(
colsums.begin(), colsums.end(),
std::ostream_iterator<double>(std::cout, " "),
[&data](double d) { return d / data.size(); });
答案 1 :(得分:2)
首先让我说你真的不应该嵌套std :: vectors。 除此之外,我得到了一些解决方案,当然比你的初始代码长,但从长远来看可以节省:
#include <vector>
#include <boost/iterator/iterator_adaptor.hpp>
#include <boost/iterator/counting_iterator.hpp>
typedef std::vector<std::vector<double> > Data;
struct ColumnElement : boost::iterator_adaptor<ColumnElement,
Data::const_iterator,
const double> {
int col;
ColumnElement(int col, const Data::const_iterator &iter)
: iterator_adaptor(iter), col(col)
{}
const double& dereference()const { return (*base())[col]; }
};
struct Column {
int col;
const Data *data;
Column(int col, const Data *data) : col(col), data(data) {}
ColumnElement begin()const { return ColumnElement(col, data->begin()); }
ColumnElement end()const { return ColumnElement(col, data->end()); }
int size()const { return std::distance(begin(), end()); }
};
struct Columns : boost::iterator_adaptor<Columns, boost::counting_iterator<int>,
Column, boost::use_default, Column> {
const Data *data;
Columns(int col, const Data *data): iterator_adaptor(col), data(data) {}
Column dereference()const { return Column(*base(), data); }
};
Columns columnsBegin(const Data &data) { return Columns(0, &data); }
Columns columnsEnd(const Data &data) {
return Columns(data.empty() ? 0 : data.front().size(), &data);
}
这可以简单地用到:
double Mean(const Column &d) {
return std::accumulate(d.begin(), d.end(), 0.0) / d.size();
}
int main() {
Data data = { {1, 2, 3},
{2, 2, 2},
{9, 8, 7}};
std::vector<double> colMeans(data[0].size());
std::transform(columnsBegin(data), columnsEnd(data),
colMeans.begin(), Mean);
std::copy(colMeans.begin(), colMeans.end(),
std::ostream_iterator<double>(std::cout, ","));
std::cout << "\n";
}
我使用了一些提升功能来缩短它,但它可以在没有提升的情况下完成(无论多长时间)。
我的想法是在所有列上创建一个迭代器(仅为了简短而称为Columns
),迭代一列(ColumnElement
的所有元素(也缩短)的迭代器应更好地命名{ {1}})和ColumnElementIterator
表示一列中所有元素的范围。