Question

我正在尝试在CNN上实现激活功能tanh，但它不起作用，结果始终为“ NaN”。因此，我创建了一个简单的应用程序，其中有一个随机矩阵，并尝试应用tanh（x）函数，从而了解问题出在哪里？

这是我的实现：

    Eigen::MatrixXd A = Eigen::MatrixXd::Random(10,1000);
    Eigen::MatrixXd result, deriv;
    result = A.array().tanh();
    deriv = 1.0 - result*result;

唯一的结果是此错误：

no match for ‘operator-’ (operand types are ‘double’ and ‘const Eigen::Product<Eigen::Matrix<double, -1, -1>, Eigen::Matrix<double, -1, -1>, 0>’)
     deriv = (1.0 - result*result );
              ~~~~^~~~~~~~~~~~~~~

能请你帮我吗？

Answer 1

乘积result*result的尺寸不适合矩阵乘法。我们可以改用result*result.transpose()（除非打算进行系数乘，在这种情况下可以使用result.array()*result.array()）。

要从一个全为1的矩阵中减去所得矩阵的值，可以使用.array()方法：

deriv = 1. - (result*result.transpose()).array();

Answer 2

我使用 openCV 创建了一个矩阵像这样：

cv::Mat sum;
Eigen::MatrixXd SUM, Acv;
cv::eigen2cv(A,Acv)
sum=Mat::ones(Acv.rows,Acv.cols, CV_32FC1);
cv::cv2eigen(sum,SUM);

如此：

deriv = SUM - result*result;

现在，这是另一个问题:(

/usr/include/eigen3/Eigen/src/Core/CwiseBinaryOp.h :110 : Eigen::CwiseBinaryOp<BinaryOp, Lhs, Rhs>::CwiseBinaryOp(const Lhs&, const Rhs&, const BinaryOp&) [with BinaryOp = Eigen::internal::scalar_difference_op<double, double>; LhsType = const Eigen::Matrix<double, -1, -1>; RhsType = const Eigen::Product<Eigen::Matrix<double, -1, -1>, Eigen::Matrix<double, -1, -1>, 0>; Eigen::CwiseBinaryOp<BinaryOp, Lhs, Rhs>::Lhs = Eigen::Matrix<double, -1, -1>; Eigen::CwiseBinaryOp<BinaryOp, Lhs, Rhs>::Rhs = Eigen::Product<Eigen::Matrix<double, -1, -1>, Eigen::Matrix<double, -1, -1>, 0>]:  l'assertion « aLhs.rows() == aRhs.rows() && aLhs.cols() == aRhs.cols() » a échoué.

CNN的tanh（）激活功能的实现

2 个答案: