用于二维矩阵的Java中的DCT和IDCT实现

时间:2015-03-29 21:14:57

标签: java performance optimization

我已经有了dct和idct的实现,但是它们变得非常慢,因为尽管进行了适当的优化,矩阵的大小也会增加。 有没有人知道为两个或任何Java库提供更快的实现,为二维案例提供更快的实现。 感谢

 public final double[][] initCoefficients(double[][] c) 
 {
    final int N = c.length;
    final double value = 1/Math.sqrt(2.0);

    for (int i=1; i<N; i++) 
    {
        for (int j=1; j<N; j++) 
        {
            c[i][j]=1;
        }
    }

    for (int i=0; i<N; i++) 
    {
        c[i][0] = value;
        c[0][i] = value;
    }
    c[0][0] = 0.5;
    return c;
}

/* Computes the discrete cosine transform
 */
public final double[][] forwardDCT(double[][] input) 
{
    final int N = input.length;
    final double mathPI = Math.PI;
    final int halfN = N/2;
    final double doubN = 2.0*N;

    double[][] c = new double[N][N];
    c = initCoefficients(c);

    double[][] output = new double[N][N];

    for (int u=0; u<N; u++) 
    {
        double temp_u = u*mathPI;
        for (int v=0; v<N; v++) 
        {
            double temp_v = v*mathPI;
            double sum = 0.0;
            for (int x=0; x<N; x++) 
            {
                int temp_x = 2*x+1;
                for (int y=0; y<N; y++) 
                {
                    sum += input[x][y] * Math.cos((temp_x/doubN)*temp_u) * Math.cos(((2*y+1)/doubN)*temp_v);
                }
            }
            sum *= c[u][v]/ halfN;
            output[u][v] = sum;
        }
    }
    return output;
}

/* 
 * Computes the inverse discrete cosine transform
 */
public final double[][] inverseDCT(double[][] input) 
{
    final int N = input.length;
    final double mathPI = Math.PI;
    final int halfN = N/2;
    final double doubN = 2.0*N;

    double[][] c = new double[N][N];
    c = initCoefficients(c);

    double[][] output = new double[N][N];


    for (int x=0; x<N; x++) 
    {
        int temp_x = 2*x+1;
        for (int y=0; y<N; y++) 
        {
            int temp_y = 2*y+1;
            double sum = 0.0;
            for (int u=0; u<N; u++) 
            {
                double temp_u = u*mathPI;
                for (int v=0; v<N; v++) 
                {
                    sum += c[u][v] * input[u][v] * Math.cos((temp_x/doubN)*temp_u) * Math.cos((temp_y/doubN)*v*mathPI);
                }
            }
            sum /= halfN;
            output[x][y] = sum;
        }
   }
   return output;
}

2 个答案:

答案 0 :(得分:3)

现在它是一个O(n 4 )算法,四个嵌套循环都在进行n次迭代。如果你有足够的勇气尝试快速余弦变换,那么可分性可以达到O(n 3 )(或者O(n 2 log n)。它实际上甚至比使用2D公式更简单,因为它只是:

  • 在所有行上运行1D DCT
  • 在所有列(上一个结果)上运行1D DCT

或(可选),使两个部分完全相同:

  • 在所有行上运行1D DCT,保存转置的结果
  • 再做一次

转置意味着它第二次真正做列,并且在两个转置中相互撤消。

所以,余弦。你注意到了

  由于计算内部(循环)局部变量的余弦,

预计算余弦似乎很难

这些余弦实际上只是以公式形式写下的常量,该数组仅取决于n。例如,看看FFmpeg在dctref.c

中如何做到这一点

答案 1 :(得分:0)

你有DCT的最大尺寸吗?如果使用整数是正常的(这通常是图像处理的情况),你可以在那里找到一些大小为4,8,16和32的快速实现:https://github.com/flanglet/kanzi/tree/master/java/src/kanzi/transform