Question

需要帮助。在Windows-Visual Studio上运行C ++代码时，我遇到了问题。

当我在Linux环境中运行该代码时，对我能够动态分配的内存没有限制（直到RAM中可用的大小）。

但是在VS Compiler上，它不允许我创建超出有限大小的数组。我已经尝试/ F选项和20-25的谷歌链接，以增加内存大小，但他们似乎没有多大帮助。

我目前只能从3gb中分配大约100mb。

如果在Windows中有这样的解决方案，而不是在Visual Studio的编译器中，我会很高兴听到因为我有一张CUDA TeslaC2070卡在Windows上证明是非常无用的，因为我想运行我的CUDA / Windows环境下的C ++代码。

这是我的代码。当LENGTH> 128（没有图像640x480pngs。每个小于0.5mb时，它会失败。我还计算了通过计算OpenCV中使用的数据结构和类型所花费的大致内存大小，但是它仍然非常小于2gb）。 stackoverflow异常。与动态分配相同。我已经最大化了堆和堆栈大小。

#include "stdafx.h"

#include <cv.h>
#include <cxcore.h>
#include <highgui.h>

#include <cuda.h>
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#define LENGTH 100
#define SIZE1 640   
#define SIZE2 480
#include <iostream>
using namespace std;


__global__ void square_array(double *img1_d, long N)
{

int idx = blockIdx.x * blockDim.x + threadIdx.x;

img1_d[idx]= 255.0-img1_d[idx];

}


int _tmain(int argc, _TCHAR* argv[])
{   
        IplImage *img1[LENGTH];
        // Open the file.
        for(int i=0;i<LENGTH;i++)
        {   img1[i] = cvLoadImage("abstract3.jpg");}




    CvMat *mat1[LENGTH];
    for(int i=0;i<LENGTH;i++)
    {
        mat1[i] = cvCreateMat(img1[i]->height,img1[i]->width,CV_32FC3 );
        cvConvert( img1[i], mat1[i] );
    }


    double a[LENGTH][2*SIZE1][SIZE2][3];

    for(int m=0;m<LENGTH;m++)
    {
    for(int i=0;i<SIZE1;i++)
    {
         for(int j=0;j<SIZE2;j++)
         {
               CvScalar scal = cvGet2D( mat1[m],j,i);
               a[m][i][j][0] = scal.val[0];
               a[m][i][j][1] = scal.val[1];
               a[m][i][j][2] = scal.val[2];

               a[m][i+SIZE1][j][0] = scal.val[0];
               a[m][i+SIZE1][j][1] = scal.val[1];
               a[m][i+SIZE1][j][2] = scal.val[2];

            }

    }   }

//cuda
double *a_d;
int N=LENGTH*2*SIZE1*SIZE2*3;

cudaMalloc((void **) &a_d, N*sizeof(double));
cudaMemcpy(a_d, a, N*sizeof(double), cudaMemcpyHostToDevice);
int block_size = 370;
int n_blocks = N/block_size + (N%block_size == 0 ? 0:1);
cout<<n_blocks<<block_size;
square_array <<< n_blocks, block_size >>> (a_d, N);
cudaMemcpy(a, a_d, N*sizeof(double), cudaMemcpyDeviceToHost);

//cuda end



char name[]= "Image: 00000";
name[12]='\0';
int x=0,y=0;
for(int m=0;m<LENGTH;m++)
{
for (int i = 0; i < img1[m]->width*img1[m]->height*3; i+=3) 
{ 
 img1[m]->imageData[i]= a[m][x][y][0];
 img1[m]->imageData[i+1]= a[m][x][y][1];
 img1[m]->imageData[i+2]= a[m][x][y][2];

  if(x==SIZE1)
  {
  x=0;
  y++;
  }
x++;
}

    switch(name[11])
    {
        case '9': switch(name[10])
        {
            case '9': 
            switch(name[9])
            {
                case '9': name[11]='0';name[10]='0';name[9]='0';name[8]++;
                break;
                default : name[11]='0';
                name[10]='0';
                name[9]++;
            }break;

            default : name[11]='0'; name[10]++;break;
            }

            break;
        default : name[11]++;break;
    }
        // Display the image.
        cvNamedWindow(name, CV_WINDOW_AUTOSIZE);
        cvShowImage(name,img1);
    //cvSaveImage(name ,img1);
}
        // Wait for the user to press a key in the GUI window.
        cvWaitKey(0);

        // Free the resources.
        //cvDestroyWindow(x);
        //cvReleaseImage(&img1);
    //cvDestroyWindow("Image:");
        //cvReleaseImage(&img2);

        return 0;
}

Answer 1

问题是你在主函数的堆栈上分配一个巨大的多维数组（double a [..] [..] [..]）。不要在堆栈上分配这么多内存。使用malloc / new在堆上进行分配。

如何在Visual Studio C ++中增加内存限制

1 个答案: