如何在Linux上读取C ++中的JPEG和PNG像素?

时间:2009-03-29 03:55:07

标签: c++ c linux png jpeg

我正在做一些图像处理,我想单独读取JPEG和PNG图像中的每个像素值。

在我的部署方案中,使用第三方库(因为我在目标计算机上限制访问)会很尴尬,但我假设没有用于读取JPEG / PNG的标准C或C ++库...

所以,如果你知道使用图书馆的方式那么好,如果没有,那么仍然欢迎答案!

9 个答案:

答案 0 :(得分:21)

C标准中没有标准库来读取文件格式。

但是,大多数程序,尤其是Linux平台上的程序使用相同的库来解码图像格式:

对于jpeg它是libjpeg,对于png它的libpng。

已安装lib的可能性非常高。

http://www.libpng.org

http://www.ijg.org

答案 1 :(得分:19)

这是我从10年前的源代码(使用libjpeg)挖掘的一个小例程:

#include <jpeglib.h>

int loadJpg(const char* Name) {
  unsigned char a, r, g, b;
  int width, height;
  struct jpeg_decompress_struct cinfo;
  struct jpeg_error_mgr jerr;

  FILE * infile;        /* source file */
  JSAMPARRAY pJpegBuffer;       /* Output row buffer */
  int row_stride;       /* physical row width in output buffer */
  if ((infile = fopen(Name, "rb")) == NULL) {
    fprintf(stderr, "can't open %s\n", Name);
    return 0;
  }
  cinfo.err = jpeg_std_error(&jerr);
  jpeg_create_decompress(&cinfo);
  jpeg_stdio_src(&cinfo, infile);
  (void) jpeg_read_header(&cinfo, TRUE);
  (void) jpeg_start_decompress(&cinfo);
  width = cinfo.output_width;
  height = cinfo.output_height;

  unsigned char * pDummy = new unsigned char [width*height*4];
  unsigned char * pTest = pDummy;
  if (!pDummy) {
    printf("NO MEM FOR JPEG CONVERT!\n");
    return 0;
  }
  row_stride = width * cinfo.output_components;
  pJpegBuffer = (*cinfo.mem->alloc_sarray)
    ((j_common_ptr) &cinfo, JPOOL_IMAGE, row_stride, 1);

  while (cinfo.output_scanline < cinfo.output_height) {
    (void) jpeg_read_scanlines(&cinfo, pJpegBuffer, 1);
    for (int x = 0; x < width; x++) {
      a = 0; // alpha value is not supported on jpg
      r = pJpegBuffer[0][cinfo.output_components * x];
      if (cinfo.output_components > 2) {
        g = pJpegBuffer[0][cinfo.output_components * x + 1];
        b = pJpegBuffer[0][cinfo.output_components * x + 2];
      } else {
        g = r;
        b = r;
      }
      *(pDummy++) = b;
      *(pDummy++) = g;
      *(pDummy++) = r;
      *(pDummy++) = a;
    }
  }
  fclose(infile);
  (void) jpeg_finish_decompress(&cinfo);
  jpeg_destroy_decompress(&cinfo);

  BMap = (int*)pTest; 
  Height = height;
  Width = width;
  Depth = 32;
}

答案 2 :(得分:7)

对于jpeg,已经有一个名为libjpeg的库,png有libpng。好消息是它们可以直接编译,因此目标机器不需要dll文件或任何东西。坏消息是他们在C :(

另外,甚至不要自己想到trying to read the files。如果您想要易于阅读的格式,请改用PPM

答案 3 :(得分:4)

不幸的是,jpeg格式是压缩的,所以你必须在读取单个像素之前将其解压缩。这是一项非常重要的任务。如果您不能使用库,您可能需要参考一个库来查看它如何解压缩图像。 sourceforge上有一个开源库:CImg on sourceforge.

答案 4 :(得分:2)

由于它可以使用曝光,我会提到另一个要调查的库:The IM Toolkit,它位于Sourceforge。它是跨平台的,并且完全远离用户抽象文件格式,允许加载和处理图像而不必担心大部分细节。它支持开箱即用的PNG和JPEG,并且可以根据需要使用其他导入过滤器进行扩展。

它还附带了大量的图像处理操作员......

它与Lua具有良好的质量绑定。

答案 5 :(得分:2)

正如Nils指出的那样,没有用于JPEG压缩和图像处理的C或C ++标准库。

如果您能够使用第三方库,您可能需要尝试支持JPEG,PNG和其他数十种格式,压缩和媒体的GDAL

这是一个简单的示例,介绍如何使用GDAL C ++ API从JPEG文件中读取像素数据:

#include <gdal_priv.h>
#include <cassert>
#include <iostream>
#include <string>
#include <vector>

int main()
{
    GDALAllRegister(); // once per application

    // Assume 3-band image with 8-bit per pixel per channel (24-bit depth)
    std::string const file("/home/mloskot/test.jpg");

    // Open file with image data
    GDALDataset* ds = static_cast<GDALDataset*>(GDALOpen(file.c_str(), GA_ReadOnly));
    assert(0 != ds);

    // Example 1 - Read multiple bands at once, assume 8-bit depth per band
    {
        int const ncols = ds->GetRasterXSize();
        int const nrows = ds->GetRasterYSize();
        int const nbands = ds->GetRasterCount();
        int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
        std::vector<unsigned char> data(ncols * nrows * nbands * nbpp);

        CPLErr err = ds->RasterIO(GF_Read, 0, 0, ncols, nrows, &data[0], ncols, nrows, GDT_Byte, nbands, 0, 0, 0, 0);
        assert(CE_None == err);

        // ... use data
    }

    // Example 2 - Read first scanline by scanline of 1 band only, assume 8-bit depth per band
    {
        GDALRasterBand* band1 = ds->GetRasterBand(1);
        assert(0 != band1);

        int const ncols = band1->GetXSize();
        int const nrows = band1->GetYSize();
        int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
        std::vector<unsigned char> scanline(ncols * nbpp);

        for (int i = 0; i < nrows; ++i)
        {
            CPLErr err = band1->RasterIO(GF_Read, 0, 0, ncols, 1, &scanline[0], ncols, 1, GDT_Byte, 0, 0);
            assert(CE_None == err);

            // ... use scanline
        }
    }

    return 0;
}

有更完整的GDAL API tutorial可用。

答案 6 :(得分:1)

我对DevIL库有很好的体验。它支持多种图像格式,并遵循与OpenGL非常相似的功能风格。

当然,这是一个图书馆,但绝对值得一试。

答案 7 :(得分:1)

由于其他答案已经提到您很可能需要使用库,请查看ImageMagick并查看是否可以执行您需要它执行的操作。它提供了多种不同的方式来连接ImageMagick的核心功能,包括几乎所有可用的编程语言的库。

主页:ImageMagick

答案 8 :(得分:1)

如果速度不是问题,您可以尝试LodePNG采用极简主义的PNG加载和保存方法。

甚至可以与同一作者中的picoPNG一起使用,该作者是函数中自包含的png加载器。