优化用于灰度文本文档图像的JPEG量化表

时间:2011-08-02 03:11:35

标签: optimization image-processing jpeg image-compression

信号处理:图像压缩:

我想以JPEG或TIFF-JPEG格式存储全彩文本图像。这些图像包含带有一些彩色图形的文本文档。即使JPEG质量水平非常高,文本上仍然存在大量伪像和降级。

我可以完全控制JPEG编码参数,包括子采样率和量化矩阵。

我的问题是:

  • 我可以为文本文档优化这些参数吗? (超出质量水平)
  • 我可以为图像的不同部分应用不同的参数设置吗?
  • 如果我在编码之前手动截断(量化)图像不同部分的系数会有帮助吗?

(稍后会附上样本图片,因为办公室无法访问imgur。)

3 个答案:

答案 0 :(得分:2)

您是否考虑过使用PDF作为输出?使用PDF,您可以对黑白文本进行动态阈值处理,将其压缩为1-bpp CCITT G4。您还可以捕获页面上的颜色对象,并使用FLATE或JPEG压缩它们。 PDF页面可以是这两种类型对象的组合。您将获得最佳质量和更好的压缩。

答案 1 :(得分:1)

标准JPEG是有损的,你无能为力。并且应该在自然(平滑)图像上忽略丢失的信息。

我的观点是,对于人工图像,您应该使用无损编解码器。不是无损JPEG,而是支持至少RLE的东西。例如,PNG或JPEG-LS会对此类图像产生更好的效果。

答案 2 :(得分:1)

我的第二个BitBank建议使用PDF以不同的方式压缩不同的内容 - 我看到这有时被称为'MRC' - 混合栅格内容。很多文献。

您没有说明您的图片是合成还是扫描。对于合成图像,我个人的经验是即使LZW(在TIFF中)也能做出非凡的工作,特别是如果你愿意做一些(有损)预处理来均匀化样本值。也就是说,如果你可以量化足够的相似值,那么它们就会变得相等。

但是如果您的图像被扫描,则很难预处理到足够干净的图像,LZW或任何其他无损压缩可以找到牵引力。因此,留下JPEG,我认为几乎与ruslik相反,JPEG的损耗在全局和频域都是高度可调的。当然,可以调整量化表以选择性地改善文本质量。我不是专家,但我碰巧记得的起点是Giordano Bruno Beretta&合。在惠普实验室,例如 Method for selecting JPEG quantization tables for low bandwidth applications