应用错误收集

优化用于灰度文本文档图像的JPEG量化表

时间：2011-08-02 03:11:35

标签： optimization image-processing jpeg image-compression

信号处理：图像压缩：

我想以JPEG或TIFF-JPEG格式存储全彩文本图像。这些图像包含带有一些彩色图形的文本文档。即使JPEG质量水平非常高，文本上仍然存在大量伪像和降级。

我可以完全控制JPEG编码参数，包括子采样率和量化矩阵。

我的问题是：

我可以为文本文档优化这些参数吗？（超出质量水平）
我可以为图像的不同部分应用不同的参数设置吗？
如果我在编码之前手动截断（量化）图像不同部分的系数会有帮助吗？

（稍后会附上样本图片，因为办公室无法访问imgur。）

3 个答案:

答案 0 :(得分：2)

您是否考虑过使用PDF作为输出？使用PDF，您可以对黑白文本进行动态阈值处理，将其压缩为1-bpp CCITT G4。您还可以捕获页面上的颜色对象，并使用FLATE或JPEG压缩它们。 PDF页面可以是这两种类型对象的组合。您将获得最佳质量和更好的压缩。

答案 1 :(得分：1)

标准JPEG是有损的，你无能为力。并且应该在自然（平滑）图像上忽略丢失的信息。

我的观点是，对于人工图像，您应该使用无损编解码器。不是无损JPEG，而是支持至少RLE的东西。例如，PNG或JPEG-LS会对此类图像产生更好的效果。

答案 2 :(得分：1)

我的第二个BitBank建议使用PDF以不同的方式压缩不同的内容 - 我看到这有时被称为'MRC' - 混合栅格内容。很多文献。

您没有说明您的图片是合成还是扫描。对于合成图像，我个人的经验是即使LZW（在TIFF中）也能做出非凡的工作，特别是如果你愿意做一些（有损）预处理来均匀化样本值。也就是说，如果你可以量化足够的相似值，那么它们就会变得相等。

但是如果您的图像被扫描，则很难预处理到足够干净的图像，LZW或任何其他无损压缩可以找到牵引力。因此，留下JPEG，我认为几乎与ruslik相反，JPEG的损耗在全局和频域都是高度可调的。当然，可以调整量化表以选择性地改善文本质量。我不是专家，但我碰巧记得的起点是Giordano Bruno Beretta＆amp;合。在惠普实验室，例如 Method for selecting JPEG quantization tables for low bandwidth applications