信号处理:图像压缩:
我想以JPEG或TIFF-JPEG格式存储全彩文本图像。这些图像包含带有一些彩色图形的文本文档。即使JPEG质量水平非常高,文本上仍然存在大量伪像和降级。
我可以完全控制JPEG编码参数,包括子采样率和量化矩阵。
我的问题是:
(稍后会附上样本图片,因为办公室无法访问imgur。)
答案 0 :(得分:2)
您是否考虑过使用PDF作为输出?使用PDF,您可以对黑白文本进行动态阈值处理,将其压缩为1-bpp CCITT G4。您还可以捕获页面上的颜色对象,并使用FLATE或JPEG压缩它们。 PDF页面可以是这两种类型对象的组合。您将获得最佳质量和更好的压缩。
答案 1 :(得分:1)
标准JPEG是有损的,你无能为力。并且应该在自然(平滑)图像上忽略丢失的信息。
我的观点是,对于人工图像,您应该使用无损编解码器。不是无损JPEG,而是支持至少RLE的东西。例如,PNG或JPEG-LS会对此类图像产生更好的效果。
答案 2 :(得分:1)
我的第二个BitBank建议使用PDF以不同的方式压缩不同的内容 - 我看到这有时被称为'MRC' - 混合栅格内容。很多文献。
您没有说明您的图片是合成还是扫描。对于合成图像,我个人的经验是即使LZW(在TIFF中)也能做出非凡的工作,特别是如果你愿意做一些(有损)预处理来均匀化样本值。也就是说,如果你可以量化足够的相似值,那么它们就会变得相等。
但是如果您的图像被扫描,则很难预处理到足够干净的图像,LZW或任何其他无损压缩可以找到牵引力。因此,留下JPEG,我认为几乎与ruslik相反,JPEG的损耗在全局和频域都是高度可调的。当然,可以调整量化表以选择性地改善文本质量。我不是专家,但我碰巧记得的起点是Giordano Bruno Beretta&合。在惠普实验室,例如 Method for selecting JPEG quantization tables for low bandwidth applications