无损压缩算法,用于带有模式的100-250字节字符串

时间:2016-02-05 17:06:18

标签: algorithm compression

每个字符串都是根据日期,时间,星期几,固定大小的随机数,URL和其他几个块构建的,它们之间用分号。

2 个答案:

答案 0 :(得分:0)

100-250字节的字符串听起来很难缩短。我认为大多数算法会增加大小。更好的想法是将这些字符串中的一些打包在一起然后压缩它们。如果它足够大,你可以获得规模效益。无论您使用哪种语言,都有许多压缩库。 另一个技巧是使用“二进制”格式。它没有多大帮助,但如果字符串中所有部分的长度始终相同,则可以删除分号。但是你失去了数据的易读性。 如果某些部分的长度不同,但是在0-255字节的范围内,则只需在该部分的开头添加一个字节以存储长度。这使得以人为单位读取数据变得更加困难,但是您节省了一些字节。 (分数计数设置了多少,我打赌在5到10个字节之间)。 没有更多信息,很难回答。

答案 1 :(得分:0)

试试smaz。它是为此目的而写的。您的里程可能会有所不同。