j*t 发帖数: 184 | 1 假如有海量数据如下:
1/15/2010, 3:10:11, AAA, $500,000.00, B
1/15/2010, 3:10:15, BBB, $350,149.00, S
1/15/2010, 3:11:20, AAA, $500,100.00, B
1/15/2010, 3:15:10, CABDE, $1.49, B
如何设计压缩算法得到最大压缩比? | M***0 发帖数: 1180 | 2 可以从内容的层面上考虑吗?
还是只能从字符的层面? | j*t 发帖数: 184 | 3 应该是opened.不让用dictionary-based的东东。
【在 M***0 的大作中提到】 : 可以从内容的层面上考虑吗? : 还是只能从字符的层面?
| M***0 发帖数: 1180 | 4 当成open题,针对他的内容怎么设计到最后都得用字典吧。
不能用字典法,就只能用字符统计法了。一般对文本的编码就是arithmetic和huffman两种,如果对方是出发点是面基本功,那就只能是这个答案了 | a****l 发帖数: 8211 | 5 都变成数字或者枚举.
【在 j*t 的大作中提到】 : 假如有海量数据如下: : 1/15/2010, 3:10:11, AAA, $500,000.00, B : 1/15/2010, 3:10:15, BBB, $350,149.00, S : 1/15/2010, 3:11:20, AAA, $500,100.00, B : 1/15/2010, 3:15:10, CABDE, $1.49, B : 如何设计压缩算法得到最大压缩比?
|
|