首页技术总结正文内容

哈夫曼压缩算法

技术总结

更新时间：2024-12-23 07:48:48 35

admin 管理员组

文章数量: 887021

2023年12月17日发(作者：osi七层模型与tcp ip模型的区别)

文件压缩总结（哈夫曼压缩）

在学习哈弗曼压缩之前，还是首先来了解什么是哈夫曼树，哈夫曼编码。

1.哈夫曼树是一种最优二叉树，它的带权路径长度达到最小。树的带权路径长度为所有叶子结点带权路径长度之和。

而结点的带权路径长度是结点的路径长度乘以结点的权值。

2.哈夫曼编码是依据字符出现概率来构造异字头的平均长度最短的码字。从哈弗曼树的根结点开始，按照左子树代码为“0”，右子树代码为“1”的规则，直到树的叶子结点，每个叶子结点的哈弗曼编码就是从根结点开始，将途中经过的枝结点和叶子结点的代码按顺序串起来。

哈夫曼压缩是字节符号用一个特定长度的01序列替代，在文件中出现频率高的符号，使用短的01序列，而出现频率少的字节符号，则用较长的01序列表示。

这里的文件压缩，我还只能做简单的文件A-->压缩为文件B--->解压为文件C，看文件A和文件C是不是相同。

那么就要分两个大步骤，小步骤：

不过，根据哈弗曼树的特点，我们首先还是要定义结点类型

结点类型代码

1. public class TreeNode {

2. public TreeNode parent; //双亲结点

3. public TreeNode left; //左孩子结点

4. public TreeNode right; //右孩子结点

6. public byte con;// 结点的数据

7. public int rate;

8. public String bian="";

9. public int count=0;

10. public TreeNode(byte con, int rate) {

11. super();

12. = con;

13. = rate;

14. }

15. }

然后分两大步骤

一. 首先压缩文件

1. 将源文件A中数据按字节读取，然后用MAP统计每个字节出现的次数（Key--不同的字节，value--次数）。

统计频率代码

1. while (t != -1) {// 如果未到达结尾

2. byte b = (byte) t;

4. if (nsKey(b)) {// 如果map里面包含number键

5. int value = (b);// 就可以通过get函数得到number对应的value的值

6. value++;// 使次数加1

8. (b, value);

9. } else {// 如果map里面不包含number键

10. (b, 1);// number的次数只有一次

11. }

12. // 继续读取下一个

13. t = ();

14.

15. }

2. 将Map中的value值作为权值，建哈夫曼树，并得到每个字节的哈弗曼编码。

创建哈树代码

1. /**

2. * 创建哈树

3. * @param nodeQueue 已经得到的优先队列

4. * @return 创建哈树后，返回树的根结点

5. */

6. public static TreeNode creatTree(PriorityQueue nodeQueue){

7. byte a=0; //定义一个byte，用来表示枝节点的字节

8. TreeNode root=null; //用来表示树的根结点

9. while(()>=2){ //当优先队列中的元素大于2 时，还可以使它们组成新的跟结点

10. TreeNode left=(); //获取当前队列中的最小元素，并将队列中的该元素删除。是该节点作为左孩子

11. TreeNode right=(); //获取当前队列中的最小元素，作为右孩子

12. root=new TreeNode(a,+); //左右孩子的频率之和作为根结点的频率

13. =left; //连接孩子结点和根结点的关系

14. =right;

15. if(()==0){

16. return root;

17. }

18. (root);

19. }

20. return root;

21. }

得到哈夫曼编码代码

1. /**

2. * 得到哈树叶子结点的哈弗曼编码

3. * @param node 哈树的根结点

4. * @return 将叶子结点的《字节，编码》存放入 map 中返回

5. */

6. public static HashMap getCode(TreeNode node){

7. if(!=(byte)0){

8. n((char)+"--zuo--"+);

9. (, );

10. }

11. TreeNode left=; // 获得左孩子结点

12. if(left!=null){ //若为非空则获得它的哈弗曼编码

13. =+"0";

14. ++;

15. getCode(left);

16. }

17. TreeNode right=; // 获得右孩子结点

18. if(right!=null){ //若为非空则获得它的哈弗曼编码

19. =+"1";

20. ++;

21. getCode(right);

22. }

23. return codemap;

24.}

3. 压缩关键（压缩文件的格式：码表+文件信息）

再构造Map(Key--每个不同的字节，value--哈弗曼编码)。将文件中的字符串转换成对应的哈弗曼编码（即 0 1串）。将得到的0 1 串转换成字节（当最后不够构成一个字节时，在后面添加0），并最后用一个字节记录添加的0的个数。将整个Map的信息写进文件B，就是码表。同时将得到的字节写进文件B中。

Java代码

1. length=(); //得到当前01串文件的大小

2. if(length%8==0){

3. length=length/8+1;

4. }

5. else{

6. length=length/8+2;

7. }

8. byte[] ws=new byte[length];

9. n("数组的长度是:"+length);

10. while(()>0){ //将01串文件写到文件中

11. length=(); //得到当前01串文件的大小

12. if(length>=8){ //若长度大于等于8

13. write=ing(0,8); //取其前八位

14. ws[i]=changInt(write); //将这八位的01串转换成 byte

15.

16. writes=ing(8); //同时得到原文件第8位后面的01串

17. n(write+"--ws-->"+(int)ws[i]);

18. i++;

19. }else{ //当01文件的长度不够8位时

20. int bu0=8-length;

21. for(int j=0;j

22. writes=writes+"0";

23. }

24. ws[-1]=(byte)bu0;

25. }

26. }

27.

28. (ws, 0,);

29. ();

30. ();

其实将码表写进文件中有两种方法，不过，龙哥为了让我们对文件的格式有更深刻的了解，叫我们使用最原始的方法，就是将码表里的信息一个一个的写进文件。具体将字节，哈弗曼编码及每个编码的长度同时记录在文件中。其实在写码表的时候还可以用ObjectInputStream和ObjectOutputStream流，直接将整个码表作为一个对象一次就可以写进文件中，这样就简单多了。不过，初学时，还是使用前者好些，这样有利于自己对整个项目的深层掌握。等对这个项目完全非常了解掌握后，就可以做精简版的文件压缩了。

二．解压过程

4.根据码表得到Map(Key--每个不同的字节，value--哈弗曼编码),将得到的Map转换成Map2(Key--哈弗曼编码，value--每个不同的字节)。并将文件B中的文件信息部分转换成01串

Java代码

1. int MapL=t(); //得到 map 的长度

2. codess=new String[MapL];

3. for(int t=0;t

4. byte zij=te(); //得到每个字节

5. byte coL=te();//得到每个编码的长度

6. byte[] codes=new byte[coL]; //定义一个 byte 数组，用来存储每个哈夫曼编码

8. (codes, 0, coL);

9. //将一个字节的哈弗曼编码转换成字符串形式

10. String cos=new String(codes); //得到一个整的哈夫曼编码

11. codess[t]=cos; //

12. n(zij+"--对应点->"+cos);

13. (cos,zij); //每次获得的一个字节于它对应的编码，就将它们放入 map 中

14. }

15.

16.

17.读取文件中的字节，并将其转换成0 1串

18. int length=t();

19. n("-文件的长度->"+length);

20.

21. for(int j=0;j

22. b=te(); //读取文件中的字节

23. n("---重新输出-->"+b);

24.

25. String s=ryString(b);

26. n("-b的二进制-->"+s+"--->"+());

27. if(()>8){

28. s0="";

29. s0=ing(24,());

30. }else if(()<8){

31. int len=();

32. for(int k=0;k

33. s1=s1+"0";

34. }

35. s0=s1+s;

36. }

37.

38. code=code+s0; //调用toBinaryString 方法，将十进制转换成 01二进制

39. n(code+"-总长度为："+());

40.

41. }

42. b=te();

43. n=b;

44. n("-n的值是：-->"+n);

45.

46. ();

47. ();

48.

49. code=ing(0, (()-n));

50. n("-新的code ->"+code);

51.

5.根据Map2将得到的01串拆分，也就是将01串中头部分与Map中的Key值匹配，依次将整个01串还原成字节，同时将得到的所有字节写进文件C中

Java代码

1. rWrite(code,fHou);

4. public void rWrite(String code,String fHou){

5. n("--->看不懂错误啊！！");

6. String path="D:1000A"+fHou;

7. FileOutputStream fos;

8. try {

9. fos = new FileOutputStream(path);// 申明一个文件输出流

10. // 转成缓冲流

11. DataOutputStream dos = new DataOutputStream(fos);

12.

13.

14.

15.

16. int m=1; //标志获取01 串的最后位置

17. String code2=""; //存储每次获得的原文件01 串的一个子集

18.

19. while(()>=m){

20. code2=ing(0,m);//获取当前01 字符串的前m 位

21. n("???进来没？"+"-->"+code2);

22.

23. for(int j=0;j<;j++){

24.

25. if((codess[j])){

26. byte b2=(codess[j]); //由编码，获取他的字节

27. n("--->"+(char)b2);

28. yte(b2);

29.

30. code=ing(m);

31.

32. m=0;

33. n("code的长度为："+());

34. break;

35. }

36. }

37. m++;

38. }

39. ();

40. ();

41. } catch (IOException e) {

42.

43. tackTrace();

44. }

45.

46.}

本文标签：结点文件字节长度编码

版权声明：本文标题：哈夫曼压缩算法内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1702812909h431834.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

哈夫曼压缩算法

更多相关文章

c盘local文件太大_为什么你的c盘空间越来越小？

如何在手机上打开xmind文件_xmind在手机上怎么操作

win10计算机无法复制文件,win10 电脑复制后粘贴没反应问题的解决方法

Windows系统中常见的文件后缀名有哪些

解决Windows 7 下不能双击打开jar文件

windows下域名解析及修改hosts文件不起作用的问题解决

SCP命令详解(Linux和windows之间传送文件)

利用tftp在Windows端和开发板互传文件

配置windows下域名解析及修改hosts文件不起作用的问题

Ubuntu安装配置 Samba与 Windows 共享文件

映射Ubuntu虚拟机的文件到windows下

报错解决——苹果电脑mac装windows10，总是提示“启动转换”安装失败：拷贝Windows安装文件时出错

解决VS中的 “ 无法启动程序，系统找不到指定文件 “ 问题

Windows系统在CMD命令行中用del命令删除文件

Windows7文件夹中的文件随意拖动排列的解决办法

windows文件自动同步

Windows和linux之间传送的文件乱码解决方案

VMware清理vmdk文件

Windows系统怎么给Linux系统传文件

Windows中的的文件后缀

发表评论

推荐文章

idea 看源码关系uml插件推荐 code iris

自习室预约小程序定制开发

保护HTTP的安全

利用tftp在Windows端和开发板互传文件

word-重复表格标题

热门文章

微pe添加网络组件_推荐的简单易用的PE系统有哪些？如何制作PE启动U盘？

mysql查看、设置、删除约束命令一应俱全

『杭电1736』美观化文字

什么叫文档服务器,什么叫服务器

电脑无法开机，如何排查并解决？

Windows7 自动“以管理员身份运行”某程序

戴尔笔记本电脑——重装系统

Mac屏幕常亮：取消自动黑屏的多种解决方案

大写锁定怎么解除(笔记本大写锁定怎么解除)

Windows搭建Nodejs【全网最详细】

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

（Windows系统）详细介绍Windows系统含有英文版