作者iahon (嘻)
看板Programming
标题[问题] 有人huffman 编/解码的vhdl code..吗
时间Sun Jul 9 15:56:50 2006
有人huffman 编/解码的vhdl code..吗
huffman压缩的演算法大意如下:
假设一篇文章共出现五种符号:a、b、c、d、e、f
其出现次数各为:a:23次、b:5次、c:8次、d:13次、e:103次、f:25次
原本其各为8-bit的input,如:a=>00000000、f=>00000110
需将其使用huffman演算法压缩,过程如下:
每步骤将两两最小的两个数相加,以此法建huffman tree,
一:(b+c)、d、a、f、e
13
/ \
b c d a f e
(5) (8) (13) (23) (25) (103)
二:((b+c)+d)、a、f、e
26
/ \
13 d
/ \ (13)
b c a f e
(5) (8) (23) (25) (103)
三:((b+c)+d)、(a+f)、e
26
/ \
13 d 48
/ \ (13) / \
b c a f e
(5) (8) (23) (25) (103)
四:(((b+c)+d)+(a+f))、e
74
/ \
26 48
/ \ / \
13 d a f
/ \ (13)(23) (25)
b c e
(5) (8) (103)
五:((((b+c)+d)+(a+f))+e)
177
/ \
74 e
/ \ (103)
26 48
/ \ / \
13 d a f
/ \ (13)(23) (25)
b c
(5) (8)
以root为起点,向树叶节点前进,每向左前进值填0,向右填1
所以压缩後的编号为:a=>010、b=>0000、c=>0001、d=>001、e=>1、f=>011
与压缩前的8-bit明显少很多,此为huffman大致的用意。
不需要做的太好,只要能达到要求既可,大致的设计如下:
我们只设定这huffman程式能对64种符号解码,
所以之前先定死这64个符号给其特定的8-bit的address
a~z => 00000000~00011001
A~Z => 00011010~00110011
0~9 => 00110100~00111101
逗号 => 00111110
空白键 => 00111111
第一阶段:存值
读档 ---->
将与其相对应的address给存在ROM里面 ---->
将在ROM里的address值一一output出来 ---->
第二阶段:计算各符号出现次数
设64个变数counter计算每个符号出现的次数counter初始值为0 ---->
若该符号出现则其相对应的counter <= counter +1 ---->
当档案内的所有符号都读完且计算完出现的counter後将64个变数output出来 ---->
第三阶段:建huffman tree
写一个if判断式,将值大於0的counter拿出来做sort排序大小 ---->
将每次sort完最小的前两个值相加後存至一变数,此变数再回去和剩下的counter再sort
---->
建好後的tree找出其相对应的编码值 ---->
第四阶段:将编码後的值output出来
将各符号编码後的值output出来 ---->
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 220.137.92.27
1F:推 march20:非常有伸手文的嫌疑 71.137.22.103 07/09 16:01
2F:推 march20:但看内文好像又不是那麽伸手 @@ 71.137.22.103 07/09 16:01
3F:推 march20:大家说该怎麽办 @@ 71.137.22.103 07/09 16:02
4F:推 H45:伸手文应该像这样:「huffman的code,掱一个」 140.115.205.85 07/09 16:37
5F:推 xsion:大概是会理论 不会coding吧 这样比较有前途 219.91.18.36 07/09 19:12
6F:推 yoco315:他CodeJob也po了一篇 内文完全一样 140.114.78.32 07/09 22:46
7F:推 seagal:这篇文章不错啊 把演算法写的很详细了140.109.169.200 07/10 00:21
8F:推 WalkingIce:Linux板也有,乱来嘛.... ==.==||| 59.104.230.41 07/10 03:03