作者ckmarkhsu (深蓝站长)
看板Web_Design
标题Re: [问题] 请教 Big5 和 UTF-8 的编码差异...
时间Wed Mar 29 12:44:40 2006
这网路上有非常多资料:P
简单来说(以下全部是经验谈)
Big5 有几个特色
1. 每个中文字使用 2 bytes
2. 因为制定者脑残,用到了控制码
所以许多程式与软体都会有许、盖、功这类中文字的冲码问题
3. 延伸字集中,有简体字但是没有定义日文字
UTF-8 则有以下特色
1. 采用变动大小,中文字使用 3 bytes,英文则维持 1 byte
因此若转码後,资料库整体会变成 1.5 倍大,200MB(Big5) -> 300MB(UTF-8)
2. 支援所有语言文字,还有一些怪怪图形:P
3. 简体与正体中文重复字只定义一次,例如说,简体的"山",跟正体的"山"
是同一个 UTF-8 编码
至於怎麽转码呢....
php 只要使用 iconv 函数即可
安装方式
http://www.twvbb.com/vbb/showthread.php?t=299
使用方式
http://tw.php.net/iconv
※ 引述《punpun (小金 )》之铭言:
: 请问有大大可以分享一下
: 有关 Big5 和 UTF-8 编码文字互相转换的流程
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.249.201
1F:→ ilovebbs:一般来说,用哪种会比较好啊?@@ 03/29 13:05
2F:→ ckmarkhsu:当然是 UTF-8 阿:P 03/29 13:27
3F:推 gckenny:utf-8 +1 03/29 14:04
4F:推 ogamenewbie:推b2 XD 03/29 19:37
5F:推 ileadu:光靠 iconv 还做不出来… 03/29 20:53
6F:推 ckmarkhsu:为什麽做不出来? 03/29 23:56
7F:推 ast9869:为什麽做不出来 +1 03/30 14:41
8F:→ ast9869:UTF8 +1 03/30 14:41
9F:推 ileadu:比方说,简体字如何从utf-8转成big5? 03/30 16:05
10F:→ ileadu:utf-8涵盖范围较广,要是能这样轻松转换就好了… 03/30 16:07
11F:推 ckmarkhsu:你这有点...那阿拉伯文也没办法转成 big5 阿Orz.... 03/30 19:34
12F:→ ckmarkhsu:且很少人会把简体的UTF8转成Big5吧:P 03/30 19:36
13F:→ ckmarkhsu:如果真的要转,挂个 3-party 的函数即可:P 我有写:P 03/30 19:36
14F:推 ileadu:有写还不拿来分享 :p 03/30 19:53
15F:推 CuteAmi:可是我写入资料库用UTF-8会变成乱码,BIG5是正常噎QQ 12/26 01:53