作者ckmarkhsu (深藍站長)
看板Web_Design
標題Re: [問題] 請教 Big5 和 UTF-8 的編碼差異...
時間Wed Mar 29 12:44:40 2006
這網路上有非常多資料:P
簡單來說(以下全部是經驗談)
Big5 有幾個特色
1. 每個中文字使用 2 bytes
2. 因為制定者腦殘,用到了控制碼
所以許多程式與軟體都會有許、蓋、功這類中文字的沖碼問題
3. 延伸字集中,有簡體字但是沒有定義日文字
UTF-8 則有以下特色
1. 採用變動大小,中文字使用 3 bytes,英文則維持 1 byte
因此若轉碼後,資料庫整體會變成 1.5 倍大,200MB(Big5) -> 300MB(UTF-8)
2. 支援所有語言文字,還有一些怪怪圖形:P
3. 簡體與正體中文重複字只定義一次,例如說,簡體的"山",跟正體的"山"
是同一個 UTF-8 編碼
至於怎麼轉碼呢....
php 只要使用 iconv 函數即可
安裝方式
http://www.twvbb.com/vbb/showthread.php?t=299
使用方式
http://tw.php.net/iconv
※ 引述《punpun (小金 )》之銘言:
: 請問有大大可以分享一下
: 有關 Big5 和 UTF-8 編碼文字互相轉換的流程
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.249.201
1F:→ ilovebbs:一般來說,用哪種會比較好啊?@@ 03/29 13:05
2F:→ ckmarkhsu:當然是 UTF-8 阿:P 03/29 13:27
3F:推 gckenny:utf-8 +1 03/29 14:04
4F:推 ogamenewbie:推b2 XD 03/29 19:37
5F:推 ileadu:光靠 iconv 還做不出來… 03/29 20:53
6F:推 ckmarkhsu:為什麼做不出來? 03/29 23:56
7F:推 ast9869:為什麼做不出來 +1 03/30 14:41
8F:→ ast9869:UTF8 +1 03/30 14:41
9F:推 ileadu:比方說,簡體字如何從utf-8轉成big5? 03/30 16:05
10F:→ ileadu:utf-8涵蓋範圍較廣,要是能這樣輕鬆轉換就好了… 03/30 16:07
11F:推 ckmarkhsu:你這有點...那阿拉伯文也沒辦法轉成 big5 阿Orz.... 03/30 19:34
12F:→ ckmarkhsu:且很少人會把簡體的UTF8轉成Big5吧:P 03/30 19:36
13F:→ ckmarkhsu:如果真的要轉,掛個 3-party 的函數即可:P 我有寫:P 03/30 19:36
14F:推 ileadu:有寫還不拿來分享 :p 03/30 19:53
15F:推 CuteAmi:可是我寫入資料庫用UTF-8會變成亂碼,BIG5是正常噎QQ 12/26 01:53