作者ckmarkhsu (深蓝站长)
看板Web_Design
标题Re: [问题] 请教 Big5 和 UTF-8 的编码差异...
时间Thu Mar 30 21:28:45 2006
http://www.twvbb.com/vbb/showthread.php?t=572
刚刚有网友提到,如果是 UTF-8 编码下的简体恐无法转成 Big5...
不过还是有个办法
我写的这只 function 可以支援 UTF-8 正体简体转换
只要将简体转成正体後,再 incov 即可:)
※ 引述《ckmarkhsu (深蓝站长)》之铭言:
: 这网路上有非常多资料:P
: 简单来说(以下全部是经验谈)
: Big5 有几个特色
: 1. 每个中文字使用 2 bytes
: 2. 因为制定者脑残,用到了控制码
: 所以许多程式与软体都会有许、盖、功这类中文字的冲码问题
: 3. 延伸字集中,有简体字但是没有定义日文字
: UTF-8 则有以下特色
: 1. 采用变动大小,中文字使用 3 bytes,英文则维持 1 byte
: 因此若转码後,资料库整体会变成 1.5 倍大,200MB(Big5) -> 300MB(UTF-8)
: 2. 支援所有语言文字,还有一些怪怪图形:P
: 3. 简体与正体中文重复字只定义一次,例如说,简体的"山",跟正体的"山"
: 是同一个 UTF-8 编码
: 至於怎麽转码呢....
: php 只要使用 iconv 函数即可
: 安装方式 http://www.twvbb.com/vbb/showthread.php?t=299
: 使用方式 http://tw.php.net/iconv
: ※ 引述《punpun (小金 )》之铭言:
: : 请问有大大可以分享一下
: : 有关 Big5 和 UTF-8 编码文字互相转换的流程
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.249.201
1F:推 ileadu:你那两个繁简参考档,最末端是不是少了 ?> 啊? 03/30 23:39
2F:推 ckmarkhsu:金拍谢,真的是漏掉了,感谢提醒Orz... 03/31 00:29