作者Tiberius (渴望平凡的幸福)
看板Programming
标题Re: [问题] Unicode到底该怎麽玩= ="
时间Thu Feb 8 03:19:29 2007
※ 引述《StubbornLin (Victor)》之铭言:
: 所以....unicode到底该怎麽玩阿?
: 转码应该要有个对照表吧? 那对照表要去哪里生? 转又是怎麽个转法?
一般来说 iconv 应该就够了 XD
Linux/Mac OS X/FreeBSD 这些 Unix-like 系统, 只要够新的话基本都有内建
win32 版:
http://sourceforge.net/projects/gettext
这个小弟有弄一个 Unicode 补完计画的版本出来:
http://0rz.tw/b42nw [cpatch.org]
另外 Win32/Unix-like 都有提供 mbtowc, mbstowcs, mbstrlen 这些 mb* wc* 系列函式
但这个注意要先 setlocale(LC_CTYPE, "") 之後才能用
Win32 API 的 MultiByteToWideChar, WideCharToMultiByte 也可以看看
: 不过我发现一件有趣的事,就是在FireFox指着中文连结会出现一串怪怪的编码
: 我起初还以为是那个被错编成乱码,直到我想起一件事
: 就是中文网址,似乎有个标准,可以将中文 (或其它语言?)
: 转换成特定形式的编码,换算成正统的domain name
: 那个的编码方式要去哪里找? 我觉得还蛮有趣的 XDDD
听起来是 Punycode XD
http://en.wikipedia.org/wiki/Punycode
基本上是只用 A-Za-z0-9 加上连字号来表示 unicode 的方式
目的是相容现有的 domain name 系统, 完全把负担转嫁到浏览器身上 XD
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.126.44.151