作者PsMonkey (痞子军团团长)
站内Programming
标题Re: [问题] Unicode到底该怎麽玩= ="
时间Thu Feb 8 01:00:43 2007
※ 引述《StubbornLin (Victor)》之铭言:
: 顺代一提 我的爬虫在测试时不小心吃到有笨蛋在留言版网址列打中文生出来的连结 XD
: 结果又遇到我自己写的转小写函式... 不小心把中文的一个字元转成小写 = =||
: (抱怨一下... 大小写转换那麽常用 C++标准就是不提供 (/‵Д′)/~ ╧╧
: 还好Boost里面好像有 有没有人用过?不知道会不会像我那个一样吃到中文)
: MySQL因为没设定网址的字集,结果也消化不良 吐出来 告诉我字集有问题
: 不过我发现一件有趣的事,就是在FireFox指着中文连结会出现一串怪怪的编码
那不是怪怪的编码,而是 HTML 的 spec 就有了
http://java.sun.com/j2se/1.5.0/docs/api/java/net/URLEncoder.html
上半段纯英文字的部份,应该就有你要的基本资讯了
还有,IE 的确可以吃得下 URL 直接夹带中文
(Web Server 会怎麽处理就难讲)
所以,你可能骂到一卡车乖乖用 IE 不知道 HTML spec 的人了
(如果没误会你的意思的话)
还好 Java 不太需要烦恼这些东西 [飘走]
====
果然就只是这样阿...
--
侃侃长论鲜窒碍 网站:
http://www.psmonkey.idv.tw
众目睽睽无心颤 个人版:telnet://legend.twbbs.org
茕居少聊常人事
杀头容易告白难 欢迎参观 Java 版(@ptt.cc) \囧/
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.228.201.9