作者darkgerm (黑駿)
看板Python
標題[問題] 解讀編碼
時間Thu Feb 16 17:03:01 2012
現在有一個字串 '\\u6e2c\\u8a66'
>>> print '\\u6e2c\\u8a66'
\u6e2c\u8a66
雖然他看起來是 unicde 但其實是一個一個字
我要怎麼把他轉成 unicode 編碼呢?
讓他可以變回中文字 "測試"
有試過用 replace('\\u', '\u')
但跳脫字元似乎不吃這一套= =
--
光明 的背後 是 黑暗
黑暗 的背後 還是 黑暗
由此可知 黑暗 > 光明 Q.E.D.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.244.130
1F:→ suzuke:print u"\u6e2c\u8a66".encode('utf-8') 02/16 17:23
2F:→ KSJ:unicode(your_raw_like_unicode_string,'unicode-escape') 02/16 20:53
3F:推 mikapauli:a='\\u6e2c\\u8a66' 02/16 22:12
4F:→ mikapauli:print eval('u"'+a+'"') 02/16 22:13
5F:→ darkgerm:感謝!! 編碼的東西一直讓人很頭痛… 02/16 22:32
6F:推 mikapauli:這感覺和編碼無關,比較像是再現的問題 02/17 14:39
7F:→ mikapauli:上面的'u"'+a+'"'其實就是repr("測試") 02/17 14:40