作者art1 (人,原来不是人)
看板Python
标题Re: [问题] 看起来像是同一个字,印到图上却不一样
时间Wed Oct 7 17:43:31 2020
: 推 TuCH: 来源网站? 10/07 08:07
: 推 ddavid: 其实我想问的是你「为什麽」要解决,你想要解决「什麽」 10/07 10:05
因为无法正常显示时会导致计算出来的长方形框跟正常显示时的范围有出入
所以让所有字元都能正确显示就是我想要解决的问题
: 推 ddavid: 如果来源就是那样,这表示他就是用那个字,你用不存在该字 10/07 10:08
: → ddavid: 的字型来显示有问题是合理的情况 10/07 10:08
: → ddavid: 如果你想要全部转换成同一个你认为能正确显示的字,那就是 10/07 10:09
: → ddavid: 要像简繁体转换一样,建立一个字词库把所有可能发生此问题 10/07 10:10
: → ddavid: 的字与要转的目标字建表,全部取代处理 10/07 10:10
: → ddavid: 基本上应该没有任何取巧的方法 10/07 10:11
目前预想中的替代解决方案是除了特殊符号使用全字库来显示,其余的都用 ubuntu 内
建的楷书字体 arphic/ukai.ttc 就能解决,虽然这替代方案也挺麻烦的,不过比起建表
来说我想还是稍微简单一些
或是要去 windows 上找替代字型,看能不能把特殊符号跟一般中文字一并正常显示
只是会有版权疑虑
老实说因为不同编码问题导致无法显示还算常见,但同样是中文字,同样是 unicode
一个字型可以,一个字型不可以,这种问题实在是第一次遇到,也许 windows 上的常用
字型能涵盖的显示范围比 ubuntu 上的字型广?
: → alvinlin: 看起来是从某来源抓取的一些字然想用图片显示结果发现有 10/07 13:41
: → alvinlin: 些字可以显示有些字不行所以想弄懂怎麽解决。建议用regx 10/07 13:41
: → alvinlin: 。在Unicode 里每个国家的编码是有特定区间的。请参考sh 10/07 13:41
: → alvinlin: orturl.at/ijnG0 10/07 13:41
: → alvinlin: shorturl.at/ijnG0 10/07 13:42
前提是要先知道哪些字是全字库无法正常显示的吧? 有除了用肉眼观察以外的方法吗?
或是要怎麽从编码上知道两个不同编码其实是对应到同一个中文字呢? python 有可能
办到吗?
--
「看在上帝的份上,我们不能当着孩子的面枪杀他的父亲!」
「那我们就连孩子一起干掉!」
「第一枪打中的是那个天真的孩子,第二枪是抱着孩子的母亲。第三枪
停顿了三秒,当难以致信的父亲擦拭着脸上爱子的脑浆从震惊中醒转
过来,慢慢的转头看向停车的地方,分辨出是谁在攻击他後,第三颗
子弹才将他的脑壳打飞。」 ─摘自〈狼群〉
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 218.173.36.83 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1602063814.A.278.html
1F:→ art1: 上一篇推文有人帮我解答了,感恩 10/07 17:45