作者plom (plom)
看板RegExp
标题[问题] 关於找出符号问题
时间Tue Feb 12 11:51:42 2008
请教各位了,
这是 ascii 的符号范围:
asccii=re.compile(r'([\x09\x0A\x0D\x20-\x7E])')
请问有人知道全形 utf8 标点符号的范围吗? 谢谢!
需求就是在一段文字内找出所有全形和半形的符号, 但不包括英文字母.
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.120.40.123
1F:推 LPH66:标点喔...U+20xx有一些 U+FExx有一些 U+FFxx也有一些 02/12 23:03
2F:→ LPH66:看你想要哪些...(U+20xx如‘“… U+FExx如︵︶︷︸ 02/12 23:03
3F:→ LPH66:U+FFxx则是ASCII字元的全形版) 02/12 23:05
4F:→ LPH66:忘了引号了 它们在U+30xx 02/12 23:05
5F:→ LPH66:当然以上并不是全部都是 也不是只有这些地方有 02/12 23:06