作者x246libra (宸火)
看板RegExp
标题[问题] 如何 不要抓到重复3次的数字
时间Thu Nov 8 20:24:25 2018
想测试的字串如下
08/12/80 > 成功 08/12/80
1/5 > 成功 1/5
15/1/2001 > 成功 15/1/2001
15/1/201 > 失败 捕获 15/1/20
15/1//201 > 失败 捕获 15/1
请问如何改进
\b\d{1,2}/\d{1,2}(?:/\d{4}|/\d{2})?
测试网址
https://regex101.com/r/2llPr2/6
排除的条件
不知道怎麽写比较好
不想要捕获 最下面两个
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.226.36.109
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/RegExp/M.1541679870.A.61C.html
1F:→ adrianshum: \b\d{1,2}/\d{1,2}(?:(?!/)|/\d{4}|/\d{2})\b 如何? 11/08 20:51
不太能理解 (?!/) 是怎麽运作
规则 \b\d{1,2}/\d{1,2}(?:(?!/))\b
测试 08/12/80
为什麽明明\b开头 却捕获到 12/80
https://regex101.com/r/2llPr2/7
2F:推 art1: 因为 \b 符合的范围很广 11/08 22:09
3F:→ art1: /12 也符合左边不是 \w,右边是 \w 的情况 11/08 22:10
4F:推 art1: 如果你想找到的字串左边一定是空白,就直接指定为空白吧 11/08 22:13
5F:→ art1: 数量就设定为 0~3 11/08 22:13
了解\b的用法了
但(?!/) 不是很懂
找到的说明
(?!pattern) --- pattern吻合,前面的就不比对(跟?=相反的逻辑)
(?!....)就是含有pattern时「排除比对」。
疑问来了,那到底什麽规则才会被捕获?
逆否命题 只能说
有捕获到就表示一定没有符合pattern
规则 \b\d{1,2}/\d{1,2}(?!/)\b
想测试的字串如下
1/5 > 捕获 1/5
1/5- > 捕获 1/5
1/5a > 没捕获
为什麽 第3个 无法捕获 1/5
第3个有符合 pattern吗?
测试网站
https://regex101.com/r/2llPr2/9
※ 编辑: x246libra (36.226.36.109), 11/08/2018 22:55:23
6F:→ x246libra: 好 我犯蠢 因为结尾有\b 所以第3个例子才捕获失败 11/08 22:57
7F:推 art1: ?! 就是与 ?= 相反的用法,重点是这两者都只会找到「位置」 11/08 23:14
8F:推 art1: 像是你之前说的12/80,12前面的那个位置,就是?!比对成功而 11/08 23:17
9F:→ art1: 给出来的 11/08 23:17
10F:推 art1: 在某些情况下,你会只想要得到位置,而不是把字元消耗掉 11/08 23:20
11F:→ art1: ?:就属於会把字元消耗掉的规则 11/08 23:21
12F:→ art1: 字元消耗掉的意思就是比对成功之後,从之後的位置继续比对 11/08 23:21
13F:推 art1: 应该说大部份规则都会把字元消耗掉,除了 ?= 跟 ?! 11/08 23:24
14F:→ art1: 可能还有其他的不消耗字元的,不过想不起来了 11/08 23:25
15F:推 LPH66: ?= ?! 叫做 lookahead, 可以想成"往前偷看" 11/08 23:59
16F:→ LPH66: ?= 是正向偷看, 偷看到後面有这东西再继续 11/08 23:59
17F:→ LPH66: ?! 则是负向, 偷看到後面不是这东西才继续 11/09 00:00
18F:→ LPH66: 那同样有往回检查的 lookbehind, 就是看刚比对完的东西 11/09 00:00
19F:→ LPH66: lookbehind 正向的是 ?<= 负向的是 ?<! 可以看到就是加个 < 11/09 00:01
20F:→ LPH66: 不过 lookbehind 的限制比较多, 没有像 lookahead 这麽弹性 11/09 00:03
21F:→ x246libra: 谢谢各位回覆 11/10 15:08
22F:推 killer1121: (?!\d{3}$)(?!^\d{3})\b(\d+) 这就是我的极限了 02/03 02:08
23F:推 Gold740716: (\d{1,2}|\d{4})(/\1)* 06/26 23:41