作者x246libra (宸火)
看板RegExp
標題[問題] 如何 不要抓到重複3次的數字
時間Thu Nov 8 20:24:25 2018
想測試的字串如下
08/12/80 > 成功 08/12/80
1/5 > 成功 1/5
15/1/2001 > 成功 15/1/2001
15/1/201 > 失敗 捕獲 15/1/20
15/1//201 > 失敗 捕獲 15/1
請問如何改進
\b\d{1,2}/\d{1,2}(?:/\d{4}|/\d{2})?
測試網址
https://regex101.com/r/2llPr2/6
排除的條件
不知道怎麼寫比較好
不想要捕獲 最下面兩個
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.36.109
※ 文章網址: https://webptt.com/m.aspx?n=bbs/RegExp/M.1541679870.A.61C.html
1F:→ adrianshum: \b\d{1,2}/\d{1,2}(?:(?!/)|/\d{4}|/\d{2})\b 如何? 11/08 20:51
不太能理解 (?!/) 是怎麼運作
規則 \b\d{1,2}/\d{1,2}(?:(?!/))\b
測試 08/12/80
為什麼明明\b開頭 卻捕獲到 12/80
https://regex101.com/r/2llPr2/7
2F:推 art1: 因為 \b 符合的範圍很廣 11/08 22:09
3F:→ art1: /12 也符合左邊不是 \w,右邊是 \w 的情況 11/08 22:10
4F:推 art1: 如果你想找到的字串左邊一定是空白,就直接指定為空白吧 11/08 22:13
5F:→ art1: 數量就設定為 0~3 11/08 22:13
了解\b的用法了
但(?!/) 不是很懂
找到的說明
(?!pattern) --- pattern吻合,前面的就不比對(跟?=相反的邏輯)
(?!....)就是含有pattern時「排除比對」。
疑問來了,那到底什麼規則才會被捕獲?
逆否命題 只能說
有捕獲到就表示一定沒有符合pattern
規則 \b\d{1,2}/\d{1,2}(?!/)\b
想測試的字串如下
1/5 > 捕獲 1/5
1/5- > 捕獲 1/5
1/5a > 沒捕獲
為什麼 第3個 無法捕獲 1/5
第3個有符合 pattern嗎?
測試網站
https://regex101.com/r/2llPr2/9
※ 編輯: x246libra (36.226.36.109), 11/08/2018 22:55:23
6F:→ x246libra: 好 我犯蠢 因為結尾有\b 所以第3個例子才捕獲失敗 11/08 22:57
7F:推 art1: ?! 就是與 ?= 相反的用法,重點是這兩者都只會找到「位置」 11/08 23:14
8F:推 art1: 像是你之前說的12/80,12前面的那個位置,就是?!比對成功而 11/08 23:17
9F:→ art1: 給出來的 11/08 23:17
10F:推 art1: 在某些情況下,你會只想要得到位置,而不是把字元消耗掉 11/08 23:20
11F:→ art1: ?:就屬於會把字元消耗掉的規則 11/08 23:21
12F:→ art1: 字元消耗掉的意思就是比對成功之後,從之後的位置繼續比對 11/08 23:21
13F:推 art1: 應該說大部份規則都會把字元消耗掉,除了 ?= 跟 ?! 11/08 23:24
14F:→ art1: 可能還有其他的不消耗字元的,不過想不起來了 11/08 23:25
15F:推 LPH66: ?= ?! 叫做 lookahead, 可以想成"往前偷看" 11/08 23:59
16F:→ LPH66: ?= 是正向偷看, 偷看到後面有這東西再繼續 11/08 23:59
17F:→ LPH66: ?! 則是負向, 偷看到後面不是這東西才繼續 11/09 00:00
18F:→ LPH66: 那同樣有往回檢查的 lookbehind, 就是看剛比對完的東西 11/09 00:00
19F:→ LPH66: lookbehind 正向的是 ?<= 負向的是 ?<! 可以看到就是加個 < 11/09 00:01
20F:→ LPH66: 不過 lookbehind 的限制比較多, 沒有像 lookahead 這麼彈性 11/09 00:03
21F:→ x246libra: 謝謝各位回覆 11/10 15:08
22F:推 killer1121: (?!\d{3}$)(?!^\d{3})\b(\d+) 這就是我的極限了 02/03 02:08
23F:推 Gold740716: (\d{1,2}|\d{4})(/\1)* 06/26 23:41