Re: [問題] 抓找出特定字串後的ip

作者: darkk6 (Mr. Pan)   2019-08-31 10:13:09
※ 引述《NeedSomeone (not NeedAnyone)》之銘言:
: 原始的檔案大概如下
: Source IP01: 1.1.1.1
: Source IP02: 2.2.2.2 Source IP03: 3.3.3.3
: 這個檔案有點不太整齊 但是都是Source IPxx: 不定數空格 ip
: 今天想抓出某個ip(如ip01後的ip 1.1.1.1)
假設:
1. IP## 的 ## 不會重複
2. 原始檔案有可能會換行
3. Source IP## 後面一定會有空白,只是不確定數量
IPv4 的 Regular expression :
(?:(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9])\.){3}(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9])
1. 我這邊直接拿你的 expression 來用沒特別確認 (因為這篇重點不在 IPv4 本身)
2. 我把所有用來 group 的括號加上 ?: 做 non capture grouping
如果之後還有其他用途的話比較方便計算 group
定義:
IP## 表示你要找的目標,請自行替換,例如 : IP03
[:IPv4:] 底下代表上面的那個 IPv4 expression,因為太長了,
所以我底下用[:IPv4:] 表示。記得替換成上面的那段。
Expression :
(?<=Source IP##:)\s+([:IPv4:])
解釋:
利用 positive lookbehind , 限定要找特定 pattern 後的目標
但由於 lookbehind 內不能使用不定長度,所以 \s+ 放在外面,
另外透過 capture 抓出 IP
利用 find 或 match 之類的方法取出 group 1 即可拿到 IP
NOTE :group 0 是整個 match 的部分,會包含空格
如果 IP##: 後面不一定有空白,就把 + 改成 *
假設要找 的是 IP03 的,完整 expression
(?<=Source
IP03:)\s+((?:(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9])\.){3}
(?:25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9][0-9]|[0-9]))
我把範例放在 regex101 上 : https://regex101.com/r/sG1qP1/498
注意:
不是所有工具、語言都支援 lookbehind , 例如 JavaScript 要 ES2018 才開始支援
作者: cutekid (可愛小孩子)   2019-08-31 14:20:00
推(Y),詳細!
作者: goldie (阿良)   2019-08-31 21:20:00
講解的好仔細,用心 推
作者: NeedSomeone (not NeedAnyone)   2019-09-01 02:52:00
真的很感謝 不過google apps script不支援lookbehind但是您的啟發 讓我可以用lookahead反向過來處理再一次感謝 謝謝
作者: adrianshum (Alien)   2019-09-03 16:07:00
不用look behind 吧,直接在patten 寫前面那堆,然後IP 部份用capture group 取就好
作者: benqm300 (人生苦短)   2019-09-12 09:57:00
(?<=Source IP..:)\s+\d\.\d\.\d\.\d ,這樣是不是比較短
作者: cutekid (可愛小孩子)   2019-09-14 03:41:00
To 樓上: 你這樣只會匹配一個數字喔,例: 1.2.3.4
作者: benqm300 (人生苦短)   2019-09-16 10:39:00
那只是範例阿,改一下就好(?<=Source IP01:)\s+\d{1,}\.\d{1,}\.\d{1,}\.\d{1,}
作者: monkeytiger (JOSE)   2019-09-22 18:01:00
(Source IP\d\d\:)\s+(那串IP的regex)
作者: cutekid (可愛小孩子)   2019-09-29 03:51:00
To 樓樓上: IP 的數字是 0~255而已喔!

Links booklink

Contact Us: admin [ a t ] ucptt.com