[問題] 文字內容取資料 regex

作者: skitty (aki)   2016-12-12 08:55:00
滿常要去打網頁取資料
通常讀回來的內容長的會是下面這樣
A=xxx,B=ooo,C=yyy,…
A="aaa" B="bbb"……
中間分隔的可能是逗號分號或空白
等號右邊的值可能有放引號或沒引號
我太菜只會用Split去做分割
想請問有比較好的處理方式嗎?
A=xxx,B=ooo…算一筆資料
一次處理的量大概都幾千筆
作者: IKAFIRE (沒有)   2016-12-12 09:18:00
regex
作者: GoalBased (Artificail Intelligence)   2016-12-12 12:43:00
你用spilit有遇到什麼問題嗎 才兩種狀況很好處理吧
作者: vi000246 (Vi)   2016-12-12 12:59:00
\w="?\w+"?
作者: Litfal (Litfal)   2016-12-12 14:44:00
用regex比較好,用split要考慮雙引號裡面有分隔符號的狀況
作者: Peruheru (還在想)   2016-12-12 17:12:00
如果有單引號,前面變數有超過一個字 \w+=["']?\w+["']?不過如果引號不對稱也會符合就是了,像是 ab="89'用 (\w+)=["']?(\w+)["']? 的話,群組1和群組2就是要的剩下就是看會不會有其他符號(小數點之類)等要加入模式內有專版RegExp唷

Links booklink

Contact Us: admin [ a t ] ucptt.com