[問題] 參數的Parser如何撰寫呢?

作者: cjoe (TeA)   2015-06-21 02:02:48
假設我今天要抓取一個指令所下的的參數,指令如下
function1('20150621','摘要','這篇研究...略','cjoe');
我本來是用很簡單的方法來擷取這串指令的參數,基本上就是用『,』當切割點,
得到的結果如下(實作上的細節有部份已經略掉):
20150621
摘要
這篇研究...略
cjoe
但是我今天遇到像 '這篇,,,研究...略',使用『,』當切割點馬上就會變不可行
我本來想用『','』當切割點,但是我想如果剛好又遇到有參數剛好是『','』
這樣一定馬上就又出錯了,'我故意要搞怪\',\''
目前我先使用 ',' 來當切割點 ,以我的CASE來說,
可能已經不太會發生錯誤了,但是畢竟這樣的方式,只是徒增程式不可靠性而已...
因此我有點好奇,程式語言是如何parse這些參數的呢?
我該怎麼正確的去parse我要的資料呢?
作者: Killercat (殺人貓™)   2015-06-21 02:12:00
參數不是資料,本來就有局限性,其實不用管太多GNU linux commands本來就不是什麼都吃
作者: cjoe (TeA)   2015-06-21 02:26:00
感謝 我現在想想 好像用 ',' 切就可以了 @_@參數中'都會變成\' ,我用','來切,\',\' 本來就不會去切到
作者: ssccg (23)   2015-06-21 02:35:00
如果參數 '和, 中間有空白呢?從頭parse過去遇到沒跳脫的 ' 就切換狀態就是了string用了 ' 包起來不就是為了分隔?
作者: Killercat (殺人貓™)   2015-06-21 09:06:00
他就是想說「我資料要是就是想要有'或者「\'」怎麼辦」誒,我倒是想到了,GNU Command裡面這種資料來源用兩種方法吃 : 1. stdin 2. 強制放最尾巴的參數這跟grep/sed似乎是有點像
作者: MonyemLi (life)   2015-06-21 11:33:00
其實就類似csv parser,一個字一個字讀
作者: bitlife (BIT一生)   2015-06-21 17:30:00
lexical analysis需要使用有限狀態機,詳見compiler書籍
作者: cjoe (TeA)   2015-06-21 20:01:00
感謝各位的回答!
作者: qrtt1 (有些事,有時候。。。)   2015-06-21 21:32:00
切出來欄位不對,就噴 error 靠北使用者,請他修改資料 ^^
作者: eieio (好多目標)   2015-06-23 04:45:00
用 Guava Splitter 吧

Links booklink

Contact Us: admin [ a t ] ucptt.com