Re: [討論] C++ 讀取資料後如何抓取目標值?

作者: loveme00835 (髮箍)   2020-10-07 01:42:57
※ 引述《forthcoming5 (XDDD)》之銘言:
: 最近自學到ifstream等寫法
: 其中有個題目是將ifstream讀出來的檔案
: 做分類+統整,檔案是.txt
: txt的內容例如:
: &@[email protected]&&@@:((;(&
: sh tree f m hi tm it e iuytre
: Rule fixed
: 100 21
: 200 38
: 300 37
: 400 35
: 500 11
: 如果在rule跟fixed前面的文字、資料不想要
: 直接取下面的Rule跟fixed及後面的數值做處理
: 應該要怎麼做呢?
: 老師是有提示用vector搭配parser等作法
: 但想很久一直沒辦法
: 跪求解答,將送上300p幣,感恩
你可以想像 i(f)stream 是由一連串的字元所組成, 要在裡面找尋特定字串可
以用 <algorithm> 裡的 std::search() 來完成, 只是它要求參數必須滿足
ForwardIteartor 概念 (concept), 亦即它預期迭代器 (iterator) 在沒有做
累加時, 多次讀出來的字元必須相同; 但 istream 物件的特性卻是: 沒有做快
取的情況下, 每個字元只能讀一次, 是 InputRange 的概念. 當我們配對到字
串的同時, 我們也丟掉它了. 即使如此, 我們還是可以仿照 std::search() 的
邏輯順勢實作接受 InputIterator 的函式 drop_until().
drop_until() 的架構是這樣的: 本體裡包含一個迴圈, 每次迭代都只對參數做
一次累加還有讀值, 並且複製讀出來的物件往後做參考:
template <typename InputIterator, typename InputSentinel>
void drop_until(InputIterator first, InputSentinel last) {
while (first != last) {
auto element = *first++;
// do things here
}
}
接著我們再加入額外的參數 pattern 作為要查找的對象, 它是一種 ForwardR-
ange, 到這裡和 std::search() 還蠻像的 (為了能在配對失敗時重來, 我們再
新增一個迭代器物件):
template <
typename InputIterator, typename InputSentinel,
typename ForwardRange
>
void drop_until(InputIterator first, InputSentinel last,
const ForwardRange& pattern) {
// match from beginning
auto next_to_match = pattern.begin();
while (first != last && next_to_match != pattern.end()) {
auto element = *first++;
// match succeeding element in next iteration
if (element == *next_to_match) {
++next_to_match;
// fail to match, start over from second element
} else if (element == *pattern.begin()) {
next_to_match = std::next(pattern.begin());
// fail to match, start over from first element
} else {
next_to_match = pattern.begin();
}
}
}
以上還只是簡單的實作, 雖然沒辦法處理複雜的字串, 但用來解原 po 的問題
已經足夠. 有了 drop_until() 函式, 讀檔程式碼就可以這樣寫:
std::ifstream file("input.txt");
drop_until(
std::istreambuf_iterator<char>(file),
std::istreambuf_iterator<char>(),
"Rule fixed\n"sv
);
unsigned rule, fixed;
while (file >> rule >> fixed) {
// do things here
}
完整範例: https://wandbox.org/permlink/gAssdOddYQtopotV
不過如果你有辦法把整個檔案都讀進來變成一個大字串, 搭配 std::search()
的話會省下不少功夫 :)
作者: CoNsTaR ((const *))   2020-10-07 03:06:00
說實話原 Po 沒有把檔案的語法講清楚根本無法實作eg. Rule fixed 出現在上面的部分?多個 Rule fixed?上面的部分可以為空?...先把 syntax tree 定義好再來 parse 比較實在吧
作者: ddavid (謊言接線生)   2020-10-07 09:41:00
也沒那麼無法實作吧,他也講得很清楚上面的東西全捨棄,所以根本不用考慮上面有多少東西或可能沒有東西,一行一行讀到某行是Rule fixed即可
作者: CoNsTaR ((const *))   2020-10-07 15:32:00
要是上面可以包含 Rule fixed 你要怎麼知道哪裡屬於“上面”?
作者: ddavid (謊言接線生)   2020-10-08 12:48:00
對,你當然可以追究細節跟各種例外處理但是這跟「無法實作」完全是兩回事業界多得是根本不知道上線才會發生什麼莫名其妙狀況的實作,沒有人會跟你說我得要把所有可能性毫無遺漏才能「實作」這題目的基礎要求已經很明確了,當然可以實作只是你的實作可能會有缺陷,比如說我們都不知道原題目定義的完整文字,所以我們並不知道會不會有兩行Rule fixed,會不會有大小寫不同的rULE FIXED,會不會根本沒有一行是Rule fixed,會不會在Rule fixed的前中後有\r\n\t但你還是可以先寫一個滿足已知最單純情況的實作然後如果你想到以上那些特殊情況,可是題目沒講會不會發生或該不該處理,那就表示我們可以無視讓它發生錯就錯,或者用心點為每個情況寫個處理,終究都還是可以實作一個版本啊這邊的用詞應該是「題意不夠嚴謹」而不是「無法實作」,「無法實作」這詞我會擺在根本沒講清楚基本要幹嘛或真的做不到的情況XD
作者: lc85301 (pomelocandy)   2020-10-08 20:35:00
傳說中的客戶進門點了一盤炒飯,酒吧陷入大火
作者: CoNsTaR ((const *))   2020-10-08 22:46:00
你當然可以寫一些自己都不知道在做什麼的程式去搪塞,但對我來說那不叫實作

Links booklink

Contact Us: admin [ a t ] ucptt.com