[問題] ZJ-c223: Add All(變異版)(已解決)

作者: fatcat8127 (胖胖貓)   2019-06-05 23:28:09
先感謝這兩天 oToToT 和 cutecpu 的指導和討論。
概括這題的核心要求:O(1)的操作和CountSort/Radix-Sort
是Uva-10954的加強版,原版的作法可以用 PriorityQueue 完成。
兩題的差異在於 N=5e3 和 N=1e6 的量級,導致 PriorityQueue 的 log(N)作法會TLE。
而觀察過程可以發現一個有趣的規律:
每次合併數列中最小的兩個數字,合併後的這個數值是遞增的(廢話)。
但原版的作法是放回 PriorityQueue,但這樣就會浪費遞增這個性質,於是改良版就是
把合併後的數字用一個 Queue 存起來,每次放回數列的成本就降為O(1)。
取最小值時則只要考慮原本數列和現在這個 Queue 最前面的數字即可,所以也是O(1)。
詳細的作法請參考inversion文章:https://pse.is/EF4H5
但即便達成上述的要求後還是可能會在最後一筆測資吃TLE,這裡就要談到加速讀取。
一般加速讀取會談到 cin/cout 和 scanf()/printf() 的說明
可以參考這篇:https://pse.is/HMHLT。
我自己用getchar()做加速讀取還是不夠的。
但這篇的測資輸入最大會 > 50M,以上的作法仍是不夠的,因為IO次數還是太多。
於是我們便需要更底層的輸入函數:fread() 或者是 fgets()
fread()版本(oToToT撰寫):https://pastebin.com/gdbX9QxX
===
以下是fread()讀取相關的說明文章,文章解釋得很仔細就不多說僅附上網址
https://zhuanlan.zhihu.com/p/55304700
===
fgets()版本(cutecpu撰寫):https://ideone.com/usX8gE
越底層的函數需要越清楚停止條件和讀入緩衝區的大小,這邊我舉fgets()為例,
題目的第二行最多會有1e6個數字,每個數字不超過1e6(以字串來看長度不超過7),
且數字間用空白隔開,所以緩衝區的大小是1<<23( 7e6 ),停止條件是'\n'。
附上兩個函數的使用方式和差異:https://pse.is/HKWJY
以及上述讀取函數的時間比較:https://pse.is/J2A5N
最後排序的部分:假若採用CountSort約 0.4s 而呼叫內建的Qsort是 0.7s。
結論來說 TLE 的主因還是讀取方式,排序方式不是決定的關鍵。
如果大家有其他想法歡迎在下面留言,我晚點也會一並整理到內文中。
作者: oToToT (屁孩)   2019-06-05 23:51:00
ZJ的時間測量好像不是非常的stable
作者: fatcat8127 (胖胖貓)   2019-06-06 17:34:00
感謝oToToT和cutecpu的回覆,晚點整理兩位大大的內容
作者: pttworld (批踢踢世界)   2019-06-06 18:26:00
這題用getchar()勉強寫進1s內。
作者: firejox (Tangent)   2019-06-09 13:19:00
getchar_unlocked
作者: fatcat8127 (胖胖貓)   2019-06-17 03:41:00
關於加速讀取和輸出的練習可以嘗試ZJ-e273

Links booklink

Contact Us: admin [ a t ] ucptt.com