Re: [新聞] 資訊龐大 簡訊實聯制疫調無用

作者: ryaninscu (小白)   2021-06-30 00:32:47
※ 引述《saufu08 (saufu)》之銘言:
: 有點想問一下,像這樣的資訊
: https://i.imgur.com/b8LOZtl.jpg
: 當初規畫時應該很趕,但沒關係,反正DB就是先開一個table存了再說,然後基本就四個
: 欄位:
: 「流水號(自動編號)、場所代碼、手機號碼、時間」。
: 而且這個table只增不刪。
: 累積幾十億筆都沒關係,反正也算是有基本的結構化不是嗎?
: 以後需要,再看用什麼高超、快速的技術去select,分析用 group by 就好了不是嗎?
: 還是table其實是有開,只是量大到撈不出來嗎?
大致上主table這樣設計,再多加一個場所的table對應場所代碼就可以了。
以資料量來說,前面可以放個一般的資料庫系統,每天晚上在把一天的資料量存到分散式
的dataware house用來作日後的疫調分析
以台灣人口加上店鋪數量來說,只要電話號碼sharding跟partition弄好,店鋪資料應該沒
這麼多,可以直接每一個伺服器都存一份,這樣分析起來應該速度就慢不到哪裡去了。
不知道亞馬遜的雲端服務有沒有開到台灣,不然也可以找他們合作特製一下政府用的私有
雲也可以,還省下了硬體維護的成本。

Links booklink

Contact Us: admin [ a t ] ucptt.com