[請益] 請教關於RAID問題!麻煩各位了

作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 21:21:33
大家好:
小弟對於RAID的概念很差,幾乎為0..所以有些問題!可能要麻煩各位先進解惑了!感謝
狀況敘述:
一台SERVER電腦,RAID5然後有四顆硬碟!
由於這兩天開始陸續發生SERVER資料存取上有問題
所以才開始檢查SERVER,發現其中一顆硬碟燈亮橘色
詢問同事,同事表示RAID5 (4顆硬碟) 其中一顆故障後
就有可能會造成資料無法存取的狀況出現!(電腦正常運作)
由於目前沒有硬碟的備品,同事建議我先直接將壞掉的硬碟關機後拆掉!
在盡快拿備品來補上!
想請問的部分是
1.RAID5 (4硬碟) 其中一顆掛掉,那會出現資料無法存取的狀況是合理的嗎?
2.將故障的硬碟卸除,這個部分建議這麼做嗎?有沒有風險呢??
以上!!還煩請各位先進解惑了 !!謝謝大家
作者: maniaque (maniaque)   2016-08-01 21:24:00
應該是,會很慢,因為資料要解算回來.......
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 21:31:00
RAID5壞一顆,下次 第一時間不是上ptt 而是趕快叫料主機支援熱插拔 就是到貨後 換上去 讓它重建重要資料能備份 先備起來 如果重建過程掛掉 就全沒了壞一顆會變慢 會很慢 忙一點就容易沒有回應是Server就先查過保沒 保固內 免費料件很快就到貨了
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 21:37:00
因為需要跑流程,備品沒辦法很快取得!我先將這顆故障硬碟卸下,她速度還會很慢嗎??
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 21:38:00
有些買四顆RAID5是要3+1HotSpare但是很常被四顆全上
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 21:40:00
我的應該是沒有hot-spare!因為有的話理論上一顆掛掉
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 21:41:00
廠商工程師建的RAID 不要太相信 有些菜到不行 還是驗
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 21:41:00
應該另一顆 會補上的樣子!上網查的資訊是如此
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 21:42:00
是啊 明明一顆要當備援的 看過很多廠商 幾乎都全上有些消費者 還以為四顆全上的 裡面包含hotspare (笑
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 21:43:00
所以我第一次遇到這狀況,因為是蠻重要的電腦老闆跟我說 直接把那顆壞得先拔掉就好我不知道到底會不會出狀況..很懊惱= =
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 21:46:00
所以很重要的Server 過保沒? 已經叫料了沒?
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 21:47:00
應該過保了..叫料部分需要先與客戶談完費用才有辦法叫!我需要在最短時間內先穩住它的基本運作= =
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 21:50:00
RAID5壞一顆 就這樣了 平常有備份吧?
作者: pupuliao (pupu)   2016-08-01 21:51:00
ㄎㄎ 老闆都不在意風險了 你又何必呢...我們這邊都異地備份+RAID 出問題則是立刻處理...
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 21:53:00
我剛出社會第一份工作上司不懂RAID5壞一顆後亂搞全掛
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 21:54:00
唉..不妙~~~~冏
作者: pupuliao (pupu)   2016-08-01 21:55:00
把裡面資料備份出來 才是重點...
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 21:55:00
更換時也是拔掉再插進去新的 理論上拔掉壞的不會怎樣但是沒料件更換 開一個大洞 是要吃灰塵嗎?沒備份快備份 然後求神保佑跑流程到貨更換到結束
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 21:57:00
它們的說法是因為他存取時跑到這顆故障碟後,不會BYPASS所以會卡住,將他拿掉後就可以正常了沒意外跑完流程拿到貨可能也要兩個禮拜!= =
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 21:59:00
你能做的就是確保假如發生最壞狀況能透過備份還原
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 22:01:00
了解!我會先去做這備份動作!!沒備份到時候放新硬碟也很可怕
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 22:03:00
平常就要規劃備份 壞了一顆的時候才在備 也很抖然後講個小故事 看過有人掛掉一顆 兩個月後才被發現我就很好心地(雞婆)告訴他們 趕快找廠商吧後來就趕快到廠商 幫他們換硬碟 安全過關了
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 22:09:00
這個很正常..因為我的server也放在我平常不會去的地方所以除非是有人看到跟我們說,否則根本不會有人發現..我一年大概看到我的server主機不到2次..
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 22:15:00
所以Server上應該會裝驅動附的monitor 定期連線檢查有些會具備連線管理功能 可以集中管理檢查各主機狀態如果嚴重性夠 有些狀況可跑最急件 也許比平常快買到老闆知道嚴重性後 還是要跑兩週採購流程 就跑吧
作者: fonzae (fonzae)   2016-08-01 22:28:00
1.資料無法存取是正常,先進SRV提供的遠端管理工具查看若沒有設置遠端管理設定,查看是否有Megaraid or SSA若為舊款則Serverraid or ACU若你的SRV屬於intel or cisco or 工業電腦,則另外看2.沒有必要將壞的硬碟取出,你同事給的觀念錯誤很大Raid Card這邊若是偵測到硬碟故障,是不會允許存取取出只是增加風險,且你沒有準備備料,取出的意義不明關機後進行拔插的風險也高,沒有必要做的事情其次上面所說的建立Raid,說真的大多都是用戶的問題Raid其實在IT產業這塊,是很基礎的知識,甚至可以說不用特地拿出來講,只要你有管理SRV都會知道要做甚麼RAID既然用戶都知道,4顆做RAID5 還是 3+1的方式,這些都取決用戶,4顆擁有多一顆容量,hotspare擁有二次備援的機會這些建置都一定是客戶給的資訊因此我會建議你先行到管理工具查看,實體硬碟的狀態確認資料存取正常,看看有沒有做Cluster,做failover轉移若只有單一台SRV,應該考慮是否要先告知主管,暫停服務避免硬碟存取掛點,導致Raid Crash若服務無法中斷,應立即請維修廠商來更換,資料無價個人的經驗,曾經有位管理SRV的說,他以為壞兩顆的機率很低直到他發生壞一顆,要求廠商隔日到場更換,卻在凌晨時掛了另外一顆,原本簡單的換硬碟看Rebuild,瞬間變成搶救資料雖然有backup進行,但db的資料卻步是最新,因此他寫了三天報告,外加一天的檢討會議,以上...以上情況屬於舊機型,現在資料都會存在Storage而且現在硬體太強,VM太方便,架構雙重備援已不是難事
作者: dennisxkimo (Dennis(一上B就糟糕))   2016-08-01 23:01:00
非常認同 感謝寫這麼多行 不過有些業界狀況很糟糕公司沒有資訊 然後系統要Srv就採購 然後沒開條件廠商也不知道客戶要什麼 然後剛好請到菜鳥 就亂出了有看過四顆獨立硬碟沒raid 也看過raid0當raid1的歸咎客戶沒想法 廠商給他看到Server登入桌面就好
作者: fonzae (fonzae)   2016-08-01 23:06:00
那是該家的SI素質太差,現在SRV的Raid白癡都會做SSA點幾下,多餘硬碟還會問你要不要做hotspareIBM 的M5現在整合到BIOS裡頭,按個幾下也完成補正一下,IBM改Lenovo
作者: yshan1023 (穿褲子穿到摔倒)   2016-08-01 23:18:00
感謝各位,明天會先請公司聯絡dell看能否儘快更換謝謝你們!
作者: xisland (窄宅)   2016-08-02 03:44:00
樹狀的分割區,每個分割都有好幾個備份,才是正解,RAID已經過時

Links booklink

Contact Us: admin [ a t ] ucptt.com