[菜單] 200k 實驗室深度學習主機

作者: EEQQ102938 (EEer)   2023-03-30 17:33:34
趕畢業跑深度學習實驗,但目前工作站太爛,所以跟老師拿一筆錢升級工作站。
原本想鎖定兩張3090或兩張4090進行升級的,但廠商說他們沒有3090了,所以開了一張有兩
個4090的單,但有點超過預算,想請各位幫忙健檢一下,看看哪裡可以換@@,還沒口試就花
教授一堆錢,很抖QQ
已買/未買/已付訂金(元):未買
預算/用途:200K 實驗室深度學習機
CPU (中央處理器):Intel i9-13900
MB (主機板):華碩Z790-A GAMING WIFI主機板
RAM (記憶體):芝奇幻鋒 D5-5600 32G * 2
VGA (顯示卡):技嘉GeForce RTX4090 GAMING OC * 2
Cooler (散熱器):Noctua NF-A14 PWM 14cm風扇 * 4
SSD (固態硬碟):Samsung 980 PRO 2TB NVMe M.2
PSU (電源供應器):全漢HYDRO PTM PRO 1200W ATX3.0 * 2
CHASSIS (機殼):Phanteks ENTHOO ELITE電腦機殼
水冷:NZXT Kraken X73 水冷散熱器
其它 (自填):
總價 (未稅/含稅):235000 (含稅)
另外想請問,聽說40系列沒有nvlink了,那這樣我是不是不能把兩張卡合在訓練模型?我主
要用tensorflow的package,tf的strategy可以把兩張4090的ram合在一起看嗎?如果不行的
話是不是買一張4090就好了...
作者: dos01 (朵斯01)   2023-03-30 17:35:00
不用砍啦 反正教授的錢也是花學校的錢 學校的錢也是花研究計畫預算 研究計畫的預算又來自繳稅的錢 然後你又遲早會繳稅 想想這其實也是花你自己的錢 直接買了啦!
作者: encorek22554 (二寶)   2023-03-30 17:37:00
多卡訓練一直都跟nvlink無關吧
作者: EEQQ102938 (EEer)   2023-03-30 17:39:00
如果batch大一點或模型大一點的話,一張卡24G可能不夠用…
作者: Zenryaku (前略)   2023-03-30 17:40:00
實驗室不直接找廠商弄嗎…
作者: sugoyeee (sugoyeee)   2023-03-30 17:40:00
板不需要a有更好的選擇 要拿d5就拿超過6000的
作者: EEQQ102938 (EEer)   2023-03-30 17:41:00
原文有說這是廠商報的單喔!
作者: Zenryaku (前略)   2023-03-30 17:42:00
哦沒看到 抱歉先把三星的ssd換掉 爛廠商問題一堆
作者: rewisyoung (小月兒)   2023-03-30 17:42:00
20萬預算 有沒有考慮用GA100啊
作者: Zenryaku (前略)   2023-03-30 17:43:00
電源不用兩台1200吧 哪吃那麼多電需要2400w風扇可以不用買貓頭鷹的,而且這顆不是A12*25沒特別強然後記憶體也不用買芝奇的,芝奇也是特別貴的那種,時脈至少買到6000
作者: blacknate (Nate)   2023-03-30 18:10:00
放個高速的HDD吧,SSD掛掉模型找不回來會嘔死深度學習吃SSD的程度很可怕的,尤其是YOLO 那一類圖像的吃很重記得查一下你用的框架版本,萬一硬體太新不支援就哭了
作者: cmcer (lazyman)   2023-03-30 18:15:00
怕掉資料就組raid吧
作者: blacknate (Nate)   2023-03-30 18:17:00
樓上說得對,組raid,不然你光是保內把ssd操壞就有得受了
作者: johnjohnlin (嗯?)   2023-03-30 18:20:00
學校破10萬不是要公開招標嗎然後雙卡請買HEDT以上
作者: mrme945   2023-03-30 18:23:00
這張主板不妥吧,只有第一槽是x16,下面兩槽都只有x4頻寬而已
作者: mayolane (mayolaneisyagami)   2023-03-30 18:26:00
有破10萬要招標這回事嗎,儀器隨便幾十萬沒有聽說過招標欸
作者: mrme945   2023-03-30 18:31:00
主板直接用W680的吧,華碩那張也不貴,只是我也不知道這兩槽那麼近能不能裝兩張4090就是了,另外記憶體看能不能找到ECC的,跑起來比較穩,比速度重要多了
作者: nasa930022 (滷公伯禽)   2023-03-30 18:31:00
實驗室經費自己買的不用招標吧
作者: remia81   2023-03-30 18:42:00
建議先去TWCC測試一下你的訓練多卡到底能不能用tf多卡訓練很謎
作者: TingLinDick   2023-03-30 18:46:00
我也是配置兩張4090,但機殼因為怕散熱有問題,所以是用礦機架加pcie延長線讓兩張顯卡有空間,兩張同時跑的話會蠻熱的,所以機殼的散熱最好問一下廠商可不可行
作者: bear1414 (story)   2023-03-30 18:47:00
主板不行 風冷佔3點多槽 你第二張卡只剩PCIe 3.0 x1除非你用延長線速度建議至少要有PCIE3.0 X8 (=PCIE4.0 X4)另外你要跑的是哪個領域 CPU 13700系列就非常足夠了訓練若單卡VRAM夠 多卡可以同時跑不同超參數的提高效率另外 你這台要放實驗室還是24小時冷氣server room?
作者: yenchieh1102 (香蕉史塔克)   2023-03-30 19:16:00
實驗室來張A6000啊
作者: bear1414 (story)   2023-03-30 19:16:00
現在A6000不好 要6000 ADA才夠快
作者: EEQQ102938 (EEer)   2023-03-30 19:19:00
看下來目前應該是換主板,儲存從SSD換HDD,Ram換頻率高一點的嗎@@
作者: mesmerising (mesmerising)   2023-03-30 19:27:00
實驗室拿一堆信仰外觀稅的零件好難懂
作者: blacknate (Nate)   2023-03-30 19:30:00
ML重點是ram大才能做cache,頻率其實沒那麼重要
作者: mrme945   2023-03-30 19:36:00
不是要你SSD換HDD,是要你多準備空間存放模型的,SSD壞掉還有得救,SSD還是要有,只是換別家的吧,980Pro還有0E問題
作者: fuct (添財)   2023-03-30 19:36:00
為了你的畢業花那麼多錢喔,真好
作者: GooglePixel (谷哥批索)   2023-03-30 20:01:00
怎麼不直接買server 效能非家用級能比
作者: dos01 (朵斯01)   2023-03-30 20:03:00
SSD你還是要有 HDD只是多放備用的
作者: GooglePixel (谷哥批索)   2023-03-30 20:05:00
當我沒說 光一個data center等級GPU就爆預算==
作者: Snowman (人生大老馬.....)   2023-03-30 20:07:00
10萬以上是可以選擇公開招標 100萬以上才是強制公開招標
作者: johnjohnlin (嗯?)   2023-03-30 20:30:00
可是寫限制招標文件很麻煩
作者: TingLinDick   2023-03-30 20:44:00
如果訓練需要較大的VRAM的話,我是用pytorch DDP去處理,TF的沒用過
作者: Aquarius126 (Aquarius126)   2023-03-30 20:45:00
之前弄兩張3090塞機殼裡面熱到哭 只好弄礦架在外面跑qq
作者: fuless (富貴險中求)   2023-03-30 20:58:00
怎麼看都像台信仰機 哪間學校碩
作者: cor1os (大丈夫だ問題ない)   2023-03-30 22:25:00
信仰?零件沒有AMD哪來的信仰(笑)
作者: HotDogCC (0.38別騙)   2023-03-30 22:42:00
如果你今年確定畢業,買個pcie4的SSD用完就滾了,壞了給學弟負責(x
作者: kidd232 (KIDD)   2023-03-31 00:17:00
這台太羊了
作者: jahnson   2023-03-31 00:34:00
實驗室禁用冷筍
作者: GLTyang   2023-03-31 10:55:00
原來實驗室可以自己組電腦 我以為都會想要用工業電腦XDDD
作者: oppoR20 (R20)   2023-03-31 11:54:00
實驗室可以用自組啊 看過不少台了不過通常都是找廠商報價 讓她幫你買零件讓她幫你組 最後有問題還是可以找廠商
作者: dc0244 (dc0244)   2023-03-31 13:08:00
記憶體拿6000以上的比較有意義t-create 6000 32G*2雙通道這種的不貴
作者: bear1414 (story)   2023-04-01 12:50:00
做深度學習記憶體速度影響不太 挑便宜的就可以了

Links booklink

Contact Us: admin [ a t ] ucptt.com