[心得] Intel Gen13/14在BIOS預設下不穩定(國內外相關案例整理與建

作者: as1234884 (Nyarlathotep)   2024-02-18 19:29:29
本文同步發布於巴哈電硬版
本來這是附在置底的捷元保內無料一事中的額外話題
看到最近似乎也有人陸續發生類似狀況,決定另外開一篇來說明,不然窩的標題塞不下惹
QQ
症狀是BIOS全預設情況下執行2077等高CPU負載遊戲時會閃退、BSOD
如果執行OCCT、R23、P95、XTU AVX2 Stress Test等燒機測試則高機率無法通過
根據巴哈、Reddit上及Intel社群內容,Gen13 i9與i7、i5都有類似問題,最多人遇到
0x000005錯誤,BSOD訊息不一定
https://reurl.cc/A4XXoe
https://reurl.cc/L4eeRy
https://reurl.cc/Z9EVya
https://reurl.cc/2zNjEr
https://reurl.cc/09QdZx
https://reurl.cc/80YYQR
依照蒐集案例及自身測試,疑似為Intel給出的預設BIOS行為模式及製程問題,在全預設
下CPU電壓會被長期加到1.4v以上,如果更激進一點的甚至可以看到1.6v的峰值,本來這
應該是為晶片王也能正常運作而設的標準
但在此條件下長期運作後會導致CPU 的某個P-Core無法在相同電壓保持穩定運作,通常在
一年左右就會開始發生上述症狀
如果發生了則必須調整BIOS中的LLC及SVID Behavior來增壓或是降低PL1、2至更低的數值
保持P-Core的穩定
若各位手頭上有Gen13/14 CPU可以用以下標準測試來簡單判斷
MB全預設
P95 small 1H Pass(可選,極端嚴苛,日常與遊戲使用幾乎不可能觸發類似場景,個人更傾
向於拿來做溫度牆測試)
R23 30M Pass
OCCT small extreme 1H Pass
XTU AVX2 stress test 1H Pass
如果可能,使用2077等高CPU負載遊戲連續進行基準測試,以上測試皆不可出現閃退、
BSOD、WHEA錯誤
以上若有無法通過的項目可嘗試性的調整LLC至Medium或開啟SVID Behavior的Intel's
Fail Safe、限制PL並再次做測試,若測試通過則表示極高機率其中一顆P-Core縮缸
請發生以上症狀的版友將您的CPU RMA,強烈建議不要長期開啟LLC至高檔位或SVID
Behavior的Intel's Fail Safe,這只會將CPU電壓繼續升高,高溫高壓長期使用下可能帶
來壽命減損,且只能延緩CPU的問題,時間一長問題還是會浮現
因目前Intel沒有官方說明,暫時無法完全肯定就是此造成的,在此只能以蒐集到的案例
作判斷,僅供各位參考
以我Gen13 i9k送修前的測試環境如下
i9-13900k+NT-H1
NH-D15
Gigabyte Z790 Aorus MASTER
Gigabyte RTX-4080s Gaming OC 16G
Kingston KF560C36BBEK2-64
Delta GPS-1300DB X
WD SN750X 1TB
WD SN850X 2TB*2
Crusial MX500 1TB
Crusial MX500 4TB
BQT Shadow Base 800
BIOS全預設,無XMP,PL1、2限制253W
手頭上暫時沒有Gen13的CPU可以測試BIOS版本跟電壓的相關性了,待送修回來再另外做測

另外,我手頭上並沒有專業儀器可以檢測長期高電壓及高溫對CPU的隱藏損害,僅能以案
例作判斷
若版友有類似狀況歡迎放上來供大家做參考順便蒐集數據
附註:Intel建議使用的測試工具Intel® Processor Diagnostic Tool不太具有參考性,
因為該測試僅約6分鐘,且壓力負荷不比文內提到測試工具負荷來的重,很可能無法重現
問題
這也可以從蒐集到的案例中得知,有問題的CPU可以通過Intel® Processor Diagnostic
Tool卻無法通過文內的燒機軟體或遊戲基準測試
附註2:Gen14由於發售日期尚短,可蒐集的樣本基數與運作時間皆不足,尚無法判斷
此問題是否會發生在Gen14身上,但已有i9-14900k的使用者報告了類似問題,巴哈、
Reddit、Intel社群都有相關案例,僅供各位參考
https://reurl.cc/xLovGz
https://reurl.cc/679qRr
https://reurl.cc/RW8k7e
https://reurl.cc/E4WQNm
https://reurl.cc/M49zmL
https://reurl.cc/N4nxd9
附註3:(反串要註明)
我之前是在Intel設計CPU的,而我設計的原則是:
「幹你娘電壓加爆」
沒錯,就是幹你娘加爆,老子才不管甚麼良率返修率三小的,每次設計的電壓就是姬芭一
大包。1.3v加成1.4v,1.4v加成1.5v。大小核拉到1.6v,跟把整個電廠的電全送給你沒兩
樣。
我還記得,我那個月上班25天,經理跑來跟我說,這個月返修二十六萬顆,你有頭緒嗎?
我他媽的怎麼會知道。
額外話題:捷元保內無料一事與Gen13/14高故障率似乎有正相關,因蒐集案例可得知
Gen13 i9k集中在2023/11以後RMA數量上升,也有reddit網友提到RMA時間變長一事,同時巴
哈也有人提到RMA需要一至三個月,support原本想要調中國盒裝CPU寄回的紀錄
https://i.imgur.com/EJdyJhb.jpg
但這不代表代理商可以不用負責保固相關事宜就是了,終端消費者該有的權益還是必須兼

額外話題2:高度懷疑Intel知情CPU問題,因為他們有在某個版本的BIOS中增加了IA CEP功
能並預設在高階以上的CPU開啟,這會繼續堆高電壓來讓CPU穩定運作
如果有疑慮的人可以選擇關閉
同時翼王有提到B版就算拿供電好的CPU電壓也會比Z版高,轉貼影片截圖
https://i.imgur.com/5YpN6j3.jpg
https://i.imgur.com/C33y5sl.jpg
額外話題3:Gen14的CPU看起來還是有扣具壓力不均導致PCB彎曲進而影響溫度的情況,
我基於好奇購買了接觸框並安裝後發現i7-14700k在NH-D15下待機溫度從45-50間降低
到32-40,P95溫度從96降低到86度,以上BIOS全預設,只限制PL1、2至253W
接觸框這小東西僅僅只要300TWD左右,可以帶來5-10度的溫度降低,個人認為這投資挺划算

注意,根據Reddit上說法,如果原廠扣具使用時間久了後才改用接觸框可能沒有效果,因為
PCB彎曲已經固定,我手頭上的Gen14 i7備品是剛拆來使用的,無法驗證此說法正確性,僅
供參考

Links booklink

Contact Us: admin [ a t ] ucptt.com