Re: [情報] Core i7之父回歸!研發全新高性能CPU架構

作者: oopFoo (3d)   2021-01-22 13:47:20
※ 引述《KotoriCute (Lovelive!)》之銘言:
: Intel酷睿i7之父回歸!研發全新高性能CPU架構
: Glenn Hinton曾經領導研發了Nehalem架構(玩家戲稱“你喝了嗎”),2008年誕生,當時與Conroe(“扣肉”)齊名,是Intel在經歷了奔騰4的挫折之後,重回王者地位的力作。
https://web.stanford.edu/class/ee380/Abstracts/100217-slides.pdf
Nehalem,2003年就開始設計,但構想要更早,當然大部分真正工作在05/06/07年。
當初必須要做非常重要的決定,2 Cores+VSSE+SMT vs 4 Cores。
Intel 選擇2 Cores+VSSE+SMT。 那就是Nehalem
AMD 選擇 修改版的4 Cores。 那就是Bulldozer
https://i.imgur.com/HXZSBti.png
其實Bulldozer並不差。但Bulldozer有個致命的缺陷,兩個Cores分享一個 4-wide decoder
: 有趣的是,Jim Keller這位赫赫有名的CPU架構大神,被很多人視為AMD Zen架構之父,在Intel短暫停留2年後已經離開,但至今不知道他在Intel做了哪些工作。
JK應該有很多設計。但目前我們可以看到的是他給Tremont(Atom)2x3wide decoder但沒有uop快取。那是很特別的設計,當初一堆人傻眼不明白
之前realworldtech在討論為什麼M1這麼快。
https://www.realworldtech.com/forum/?threadid=198791&curpostid=198791
主要就是統一的超大L2,還有超快的DDR4。就像Zen3 統一L3就飛快起來。
後來有討論出還有M1超寬的8-wide decoder也有幫助。
由冷門Kernel的Linus Torvalds來解釋
https://www.realworldtech.com/forum/?threadid=198791&curpostid=199302
因為實際世界的IPC其實是很低的0.5~2之間。pipeline restart其實蠻常見的,所以fast fetch/decode其實非常重要。
這是Bulldozer失敗的一個重要原因,也是Pentium IV(還加上trace cache)無法達到目標的原因。
CPU設計是一大堆的取捨,看看Nehalem的簡報。
big.LITTLE可以更好分配不同的取捨。AMD沒有big.LITTLE讓我很擔心。

Links booklink

Contact Us: admin [ a t ] ucptt.com