發表於 : 週二 8月 14, 2001 8:15 pm
Pentium 4幾個重要技術指標
相信不少人,對於Pentium 4 CPU一定有所耳聞,下面是Pentium 4幾個重要技術指標的介紹,以供參考,如有更詳細的資料歡迎大家提供給我們。
Advanced Dynamic Execution
Advanced Dynamic Execution 弁鈳怚D要的是改善了,Stall 產生的問題,這一大堆等待處理器修復的錯處,如果積累太多, 就有可能對系統構成嚴重的影響。但是 Execution Engine提供了一個非常大的暫存容錯能力,所以也減輕了因 stall 而產生出的問題,另外Execution Engine 能夠暫存的指令由 P6 的 Micro Architecture 的 42 個指令,增加到126個,這就減低了在工作時脈較高時,大量資料由記憶體或 Cache 流失的問題。與此同時,也改善了 branch 的預測能力(大約是 33%). 以往 Pentium III 所儲存的Branch Buffer 是 512Byte,現在 P4已增至 4KByte,由於 Branch 的容量增加,使它可以儲存更多的資料。這一切都是 Net Burst 架構改善了因 mis-prediction 而導致到的嚴重問題。
Hyper Pipelined Technology
在 Pentium 4 的 Net Burst 架構中,Pipeline的數目由P6架構的 10 個 stage 增加一倍達到20個,同一時脈下Pipeline 的數目為 20 個 stage,工作時相對地比 P6 原本架構的 10 個 stage 快了很多! 從pipeline 的數目增加,同樣在效能上及工作時脈上得到一定的提升。
Execution Trace Cache
Execution Trace Cache 主要是改變了一向的 L1 設計,以往 L1 Cache 的 Size 是16KB (data) + 16KB (指令)。以往的指令不會儲存在 L1 Cache 內,只會作即時的解碼,相比現在的 Trace Cache,它同樣地會將一些指令作解碼,這些指令稱為微指令(micro-ops),而這些微指令能儲存在 Trace Cache 之內, 無需每一次都作出解碼的程式,因此 Trace Cache 能有效地增加在高工作時脈下對指令的解碼能力,不過 Intel 方面並沒有公佈 Trace Cache 的容量,我們只知道 Trace Cache 能儲存 12000 個微指令(micro-ops)。
Rapid Execution Engine[/b[
經過架構上的重整,Pentium 4 的 Arithmetic Logic Units (ALUs) 能在每一時脈下執行兩個ALUs,即在 1.4GHz 時間下,ALUs的運作速度達 2.8GHz,兩組ALUs 能夠在同一時脈下減少指令的處理時間,並且能有效提升運算速度。
400-MHz System Bus
以往 Front Side Bus (FSB) 會與記憶體的工作時脈同步,但這根本不能應付更高時脈的資料傳送速度的需要,所以Pentium 4 改變了原來的設計,使用全新的 Quad Pumping 技術,能夠在 100MHz FSB 時提供 400MHz 的資料傳送速度。採用這個技術,必須配合 Dual Channels 的 RAMBUS 記憶體,這樣CPU 與記憶體之間便能提供達 3.2GB/s 的傳送速度 (PC 800 RDRAM),相比133MHz FSB 的 Pentium III 只有 1.06GB/s 的 bandwidth 大了三倍之多。
Advanced Transfer Cache
其實 ATC 已經不是首次出現的技術,在設計Pentium III Coppermine 核心時,已經將以往的 Half Speed On-Chips L2 Cache 改為 On-die Full Speed L2, Pentium 4 與 Pentium III 同樣具備了 256KB 的 L2 Cache,L2 Cache 速度與 CPU 的工作時脈是同步的,即是 1.4GHz 的 P4,L2 Cache Speed 為 1.4GHz. 而它是以 32byte 的介面傳送資料,以1.4GHz 的 P4 為例,L2 Cache 每秒能傳送 32bytes x 1 (data transfer per clock) x 1.4GHz = 44.8GB/s 的資料,相比 Pentium III 最快的 1.13GHz,傳送介面只是 16byte,所以每秒最多只能傳送 18.08GB/s,足足提升了一倍以上。
Streaming SIMD Extensions 2 (SSE2)
Net Burst 架構的出現,引身出了更加多的 MMX 技術及 SSE 的發展,所指的就是SSE2。SSE2 提供了 144 個新的 128 bit SIMD 指令,其中包含了 128bit SIMD Interger Arithmetic 及 128bit SIMD Double-Precision 浮點指令,SSE2 主要是加強對影像,語音,圖像,圖片處理等軟體的支援。
相信不少人,對於Pentium 4 CPU一定有所耳聞,下面是Pentium 4幾個重要技術指標的介紹,以供參考,如有更詳細的資料歡迎大家提供給我們。
Advanced Dynamic Execution
Advanced Dynamic Execution 弁鈳怚D要的是改善了,Stall 產生的問題,這一大堆等待處理器修復的錯處,如果積累太多, 就有可能對系統構成嚴重的影響。但是 Execution Engine提供了一個非常大的暫存容錯能力,所以也減輕了因 stall 而產生出的問題,另外Execution Engine 能夠暫存的指令由 P6 的 Micro Architecture 的 42 個指令,增加到126個,這就減低了在工作時脈較高時,大量資料由記憶體或 Cache 流失的問題。與此同時,也改善了 branch 的預測能力(大約是 33%). 以往 Pentium III 所儲存的Branch Buffer 是 512Byte,現在 P4已增至 4KByte,由於 Branch 的容量增加,使它可以儲存更多的資料。這一切都是 Net Burst 架構改善了因 mis-prediction 而導致到的嚴重問題。
Hyper Pipelined Technology
在 Pentium 4 的 Net Burst 架構中,Pipeline的數目由P6架構的 10 個 stage 增加一倍達到20個,同一時脈下Pipeline 的數目為 20 個 stage,工作時相對地比 P6 原本架構的 10 個 stage 快了很多! 從pipeline 的數目增加,同樣在效能上及工作時脈上得到一定的提升。
Execution Trace Cache
Execution Trace Cache 主要是改變了一向的 L1 設計,以往 L1 Cache 的 Size 是16KB (data) + 16KB (指令)。以往的指令不會儲存在 L1 Cache 內,只會作即時的解碼,相比現在的 Trace Cache,它同樣地會將一些指令作解碼,這些指令稱為微指令(micro-ops),而這些微指令能儲存在 Trace Cache 之內, 無需每一次都作出解碼的程式,因此 Trace Cache 能有效地增加在高工作時脈下對指令的解碼能力,不過 Intel 方面並沒有公佈 Trace Cache 的容量,我們只知道 Trace Cache 能儲存 12000 個微指令(micro-ops)。
Rapid Execution Engine[/b[
經過架構上的重整,Pentium 4 的 Arithmetic Logic Units (ALUs) 能在每一時脈下執行兩個ALUs,即在 1.4GHz 時間下,ALUs的運作速度達 2.8GHz,兩組ALUs 能夠在同一時脈下減少指令的處理時間,並且能有效提升運算速度。
400-MHz System Bus
以往 Front Side Bus (FSB) 會與記憶體的工作時脈同步,但這根本不能應付更高時脈的資料傳送速度的需要,所以Pentium 4 改變了原來的設計,使用全新的 Quad Pumping 技術,能夠在 100MHz FSB 時提供 400MHz 的資料傳送速度。採用這個技術,必須配合 Dual Channels 的 RAMBUS 記憶體,這樣CPU 與記憶體之間便能提供達 3.2GB/s 的傳送速度 (PC 800 RDRAM),相比133MHz FSB 的 Pentium III 只有 1.06GB/s 的 bandwidth 大了三倍之多。
Advanced Transfer Cache
其實 ATC 已經不是首次出現的技術,在設計Pentium III Coppermine 核心時,已經將以往的 Half Speed On-Chips L2 Cache 改為 On-die Full Speed L2, Pentium 4 與 Pentium III 同樣具備了 256KB 的 L2 Cache,L2 Cache 速度與 CPU 的工作時脈是同步的,即是 1.4GHz 的 P4,L2 Cache Speed 為 1.4GHz. 而它是以 32byte 的介面傳送資料,以1.4GHz 的 P4 為例,L2 Cache 每秒能傳送 32bytes x 1 (data transfer per clock) x 1.4GHz = 44.8GB/s 的資料,相比 Pentium III 最快的 1.13GHz,傳送介面只是 16byte,所以每秒最多只能傳送 18.08GB/s,足足提升了一倍以上。
Streaming SIMD Extensions 2 (SSE2)
Net Burst 架構的出現,引身出了更加多的 MMX 技術及 SSE 的發展,所指的就是SSE2。SSE2 提供了 144 個新的 128 bit SIMD 指令,其中包含了 128bit SIMD Interger Arithmetic 及 128bit SIMD Double-Precision 浮點指令,SSE2 主要是加強對影像,語音,圖像,圖片處理等軟體的支援。