Hieronder een tabel waarin de specificaties van de nieuwe Prescott en een aantal andere leden van de Pentium 4-familie zijn terug te vinden, naast die van de bekende AMD-modellen:
![]() | ||||||||||||||
![]() | Features | Athlon 64 FX | Athlon 64 | Pentium 4 C | Pentium 4 E | Pentium 4 EE | XP 3200+ | ![]() | ||||||
![]() | ||||||||||||||
![]() | Kloksnelheid | ![]() | 2,2-2,4GHz | ![]() | 2-2,2GHz | ![]() | 2,4-3,4GHz | ![]() | 2,8-3,4GHz | ![]() | 3,2-3,4GHz | ![]() | 2,2GHz | ![]() |
![]() | ||||||||||||||
![]() | Procédé (µ) | ![]() | 0,13 SOI | ![]() | 0,13 SOI | ![]() | 0,13 Cu | ![]() | 0,09 Cu | ![]() | 0,13 Cu | ![]() | 0,13 Cu | ![]() |
![]() | ||||||||||||||
![]() | Transistors | ![]() | 105,9 M | ![]() | 105,9 M | ![]() | 55 M | ![]() | 125 M | ![]() | 168 M | ![]() | 37,5 M | ![]() |
![]() | ||||||||||||||
![]() | Spanning | ![]() | 1,55 V | ![]() | 1,55 V | ![]() | 1,5 - 1,55 V | ![]() | 1,3 - 1,5 V | ![]() | 1,55 V | ![]() | 1,65 V | ![]() |
![]() | ||||||||||||||
![]() | Grootte core | ![]() | 193mm² | ![]() | 193mm² | ![]() | 131mm² | ![]() | 112mm² | ![]() | >200mm² | ![]() | 101mm² | ![]() |
![]() | ||||||||||||||
![]() | Pipeline (integer / FP) | ![]() | 12 / 17 stappen | ![]() | 12 / 17 stappen | ![]() | 21 stappen | ![]() | 31 stappen | ![]() | 21 stappen | ![]() | 10 / 15 stappen | ![]() |
![]() | ||||||||||||||
![]() | Adresruimte | ![]() | Athlon 64 FX | ![]() | Athlon 64 | ![]() | Pentium 4 C | ![]() | Pentium 4 E | ![]() | Pentium 4 EE | ![]() | XP 3200+ | ![]() |
![]() | ||||||||||||||
![]() | Fysiek | ![]() | 1TB flat (40 bit) | ![]() | 1TB flat (40 bit) | ![]() | 64GB PSE (36 bit) | ![]() | 64GB PSE (36 bit) | ![]() | 64GB PSE (36 bit) | ![]() | 4GB | ![]() |
![]() | ||||||||||||||
![]() | Virtueel | ![]() | 256TB (48 bit) | ![]() | 256TB (48 bit) | ![]() | 4GB | ![]() | 4GB | ![]() | 4GB | ![]() | 4GB | ![]() |
![]() | ||||||||||||||
![]() | SIMD | ![]() | 3DNow! / SSE / SSE2 | ![]() | 3DNow! / SSE / SSE2 | ![]() | SSE / SSE2 | ![]() | SSE / SSE2 / SSE3 | ![]() | SSE / SSE2 | ![]() | 3DNow! / SSE | ![]() |
![]() | ||||||||||||||
![]() | Cache | ![]() | Athlon 64 FX | ![]() | Athlon 64 | ![]() | Pentium 4 C | ![]() | Pentium 4 E | ![]() | Pentium 4 EE | ![]() | XP 3200+ | ![]() |
![]() | ||||||||||||||
![]() | L1-cache (data / instr.) | ![]() | 64KB / 64KB | ![]() | 64KB / 64KB | ![]() | 8KB / 8-16KB ** | ![]() | 16KB / 8-16 KB ** | ![]() | 8KB / 8-16KB ** | ![]() | 64KB / 64KB | ![]() |
![]() | ||||||||||||||
![]() | L1-latency | ![]() | 3 | ![]() | 3 | ![]() | 2 | ![]() | 2 | ![]() | 2 | ![]() | 3 | ![]() |
![]() | ||||||||||||||
![]() | L2-cache | ![]() | 1024KB | ![]() | 1024KB | ![]() | 512KB | ![]() | 1024KB | ![]() | 512KB | ![]() | 512KB | ![]() |
![]() | ||||||||||||||
![]() | L2-breedte | ![]() | 128 bit | ![]() | 128 bit | ![]() | 256 bit | ![]() | 256 bit | ![]() | 256 bit | ![]() | 64 bit | ![]() |
![]() | ||||||||||||||
![]() | L2-latency | ![]() | 16 | ![]() | 16 | ![]() | 9 ~ 20 | ![]() | 9 ~ 20 *** | ![]() | 9 ~ 20 | ![]() | 11 ~ 20 * | ![]() |
![]() | ||||||||||||||
![]() | L3-cache | ![]() | - | ![]() | - | ![]() | - | ![]() | - | ![]() | 2MB | ![]() | - | ![]() |
![]() | ||||||||||||||
![]() | Geheugen | ![]() | Athlon 64 FX | ![]() | Athlon 64 | ![]() | Pentium 4 C | ![]() | Pentium 4 E | ![]() | Pentium 4 EE | ![]() | XP 3200+ | ![]() |
![]() | ||||||||||||||
![]() | Configuratie | ![]() | 2x DDR400 | ![]() | DDR400 | ![]() | 2x DDR400 | ![]() | 2x DDR400 | ![]() | 2x DDR400 | ![]() | DDR400 | ![]() |
![]() | ||||||||||||||
![]() | Bandbreedte | ![]() | 6,4GB/s | ![]() | 3,2GB/s | ![]() | 6,4GB/s | ![]() | 6,4GB/s | ![]() | 6,4GB/s | ![]() | 3,2GB/s | ![]() |
![]() |
*** Niet gemeten.
De grote verrassing hier is dat Intel het deel van de pipeline achter de trace cache met nog eens tien stappen heeft verlengd. Als het aantal stappen voor de trace cache gelijk is gebleven, dan kent Prescott in totaal ongeveer 39 stappen. Hoewel de eerste 8 stappen slechts decodeerwerk doen en dus - in de meeste gevallen - geen effect hebben op de branch mispredection penalty, geeft dit een goed idee van in hoeverre de architectuur is ontworpen voor hogere kloksnelheid. De Athlon 64 kent maar 12 stappen, inclusief decoding. We hebben nu een betere schatting van hoe groot de trace cache is ten opzichte van een normale L1 I-cache. Intel schat dat het tussen de 8 en 16KB ligt. Nu de L1 D-cache is verdubbeld naar 16KB heeft de Pentium 4 een even grootte L1-cache aan boord als de oudere Pentium III. De cache is tevens een cycle sneller. Ook opmerkelijk is de grootte van de Prescott-core: slechts 112mm² met 125 miljoen transistors. Als AMD in de herfst overstapt op 0,09 micron zal de Athlon 64 ongeveer 120mm² worden.
125 miljoen transistors?
Het aantal transistors van Prescott was voor veel mensen verbazend groot. Laten we eens berekenen hoeveel transistors 512KB extra L2-cache kost:
Wanneer we dat optellen bij het aantal transistors van Northwood (55 miljoen) komen we uit op ongeveer 80 miljoen transistors. Tellen we er nog een miljoen bij voor het grotere L1-cache en een paar grotere buffers, dan komen we nog lang niet aan het enorme aantal van 125 miljoen. Markus Weingartner van Intel licht toe:
Zelfs met deze uitleg van Intel in het achterhoofd is het echter duidelijk dat Prescott een aantal features bevat die op dit moment nog simpelweg uitgeschakeld zijn. De meest waarschijnlijke kandidaten zijn een 64-bits uitbreiding op x86 en ondersteuning voor Dynamic Multi Threading met speculative pre-execution. De Prescott-core zoals die er nu ligt is in feite echter nog gewoon een Northwood, met verbeteringen voor vier specificieke doeleinden:
- Hogere kloksnelheden mogelijk maken
- Negatieve invloed van de lange pipeline verminderen
- Performance van HyperThreading verbeteren
- IPC (Instructions Per Clockcycle) verhogen
De eerste doelstelling is bereikt door het verbeterde klokdistributienetwerk, die vier keer zo goed is in vergelijking tot Northwood, en het laten ontwerpen van functionele blokken door computers, speciaal gericht op beter opschalen.