a) alle fabrikanten, ook intel, hebben enorme problemen gehad met nieuwe proces technologieen. Ze doen geen van allen een boekje hierover open, maar het is duidelijk dat het lastig wordt om processors te laten doorclocken op dezelfde manier als dat dit in het verleden gebeurde.
Dit geldt natuurlijk voor zowel Prescott, als voor Banias. Beide zullen andere manieren dan opschalen moeten hebben om preformance te kunnen winnen
b) HT/SMT op de P4 was een grote mislukking. De effectieve prestatiewinst is er gewoon niet bij de gemiddelde multithreaded/multiprocessing software. Slechts wat theoretische applicaties laten prestatiewinst zien en 1 of 2 database benchmarks.
We praten dan in die paar gevallen dat het wel loont om 10% ongeveer effectief prestatie winst.
Dit waar dual core heel dicht bij de 2.0 prestatiewinst zal laten zien. Dus 100%. Factor 10 effectiever dan P4.
Hyperthreading kost ook maar 5% extra ruimte, dus intel haalt met 5% extra ruimte, 10% extra winst, dit is effectiever dan dat dualcore winst boekt. Daarnaast sluiten beide technieken elkaar niet uit.
d) de P4 is een 32 bits processor met weinig registers (wel veel renaming voor de SMT/HT) en superkleine L1 cache. Dat klokt natuurlijk veel makkelijker hoog als een grotere L1 cache.
x86-64 vereist echter meer registers en 64 bits instructies zijn groter als 32 bits, Kortom een ander soort design is nodig voor de toekomst om beter te schalen.
De instructies, en de adressen in x86-64 zijn echter niet 64 bits. Daarnaast maakt het dit voor het klokken van de processor niet zo veel uit. Het lage aantal registers is gewoon een
eigenschap van x86, die bij x86-64 (ook in intels versie dus) wordt aangepast.
g) de P4 is een processor met een aantal enorme zwaktes. Intel heeft die goed weten te cloaken door veel geld in compiler en support teams te stoppen.
Wat is er mis met een goede compiler?
Natuurlijk heeft intel een eigen processorlijn die voor veel geld verkocht wordt die wel goed zijn in floating point: itaniums.
Echter vergelijk het volgende: opteron 2.4Ghz = 4.8 gflops (theoretisch). Itanium 1.3Ghz = 5.2 gflops (theoretisch). Het theoretisch maximum op de opteron is veel simpeler te halen op de opteron als op de Itanium, daar de itanium vreselijk weinig L1 cache heeft (net als P4) en een vreemdsoortige bundel processor is. Dus de itanium haalt deze floating point pieken eigenlijk alleen als hij als DSP processor ingezet wordt.
De Itanium heeft echter wel een L2 cache op halve snelheid van de Opterons L1 cache, maar met 2x zo brede bus. Daarnaast een L3 cache die bijna net zo snel is als de L2 cache van de Opteron.
De volledig geflopte Prescott is het beste bewijs hiervoor. Zelfs een 3.6Ghz Nocona wordt bij nauwkeurig testen volledig aan gort geslagen door een 2.2 opteron die je al in de winkel kunt halen, terwijl 2.4Ghz er ook al is als je goed zoekt.
Intel kan prima meekomen, in sommige applicaties winnen ze zelfs, terwijl ze in andere iets achter lopen. Niets om je zorgen over te maken
Nu zal intel het nog voor elkaar moeten krijgen om die ook even hoog te clocken als AMD met evenveel caches.
Het klokken is dus niet belangrijk. Een langzaam geklokte processor is niet persee langzamer. Intel zal van de lijn die ze doorzetten inderdaad de preformance moeten verhogen, hoe ze dit doen, mogen ze zelf weten.
Het is ronduit zwak dat de pentium-m pas eind 2005 omgeschreven is naar x86-64.
ER is voor 99.9% van de notebook toepassingen geen enkele winst te behalen aan 64bit oplossingen. wel kosten ze extra silicium, en dus extra stroom. Vandaar dat intel er voor kiest dit nog niet te doen.