In een interessant artikel van Digit-Life over de AMD Hammer processor is wat interessante nieuwe informatie boven water komen drijven. Allereerst worden de (voorlopige) ratings en kloksnelheiden beschreven. De introductie zou plaatsvinden op 1,8GHz met een rating van 3100+, en later zouden 1,6GHz (2800+), 2,2GHz (3400+), 2,4GHz (3700+), 2,6GHz (4000+) en 2,8GHz (4300+) versies aan het repetoire toegevoegd worden. Volgens Digit-Life zouden alleen die de snelste twee chips even op zich laten wachten, de rest zou redelijk snel na de 3100+ (die rond maart/april wordt verwacht) aangekondigd moeten worden. Het kan echter wel tot het derde kwartaal duren voor de productie van de Athlon 64 voor desktops goed op gang komt.
Verder is een zeer goede en technisch onderbouwde analyse gemaakt van de performance van de x86-64 chip. Er wordt bijvoorbeeld voorspeld dat de versie met 1MB L2 cache 10 tot 15% beter zal presteren dan die met 256KB cache in SPEC tests. De normale core zou 104 vierkante millimeter beslaan, terwijl de 1MB versies van Claw en Sledge zo'n 180 vierkante millimeter groot moeten zijn. Uit deze gegevens interpoleert de schrijver dat een versie met 512KB cache - waar vooralsnog overigens nog geen sprake van is - rond de 145 vierkante millimeter zou zitten en 7 tot 8% beter presteert dan een chip met 256KB.
Daarna wordt uitgelegd hoe het AMD gelukt is om het decoderen van instructies sneller te maken om zo meer werk per klokcyclus gedaan te krijgen, en hoe de latency van de DRAM-controller en HyperTransport-links bijdragen aan hetzelfde doel. Ook wordt de architectuur van HyperTransport vergeleken met PCI Express, voor ze verder gaat met het volgende onderwerp: multi-processor configuraties. Binnen een quad 2GHz Opteron-systeem worden de geheugenlatencies gemeten om het SUMO model van AMD - een vorm van NUMA die beter vergelijkbaar is met traditioneel SMP dan pure NUMA - aan de tand te voelen. Bij een dual-systeem kan iedere chip z'n eigen geheugen in 69ns bereiken, en het geheugen van de andere chip in 117ns. In een quad opstelling is het eigen geheugen 100ns verwijderd, het geheugen van de buurprocessors 118ns en het geheugen van de processor aan de overkant 136ns. Ter vergelijking: In een single-processor systeem is de latency zo'n 45ns.

Daarna gaat over tot het posten van benchmarks. Een Athlon 64 1,2GHz met 256KB cache wordt vergeleken met 1MB-versie en een Pentium 4 2,2GHz. Hier vinden eigenlijk min of meer hetzelfde terug als de cijfers die hier en hier al zijn gepost, met enkele toevoegingen en analyses. De conclusie is dat als het gaat om het herveroveren van de performancekroon door AMD, de technologie niet de reden zal zijn waarom het zal mislukken. Het is nu nog een kwestie van op tijd en leverbaar zijn, want Intel zal het komende half jaar natuulijk ook verre van stilzitten.