Op HyperTransport.org is een interessant presentatie (Microsoft Powerpoint, 2MB) te vinden over de AMD Opteron - het high-end broertje van de ClawHammer. Het eerste deel van de informatie gaat over de architectuur van de processor, waarover je in deze review alles hebt kunnen lezen. Op een aantal punten bevat de presentatie nieuwe informatie:
- De desktop variant van de ClawHammer core heeft één 16-bit of twee 8-bit HyperTransport links.
- De dual processor workstation variant van de SledgeHammer core heeft twee 16-bit HyperTransport links en 512KB of 1MB L2 cache.
- De high-end server variant van de SlegdeHammer core heeft drie 16-bit HyperTransport links en 1MB of 2MB L2 cache.
- De multiply latency in 32-bit mode is 3 cycles in plaats van 4 cycles bij Athlon XP, de multiply latency in 64-bit mode is 4 cycles.
- De integer scheduler heeft 24 entries in plaats van 18 entries bij de Athlon XP.
- De bandbreedte tussen de L2 en L1 cache is verdubbeld ten opzichte van de Athlon.
- De branch prediction is op diverse punten verbeterd. Het aantal selectors is verdubbeld ten opzichte van de Athlon XP, het aantal biomodal counters is verviervoudigd, de L2 cache bevat nu branch identificatie en pre-decode informatie.
- De pipeline is met twee cycles verlengd en geoptimaliseerd voor kloksnelheid en inter-processor communicatie.
- De geheugenlatency is dankzij de geïntegreerde geheugencontroller de helft lager dan van de snelste Athlon XP systemen, de bandbreedte is verviervoudigd (dual channel Opteron?).
Het tweede deel van de presentatie gaat over toepassingen van de chip, en een aantal interessante dingen die mogelijk zijn met HyperTransport. De AMD 8000 chipset bestaat op dit moment uit de 8151 AGP tunnel, de 8111 I/O hub, en de 8131 PCI-X tunnel. Via HyperTransport kunnen er echter ook andere onderdelen aan de chipset geknoopt worden, zoals InfiniBand, Fibre Channel of zeer specialistische hardware zoals SSL-processors. Daarnaast kunnen bandbreedte-eters als SCSI- en multi-gigabit ethernet controllers direct aan het HyperTransport netwerk worden gehangen, in plaats van ze via PCI te verbinden aan het moederbord. Het is net Lego . In de presentatie komt een groot aantal voorbeelden voorbij van configuraties die mogelijk zijn, voor verschillende toepassingen van een simpele desktop tot een 28 GFLOPS 'recognition engine', waarin drie SledgeHammers en vier ClawHammers worden gecombineerd. Hieronder een mogelijk schema voor een high-end dual Opteron in een 1U server:
