Serial ATA command queuing
Seriële technologieën zijn momenteel een hot topic in de storage industrie. Na een aantal jaren van voorbereidingen is Serial ATA in 2003 eindelijk van de grond gekomen. Inmiddels heeft de technologie een behoorlijke acceptatiegraad onder veeleisende gebruikers bereikt. Dit jaar zullen nog eens twee nieuwe seriële technologieën voor gebruik in storagesystemen - Serial Attached SCSI (SAS) en PCI Express (PCI-E) - het stadium van productierijpheid bereiken. Nieuwe ontwikkelingen op het gebied van Serial ATA zullen deze standaard beter geschikt maken voor gebruik in servers. Vorig jaar werd Serial ATA al in de armen gesloten door barebone serverfabrikanten zoals Appro, Intel en Supermicro, dit jaar zullen naar verwachting ook de grote jongens volgen. Een vierde nieuwe ontwikkeling, die niet zozeer met seriële technologieën heeft te maken maar wel met storage, is de 2,5 inch form factor voor enterprise harde schijven. Op het Intel Developer Forum werden diverse nieuwe producten aangekondigd die gebruikmaken van de eerder genoemde technologieën. In dit artikel wordt een overzicht gegeven.
Serial ATA Native Command Queuing
2004 is het jaar waarin Serial ATA zijn definitieve opmars in de enterprise storagemarkt zal inzetten. De opmars zal ingezet worden met een reeks nieuwe producten, die gebaseerd zullen zijn op de Serial ATA II-standaard en de prestaties van SATA-harde schijven en RAID-adapters op het niveau van SCSI zullen brengen. Eén van de obstakels voor de acceptatie van Serial ATA is de lage multi-user I/O performance van de huidige generatie SATA-harde schijven. Dit verschil is enerzijds toe te schrijven aan de lagere toerentallen van Serial ATA-harde schijven - alleen de Western Digital Raptor presteert gelijk aan 10.000rpm SCSI - en komt anderzijds door het ontbreken van command queuing op vrijwel alle harde schijven en het merendeel van de controllers. Serial ATA II zal ondersteuning voor native command queuing (NCQ) toevoegen, waarmee Serial ATA eindelijk een geavanceerde vorm van command qeuing zal krijgen.
De doelstelling van command queuing is het verkleinen van de wachttijden voor de mechanische positionering van de lees- en schrijfkoppen. Dit wordt bereikt door de volgorde van de binnenkomende commando's te optimaliseren zodat de koppen van de schijf een zo klein mogelijke afstand hoeven af te leggen. Harde schijven met NCQ kunnen meerdere commando's tegelijkertijd open hebben staan en kunnen tevens nieuwe commando's ontvangen terwijl er wordt gezocht naar gegevens voor een ander commando. Een veel gebruikte analogie met het dagelijks leven is het doen van boodschappen in de supermarkt. Je staat veel eerder aan de kassa wanneer de producten op het boodschappenlijstje zijn gerangschikt naar de volgorde waarop je ze tijdens je ronde door de supermarkt tegenkomt. Command queuing zorgt voor een automatische optimalisatie van het boodschappenlijstje. NCQ kan een grote prestatieverbetering opleveren in multi-user serveromgevingen en onder multi-tasking of multi-threaded desktopgebruik, waarbij de harde schijf gelijktijdig door meerdere applicaties of door meerdere threads van dezelfde applicatie wordt benaderd. Een bijkomstigheid van NCQ is de lagere slijtage aan de harde schijf. De koppen hoeven immers minder bewegingen te maken.

De meest optimale volgorde: niet 1, 2, 3, 4 maar 2, 4, 3, 1Een minder geavanceerde vorm van command queuing, ATA tagged command queuing (TCQ) genaamd, was al aanwezig in de ATA-4-specificatie en werd reeds enige tijd ondersteund op de harde schijven van IBM/Hitachi en de Raptor WD740GD van Western Digital. Wegens het ontbreken van ondersteuning door controllers en drivers is ATA tagged command queuing nog niet van de grond gekomen. Ten opzichte van ATA TCQ heeft Serial ATA native command queuing als één van de voordelen de ondersteuning van First Party DMA (FPDMA). Met behulp van FPDMA kan de harde schijf op eigen houtje DMA-transfers met het geheugen opzetten. NCQ kan maximaal 32 openstaande commando's verwerken. Minder dan SCSI, maar nog altijd een hele grote verbetering voor desktopsystemen en voldoende voor low-end servergebruik. De nieuwste generatie controllers van onder andere Silicon Image en Marvell zal ondersteuning hebben voor zowel NCQ als TCQ. Het is de bedoeling dat alle fabrikanten uiteindelijk de richting uitgaan van Serial ATA II en native command queuing.
Pogingen om de invloed te meten van SCSI command queuing op de desktop performance hebben nog niet tot een bevredigend resultaat geleid. Hopelijk kunnen we hier in de toekomst meer over melden.
Maxtor single chip Serial ATA-harde schijfMaxtor demonstreerde op het Intel Developer Forum zijn volgende generatie 7200 toeren harde schijf voor desktops en near-line serverstorage. De nieuwe lijn is om twee redenen bijzonder. Ten eerste is het één van de eerste schijven met ondersteuning voor SATA II en NCQ, en ten tweede gebruikt Maxtor als één van de eerste fabrikanten single chip Serial ATA-besturing op de harde schijf. Andere fabrikanten gebruiken vaak nog multi-chip implementaties of een oplossing waarbij simpelweg een PATA naar SATA bridge op een bestaande parallel ATA-harde schijf wordt geschroefd. De single chip-oplossing heeft lagere kosten in de grote volumes waarin SATA-harde schijven momenteel geproduceerd kunnen worden. Daarom zullen vanaf de komende generatie harde schijven meer fabrikanten naar een dergelijke oplossing overstappen. Uit het
LSI MegaRAID SATA 300-8X
Marvell port multiplier en port selector
Command queuing en snellere SATA RAID-adapters komen er dus aan, maar dat is niet alles wat Serial ATA in zijn mars heeft als betaalbare en snelle opslagtechnologie voor servers. De Serial ATA II-specificatie beschrijft de mogelijkheid om port multipliers te gebruiken. Met behulp van een port multiplier kunnen maximaal vijftien SATA-harde schijven aan één host poort gekoppeld worden. De eerder genoemde 8-poorts MegaRAID SATA 300-8X zal met behulp van 1:15 port multipliers maximaal 120 harde schijven kunnen aansturen en in een praktischer situatie met 1:4 multipliers maximaal 24 schijven kunnen ondersteunen. In dit licht bezien heeft de hoge bandbreedte van Serial ATA II (300MB/s per poort) wel degelijk nut, ook al zal één schijf de komende jaren niet van de bandbreedte kunnen gebruikmaken. Port multipliers zijn voornamelijk bedoeld voor integratie in de backplanes van hotswap bays. Het is niet ondenkbaar dat er losstaande apparaten op de markt zullen komen, die gebruikt kunnen worden om SATA-poorten in normale desktop computers te splitsen. De harde schijven moeten volgens de specificaties van het type SATA 1.0a of nieuwer zijn om port multipliers te kunnen ondersteunen.
Marvell kondigde op het Intel Developer Forum als één van de eerste fabrikanten een productierijpe port multiplier chip aan. Deze Marvell 88SM4140 is een 1:4 Serial ATA II port multiplier waarmee één host connectie met maximaal vier harde schijven kan communiceren. Serial ATA II biedt voldoende bandbreedte om vier schijven ongeremd op één poort te werk laten gaan. Bandbreedte is overigens zelden een probleem in servertoepassingen, die worden gekenmerkt door veel seeks en kleine requests. Door de vele kopverplaatsingen komt de transfer rate zelden in de buurt van de maximale sequentiële transfer rate, die bij de hedendaagse SATA-schijven 70MB/s bedraagt op de buitenste sporen. De port multiplier van Marvell bevat een Storage Enclosure Management Bridge voor communicatie met een Storage Enclosure Processor. Hiermee kunnen statusgegevens van de schijfbehuizing, zoals temperatuur en voltages, worden doorgegeven aan de controller en eventuele managementsoftware.

Marvell 88SM4140 Serial ATA II 1:4 port multiplier diagramSerial ATA zal dankzij port multipliers een zeer aantrekkelijke oplossing worden voor grote, kosteneffectieve storage arrays. De lage prijs per gigabyte is al een feit. Met behulp van vier port multipliers en een 4-poorts RAID-adapter stop je heel eenvoudig zestien harde schijven in een 4U rackmount.
Een ander nieuw product van Marvell is de
88SM4030 Serial ATA port selector. Met behulp van de port selector kan een redundante verbinding worden gemaakt door twee host poorten te verbinden met één harde schijf. Deze technologie was voorheen enkel beschikbaar op duurdere SCSI en Fibre Channel-systemen. De port selector van Marvell voorziet in drie bedrijfsmodi: side-band switch control, protocol-based switch control en primitive-based switch control. De eerste twee modi worden gebruikt voor failover in systemen die redundantie vereisen. De derde modus is een fabrikant-eigen methode van Marvell om load balancing mogelijk te maken in combinatie met de 4-poorts en 8-poorts 88SX60xx SATA-controllers. Door middel van high-speed switching kunnen de data transfers gedistribueerd worden over twee SATA host controllers.

Voorbeeld van toepassing port selector: harde schijven redundant aangesloten op backplane
Serial Attached SCSI
Op het gebied van Serial Attached SCSI (SAS) vonden op het Intel Developer Forum twee belangrijke aankondigingen en demonstraties plaats. De eerste was de aankondiging van Seagate's nieuwe 'Savvio' 2,5 inch enterprise SCSI-harde schijf, die weliswaar ook leverbaar zal zijn met een Ultra320 SCSI en Fibre Channel-interface, maar vooral interessant is in de SAS-uitvoering. De kleine 2,5 inch form factor gaat immers hand in hand met de compactheid van SAS-bekabeling. De tweede was de demonstratie van LSI Logic's eerste SAS-controller in combinatie met de eerder genoemde Savvio-harde schijven van Seagate. In ons Seagate gaf op zijn IDF-stand een demonstratie van de dual porting-mogelijkheden van de SAS-modellen uit de Savvio-lijn. Dual porting biedt de mogelijkheid om maximaal vier poorten te combineren voor redundancy, multi-iniator of port aggregation. Hiermee kan een indrukwekkende maximale transfer rate van 12Gbit/s gerealiseerd worden. Multi-initiator wil zeggen dat meerdere controllers aan dezelfde harde schijf gekoppeld kunnen worden voor bijvoorbeeld clusteringdoeleinden. Deze functionaliteit is al lange tijd beschikbaar op de huidige parallelle SCSI-standaard maar moet vanzelfsprekend op een andere wijze geïmplementeerd worden bij point-to-point overdrachtstechnologieën zoals Serial Attached SCSI. De verschillende controllers kunnen immers niet op dezelfde kabel aangesloten worden. Vandaar dual porting. De onderstaande foto toont een dual ported Savvio-harde schijf die is verbonden met twee systemen.

LSI Logic SAS-familie
De demonstratie werd uitgevoerd op de LSILSAS1064 SAS-controller van LSI Logic. De controller werd samen met een SAS host bus adapter en een SAS expander eind vorige maand door LSI Logic Het eerste product waarin de SAS1064-controller toepassing zal vinden is de SAS3040X Serial Attached SCSI host bus adapter. De SAS3040X is de eerste uit een serie van SAS HBA's. Het model heeft vier interne SAS/SATA-poorten en is bedoeld voor systemen met interne opslag. Later zal een 8-poorts versie met externe connectors uitgebracht worden. LSI Logic zal op basis van zijn MegaRAID-technologie een nieuwe familie van SAS RAID-adapters en ROMB (RAID on motherboard) oplossingen aanbieden. De spits zal worden afgebeten door de MegaRAID SAS 300-8E, een 8-poorts adapter met interne en externe connectiviteit. LSI Logic zegt hiermee features die tot voor kort enkel beschikbaar waren voor (Fibre Channel) SAN-implementaties op het SAS Direct Attached Storage niveau te kunnen aanbieden. Specifieker wordt hier niet op ingegaan, maar één van de mogelijke verbeteringen is dual porting voor hogere redundancy en beschikbaarheid.
Als laatste product in de serie heeft LSI Logic de SASx12 expander aangekondigd. Met behulp van deze chip kunnen meerdere targets (hosts) en initiators (harde schijven) via een switch aan elkaar gekoppeld worden. SAS expanders kunnen onder andere gebruikt worden in backplanes om meerdere harde schijven via een seriële verbinding aan de storage adapter te koppelen. Het principe is vergelijkbaar met die van de SATA port multiplier.
Adaptec heeft nog geen concrete SAS-producten aangekondigd. Wel weten we dat het bedrijf een controller in de maak heeft die 3Gb/s en 6Gb/s snelheden zal ondersteunen.
Maxtor SAS-harde schijven
Maxtor heeft nog geen plannen voor een 2,5 inch enterprise harde schijven bekendgemaakt, maar heeft wel een 3,5 inch schijf met Serial Attached SCSI-interface in voorbereiding. Een prototype, voorzien van twee poorten, werd begin februari succesvol getest in combinatie met de SAS1064 van LSI Logic. In de test werden simultane lees en schrijfoperaties op beide poorten uitgevoerd en werd de werking van de schijf geverifieerd op een snelheid van 3Gbit/s. De demonstratie werd herhaald op het Intel Developer Forum. Over de beschikbaar van de SAS-producten heeft Maxtor nog geen officiële uitspraken gedaan.
PCI Express
PCI Express (PCI-E) heeft an sich niet veel met storage te maken, maar zal wel een belangrijke bus interface voor storage adapters worden. Samen met de video- en de netwerkkaart heeft de storage controller immers de meest behoefte aan bandbreedte. Hoewel veel serverfabrikanten vooralsnog vasthouden aan PCI-X, is Intel hard aan het pushen om PCI-E in servers geaccepteerd te krijgen. De nieuwe Lindenhurst-chipset voor de 64-bit Nocona Xeon-core zal PCI Express geïntegreerd hebben. De komende generatie desktop chipsets zal eveneens over PCI Express-ondersteuning kunnen beschikken. PCI Express zal in verschillende snelheden op moederborden aanwezig zijn. De verschillende gradaties zijn een veelvoud van de basissnelheid van 2,5Gbit/s full duplex. Zo zal een PCI-E 1X-slot een bandbreedte van ongeveer 250MB/s hebben en zal een 32-baans PCI-E 32X-slot maximaal 8GB/s in beide richtingen kunnen verplaatsen. In eerste instantie zal er in desktops gebruikgemaakt worden van 1-baans tot 4-baans slots en zullen servers maximaal 8-baans PCI-E hebben. Voor graphics is een 16-baans PCI-E-verbinding uitgedacht.
 |
 | PCI versus PCI Express bandbreedte (up + downstream, Gbit/s) |  |
 |
 | PCI-E 16X |   80 |  |
 |
 | PCI-E 4X |   20 |  |
 |
 | PCI-E 1X |   5 |  |
 |
 | PCI-X 2.0 QDR |   32 |  |
 |
 | PCI-X 2.0 DDR |   16 |  |
 |
 | PCI-X 1.0 |   8 |  |
 |
De bandbreedte van PCI Express en PCI-X wordt in de bovenstaande figuur vergeleken. De PCI-E-bandbreedte is een optelling van de up- én downstream bandbreedte, terwijl PCI-X de volledige bandbreedte in beide richtingen kan halen. PCI-X kan echter niet in beide richtingen tegelijkertijd versturen, wat PCI-E wel kan (per richting op halve snelheid van de bovengenoemde getallen).

Op het IDF toonde Adaptec als één van de eerste fabrikanten een SCSI RAID-adapter met PCI Express-interface. Adaptec doet anders dan LSI Logic minder aankondigingen over productontwikkeling, waardoor er minder informatie bekend is over de product roadmap van Adaptec. Gelukkig slaagde Wouter erin om Adaptec's PCI Express-adapter voor de lens van zijn camera te krijgen. Op basis van de pcb-layout kan veel gezegd worden over de specificaties van de kaart. Een field engineer van Adaptec in Frankrijk kon bevestigen dat het hier een dual channel Ultra320 SCSI RAID-adapter betreft, die is gebaseerd op Adaptec's AIC-7902 dual channel Ultra320 SCSI-controller en Intel's "Dobson" I/O processor. De adapter is voorzien van 128MB niet-uitbreidbaar DDR-geheugen. Verder is er een connector voor een battery backup unit op de pcb aanwezig, hoewel de Adaptec engineer niet met zekerheid kon zeggen dat de betreffende connector voor dit doeleinde bestemd is. De PCI-E-interface heeft een viervoudige snelheid. Veel details over de Intel Dobson I/O processor zijn nog niet bekend, behalve dat deze ondersteuning heeft voor PCI Express. De kloksnelheid en de prestaties van de geheugeninterface zullen ongetwijfeld weer op een hoger niveau liggen dan bij de IOP321 en de IOP331.
LSI Logic heeft zich de laatste tijd gemanifesteerd als een zeer vooruitstrevende producent van RAID-adapters, en dat terwijl het bedrijf drie jaar geleden nog helemaal geen RAID-adapters produceerde. De MegaRAID-divisie van AMI, overgenomen in mei 2001, en RAID-fabrikant Mylex, overgenomen in juli 2002, lijken in goede handen te zijn gevallen. LSI Logic heeft een vergelijkbare PCI Express dual channel Ultra320 SCSI RAID-implementatie in ontwikkeling als Adaptec. De single channel MegaRAID SCSI 320-1E en de dual channel MegaRAID SCSI 320-2E zijn beide gebaseerd op de Intel Dobson I/O processor. Waarschijnlijk heeft de SCSI 320-2E evenals de SCSI 320-2 (IOP303 64-bit 66MHz PCI) en de SCSI 320-2X (IOP321 PCI-X) uitbreidbaar cachegeheugen, terwijl de 320-1E embedded geheugen zal hebben. Naast deze insteekkaarten heeft LSI Logic een RAID on motherboard (ROMB)-oplossing in ontwikkeling. De ROMB-oplossing zal direct met de PCI Express-interface van de Lindenhurst-chipset verbonden kunnen worden. De geïntegreerde RAID-controller zal onder andere door Fujitsu-Siemens gebruikt gaan worden. Dell verkoopt onder zijn merknaam PERC (Power Edge RAID controller) veel 'gerebadgede' MegaRAID-adapters. Het is te verwachten dat de nieuwe RAID-adapters van LSI Logic uiteindelijk ook in Dell-systemen leverbaar worden.
Tot besluit...
Op de voorgaande pagina's hebben we een overzicht gegeven van de nieuwste storage producten die afgelopen week op het Intel Developer Forum werden gepresenteerd. Tweakers.net zal de ontwikkelingen in de storagemarkt op de voet blijven volgen zodat het Nederlandse en Vlaamse publiek optimaal geïnformeerd kan worden over nieuwe technologieën voor desktop en enterprise storage.
IDF reportages






| Wo 22:24 - We vervolgen onze verslaggeving van het IDF met reportages over nieuwe koeloplossingen voor de Pentium 4, demonstraties van 2,5 inch Serial Attached SCSI-schijven en foto's van de XDR DRAM-technologie van Rambus.  | |


