Fra skala/skalering til skala: Spectrum - XGS er det uunngåelige valget

Sep 25, 2025

Legg igjen en beskjed

Nåværende AI -datasentre står overfor to kjerneflaskehalser i skalering, og tradisjonell skala - opp og skala - ut modeller sliter med å møte giga - skala AI -krav:

Skala - opp begrensninger: Oppnådd ved å oppgradere enkeltsystemer eller stativer (f.eks, øke GPU -tellingen eller forbedre enkelt - enhetsytelse), men begrenset av strømtak fra infrastruktur som vannkjøling. Eksisterende datasentre har fysiske terskler for strøminngang og varmeavledning, og forhindrer uendelige økninger i beregningstetthet per rack eller datasenter.

Skala - ut begrensninger: Utvidet ved å legge til stativer og servere til å skalere klynger, men begrenset av det fysiske rommet på et enkelt sted, og pålegger harde kapsler på utstyrskapasiteten.

For å overvinne dette dilemmaet foreslår Nvidia den nye dimensjonen til "Scale - over", optimalisere nettverkskommunikasjon mellom geografisk spredte datasentre for å få distribuerte AI -klynger til å samarbeide som en. NVIDIA -grunnlegger og administrerende direktør Jensen Huang beskriver dette krysset - regional AI Super Factory som nøkkelinfrastruktur for AI Industrial Revolution, med Spectrum - XGS som kjerneteknologi -enabler.

Spectrum-XGS

Kjerneteknologier for spekteret - XGS

Spectrum - XGS er ikke en helt ny maskinvareplattform, men en utvikling av NVIDIAs eksisterende spektrum - x Ethernet -økosystem. Siden 2024 -lanseringen har Spectrum - X levert 1,6x høyere generativ AI -nettverksytelse enn tradisjonell Ethernet via Spectrum - 4 Architecture's SN5600 Switches og Bluefield - 3 dpus, og ble mainstream -valget for en datasentre ved å bruke nvid NVIDIDS. Gjennombruddet i Spectrum-XG ligger i tre algoritmiske innovasjoner og synergier av maskinvare som adresserer kommunikasjonsforsinkelse, overbelastning og synkroniseringsutfordringer i tverrregionale GPU-klynger.

1.Core algoritmer: Dynamisk tilpasning til Long - avstandsnettverkskarakteristikker

Spectrum - XGS's Core er et sett med "Distance - bevisste nettverksoptimaliseringsalgoritmer" som analyserer nøkkelparametere for Cross {{2} am Data {- sentrumskommunikasjon i real - tid (distanse, trafikkmønster, co clestions i real {}

Avstand - Adaptiv overbelastningskontroll:I motsetning til tradisjonell Ethernets ensartede behandling av alle tilkoblinger, justerer Spectrum - XGS -algoritmer automatisk overbelastningsgrenser basert på faktiske avstander mellom datasentre (som for tiden støtter distribusjoner opp til hundrevis av kilometer), unngå pakketap eller oppbygging i lang -.

Presis latensstyring:Gjennom per - pakke fin - Kornet adaptiv ruting, eliminerer den latensjitter fra pakketurneringer i tradisjonelle nettverk. Jitter er en kritisk fare i AI -klynger: Hvis en enkelt GPU henger på grunn av forsinkelse, må alle samarbeidende GPU -er vente, og direkte påvirke den generelle ytelsen.

Slutt - til - slutt telemetri: Ekte - tidssamling av full - lenke ytelsesdata fra GPUer til brytere og kryss - data - senterkoblinger gir millisekond - nivå tilbakemelding for å få tilsøkt algoritmiske justeringer.

2. Maskinvaresynergier: utnytte spekteret - x økosystemets høye - båndbredde foundation

Spectrum - XGS oppnår optimal ytelse når det kombineres med spesifikk NVIDIA -maskinvare:

Spektrum - x brytere: Som den underliggende nettverksryggraden, som gir høy porttetthet og lav - latens -videresending.

Connectx-8 Supernic: 800 GB/s AI - dedikert nettverksadapter for høy - hastighetsdataoverføring mellom GPUer og brytere.

Blackwell Architecture Hardware: Som B200 GPUer og GB10 Superchips, dypt integrert med Spectrum - XGS for å redusere ende - til - slutt latens. NVIDIA validert gjennom NCCL (Collective Communications Library) Benchmarks: Spectrum - XGS øker kommunikasjonsytelsen mellom Cross- data - senter gpus med 1.9}}}}}}}}}}} {{{{{{{{ Responsive og lag - gratis for brukerinteraksjoner, møte ekte - Tidskrav for AI -inferens.

Full - Stabeloptimalisering for AI -trening og inferanseffektivitet med Spectrum - XGS

Spectrum - XGS er ikke en isolert teknologi, men et nøkkeltilskudd til NVIDIAs full - Stack AI -økosystem. I denne utgivelsen avslørte NVIDIA også programvare - nivå ytelsesforbedringer som synergiserer med Spectrum - XGS for maskinvare - algoritme - programvaresamarbeid:

Dynamo -programvareoppgradering: Optimalisert for Blackwell -arkitektur (f.eks. B200 -systemer) for å øke AI -modellens inferensytelse med opptil 4x, noe som reduserer beregningsforbruket for stor modellinferanse betydelig.

Spekulativ avkodingsteknologi: Bruker en liten utkastsmodell for å forutsi den neste utgangstokenet til hoved AI -modellen på forhånd, og reduserer hovedmodellens beregning og forbedrer inferensytelsen med ytterligere 35%. Dette er spesielt egnet for samtale -inferensscenarier i store språkmodeller (LLM).

NVIDIAs akselererte databehandlingsdirektør Dave Salvator uttalte at kjernemålet med disse optimaliseringene er å skalere ambisiøse agent AI -applikasjoner. Enten trening billion - parameter store modeller eller støtter AI -inferenstjenester for millioner av samtidige brukere, kommer kombinasjonen av Spectrum - XGS og programvaren Ecosystem leverer forutsigbar ytelse.

Tidlige applikasjoner og bransjepåvirkning av Spectrum - XGS

Første brukere: Coreweave Pioneers Cross - Domain AI Super FactoryGPU Cloud Service -leverandør CoreWeave er blant de første adoptere av Spectrum - XGS. Selskapets CO - grunnlegger og CTO Peter Salanki bemerket at denne teknologien vil gjøre det mulig for kundene sine å få tilgang til Giga - skala AI -funksjoner, og akselererer gjennombrudd på tvers av bransjer. For eksempel å støtte Ultra - stor - skala AI -prosjekter som Stargate -initiativet fra Oracle, SoftBank og Openai.

Bransjetrender: Ethernet som erstatter Infiniband som AI -nettverk mainstreamSelv om Infiniband hadde omtrent 80% av AI Backend Network -markedet i 2023, skifter industrien raskt til Ethernet. Nvidias valg om å utvikle Spectrum - XGS på Ethernet stemmer overens med denne trenden:

Kompatibilitet og kostnadsfordeler:Ethernet er den universelle standarden for globale datasentre, mer kjent for nettverksingeniører og billigere å distribuere enn Infiniband.

PROVENSJONER: Markedsskala:Dell'oro Group -data viser at Ethernet Data Center Switch -markedet vil nå nesten 80 milliarder dollar i løpet av de neste fem årene.

Nvidias egen vekst: 650 Groupsrapporter indikerer NVIDIA som den "raskeste - voksende leverandøren" i 2024 Data Center Switch -markedet, med nettverksinntektene som oppnår 5 milliarder dollar i Q 2 2024 (slutter 27. april), opp 56% år - over -.

Lanseringen av Spectrum - XGS utvider Nvidias full - Stack Monopol -strategi i AI -infrastruktur, mens du utløser ny konkurrerende dynamikk:

Nvidias fulle - stabeloppsett: Fra GPUer (Blackwell), Interconnects (NVLink/NVLink Switch), Networks (Spectrum - x/Spectrum - xgs, Quantum {{}} x infiniband) til programvare (NIM, Tensorrt {} En lukket sløyfe som dekker "Compute - Connect - programvare" for AI -infrastruktur. Spektrum - xgs synergiserer med nvLink for tre - nivåskalering: intra - rack (nvlink), intra - data - senter (spektrum {{12} {x - senter (spektrum {{12} {Xe cross - data - senter (spektrum - xgs).

Konkurrenters svar: Broadcoms tidligere Sue -teknologi deler lignende mål med Spectrum - XGS, som tar sikte på å optimalisere Ethernet -ytelsen for å lukke gapet med Infiniband. I tillegg akselererer leverandører som Arista, Cisco og Marvell AI - dedikerte Ethernet -brytere, med konkurranse med fokus på ytelse - kostnad - Ecosystem kompatibilitet.

Kjerneverdien til Spectrum - XGS ligger i å skyve AI -datasenterskalering fra "Single - nettstedsbegrensninger" til "Cross - regionalt samarbeid." Etter hvert som makt og land blir harde grenser for enkelt datasentre, vil Cross - by og kryss - land AI superfabrikker bli kjerneformen som støtter neste - Generasjon AI -applikasjoner (f.eks. Generell kunstig intelligens, store - skala middelklynger).

Som NVIDIAs nettverksavdeling senior visepresident Gilad Shainer forhåndsviste på Hot Chips Conference: "Cross - data - senter fiberoptisk fysiske nettverk har lenge eksistert", men programvarealgoritmer som spekteret - xgs er nøkkelen til å låse opp den sanne ytelsen {{}

Sende bookingforespørsel