(Kredit: Nvidia) Hur Nvidias Ampere-arkitektur kommer att förbättra företagets grafikkort för spel är fortfarande ett mysterium.
Men på torsdag talade Nvidias VD Jensen Huang om hur tekniken kommer att överbelasta företagets företagets GPU: er.
Ampere-arkitekturen hamnar först i A100, ett grafikkort som är utformat för dataanalys och vetenskaplig databehandling.
Enligt Nvidia kommer A100 att erbjuda en 20-gångers prestandaförbättring när AI-drivna applikationer körs jämfört med företagets V100 GPU från tre år sedan.
A100 GPU (kredit: Nvidia) Själva det nya kortet innehåller 54,2 miljarder transistorer, 6 912 CUDA-kärnor, en minnesstorlek på 40 GB, som kan producera en minnesbandbredd på 1,6 TB / sek, eller vad Huang sa är en bransch först.
Företaget kunde göra detta med hjälp av TSMCs 7-nanometer tillverkningsteknik, som kan packa fler transistorer på kislet.
(Fullständiga specifikationer för A100 finns här.)
Däremot kan den äldre V100 GPU - som bara har 21 miljarder transistorer - ha en minnesbandbredd på 900 GB / sek med den äldre tillverkningstekniken på 12 nm.
För att illustrera skillnaden demonterade Huang A100 som kör mot V100 över ett AI-program som låter dig ladda upp fågelljud för att hitta vilken fågelart och geografisk region ljudet kommer från.
A100 kunde utföra 500 frågor per sekund jämfört med endast 80 frågor per sekund som erbjuds av V100.
En annan fördel som A100 har jämfört med sin föregångare är hur GPU: s datorkraft kan delas upp till så många som sju oberoende GPU-uppgifter.
Detta lovar att hjälpa datacenter och molnleverantörer att sänka kostnaderna när de hyr sin datorkraft till kunder.
”Var och en av kunderna kunde hyra en mindre dator.
Du har nu flexibiliteten att göra det, tillade Huang.
Microsoft kommer att vara den första kunden att anta A100-kortet och planerar att använda tekniken i företagets molndatorplattform, Azure, som dataforskare kan använda för att finjustera och köra sina AI-program.
"Azure kommer att möjliggöra utbildning av dramatiskt större AI-modeller med Nvidias nya generation A100-grafikprocessorer för att driva det senaste inom språk, tal, vision och multimodalitet", säger Microsofts företags vice ordförande Mikhail Parakhin i ett uttalande.
DGX A100-kortet (kredit: Nvidia) Kortet kommer också förpackat som ett förbyggt system med DGX A100, en serverenhet på 199 000 USD.
Varje enhet levereras med åtta A100-grafikprocessorer med slits inuti.
Den första DGX A100-beställningen går till USA: s energiministeriums Argonne National Laboratory för att praktiskt taget simulera COVID-19, vilket kan hjälpa forskare att utveckla potentiella behandlingar för viruset.
Även om dagens samtal av Huang fokuserade lite på konsumentens sida, förväntas Ampere-arkitekturen ge en prestandaförstärkning för Nvidias nästa generationens grafikkort genom att döma tillverkningstekniken på 12 nm för TSMCs snabbare 7-nm tillverkningsprocess.
Förvänta Nvidia att prata mer om Ampere de närmaste månaderna när företaget förbereder sig för att släppa sina ryktade 3000-serien RTX-grafikkort för konsumenter.
(Kredit: Nvidia) Hur Nvidias Ampere-arkitektur kommer att förbättra företagets grafikkort för spel är fortfarande ett mysterium.
Men på torsdag talade Nvidias VD Jensen Huang om hur tekniken kommer att överbelasta företagets företagets GPU: er.
Ampere-arkitekturen hamnar först i A100, ett grafikkort som är utformat för dataanalys och vetenskaplig databehandling.
Enligt Nvidia kommer A100 att erbjuda en 20-gångers prestandaförbättring när AI-drivna applikationer körs jämfört med företagets V100 GPU från tre år sedan.
A100 GPU (kredit: Nvidia) Själva det nya kortet innehåller 54,2 miljarder transistorer, 6 912 CUDA-kärnor, en minnesstorlek på 40 GB, som kan producera en minnesbandbredd på 1,6 TB / sek, eller vad Huang sa är en bransch först.
Företaget kunde göra detta med hjälp av TSMCs 7-nanometer tillverkningsteknik, som kan packa fler transistorer på kislet.
(Fullständiga specifikationer för A100 finns här.)
Däremot kan den äldre V100 GPU - som bara har 21 miljarder transistorer - ha en minnesbandbredd på 900 GB / sek med den äldre tillverkningstekniken på 12 nm.
För att illustrera skillnaden demonterade Huang A100 som kör mot V100 över ett AI-program som låter dig ladda upp fågelljud för att hitta vilken fågelart och geografisk region ljudet kommer från.
A100 kunde utföra 500 frågor per sekund jämfört med endast 80 frågor per sekund som erbjuds av V100.
En annan fördel som A100 har jämfört med sin föregångare är hur GPU: s datorkraft kan delas upp till så många som sju oberoende GPU-uppgifter.
Detta lovar att hjälpa datacenter och molnleverantörer att sänka kostnaderna när de hyr sin datorkraft till kunder.
”Var och en av kunderna kunde hyra en mindre dator.
Du har nu flexibiliteten att göra det, tillade Huang.
Microsoft kommer att vara den första kunden att anta A100-kortet och planerar att använda tekniken i företagets molndatorplattform, Azure, som dataforskare kan använda för att finjustera och köra sina AI-program.
"Azure kommer att möjliggöra utbildning av dramatiskt större AI-modeller med Nvidias nya generation A100-grafikprocessorer för att driva det senaste inom språk, tal, vision och multimodalitet", säger Microsofts företags vice ordförande Mikhail Parakhin i ett uttalande.
DGX A100-kortet (kredit: Nvidia) Kortet kommer också förpackat som ett förbyggt system med DGX A100, en serverenhet på 199 000 USD.
Varje enhet levereras med åtta A100-grafikprocessorer med slits inuti.
Den första DGX A100-beställningen går till USA: s energiministeriums Argonne National Laboratory för att praktiskt taget simulera COVID-19, vilket kan hjälpa forskare att utveckla potentiella behandlingar för viruset.
Även om dagens samtal av Huang fokuserade lite på konsumentens sida, förväntas Ampere-arkitekturen ge en prestandaförstärkning för Nvidias nästa generationens grafikkort genom att döma tillverkningstekniken på 12 nm för TSMCs snabbare 7-nm tillverkningsprocess.
Förvänta Nvidia att prata mer om Ampere de närmaste månaderna när företaget förbereder sig för att släppa sina ryktade 3000-serien RTX-grafikkort för konsumenter.