Op de grote supercomputingconferentie van dit jaar, SC19, is de top van de lijst van de snelste machines ter wereld ongewijzigd, maar er wordt gesproken over een aantal nieuwe technologieën die het tijdperk van exaschaalcomputers voorspellen - machines die theoretisch in staat zijn tot een miljard miljard (dwz een quintillion) berekeningen per seconde.
Zoals het is sinds juni vorig jaar, staat de Summit-computer van het Oak Ridge National Laboratory (ORNL) van het Department of Energy nu bovenaan de Top 500-lijst, met een aanhoudende theoretische prestatie van 148,6 petaflops op de gebruikte High Performance Linpack-test om de Top500-lijst te rangschikken.
Deze machine, gebouwd door IBM, heeft 4.608 knooppunten, elk uitgerust met twee, 22-core IBM Power 9 CPU's en zes Nvidia Tesla V100 GPU's, allemaal verbonden door een Mellanox EDR InfiniBand-netwerk.
Een soortgelijk maar iets kleiner systeem genaamd Sierra in het Lawrence Livermore National Laboratory staat op de tweede plaats met 94,6 petaflops.
Op de derde plaats staat de Sunway TaihuLight-supercomputer in het Chinese National Supercomputing Center in Wuxi.
Het wordt aangedreven door Sunway's SW26010-processors en scoort 93 petaflops
In feite is de hele top 10 op de lijst sinds juni ongewijzigd.
Het krachtigste nieuwe systeem komt binnen op nummer 25 met een systeem genaamd het Advanced Multiprocessing Optimized System (AMOS) bij het Center for Computational Innovations (CCI) van het Rensselaer Polytechnic Institute.
Nogmaals, dit is een IBM Blue Gene / Q-systeem, met Power 9-CPU's en Nvidia Tesla V100's.
Dit is een kleiner systeem met vijf rekken met een aanhoudende Linpack van maximaal 8 petaflops, volgens de lijst.
(Als aluin is het geweldig om te zien, en ik was vooral gekieteld toen het AMOS heette, naar Rensselaer's eerste senior professor, Amos Eaton.
Dat maakte me aan het lachen, want ik heb veel tijd doorgebracht als student te wachten op het mainframe bij Amos Eaton Hall.
Ik betwijfel of iemand ooit LINPACK op de oude IBM 360/67 heeft gedraaid, maar de nieuwe machine is waarschijnlijk miljoenen keren sneller; hij heeft 130.000 kernen vergeleken met het enkele cijfer op het oude mainframe.)
Als we over de hele lijst kijken, blijft China stijgen en heeft het nu 227 van de Top 500-installaties, terwijl de VS goed waren voor 118, bijna zijn laagste punt ooit.
De drie belangrijkste systeemleveranciers zijn Lenovo, Sugon en Inspur - allemaal gevestigd in China - gevolgd door Cray en HPE (HPE is nu eigenaar van Cray).
470 systemen gebruiken Intel CPU's, nog eens 14 gebruiken Power-processors en drie gebruiken AMD.
Er staan ??nu twee ARM-gebaseerde supercomputers op de lijst: het Astra-systeem dat wordt ingezet bij Sandia National Laboratories, dat is uitgerust met Marvell's ThunderX2-processors, en het A64FX-prototypesysteem van Fujitsu in Japan.
Nvidia blijft de dominante leverancier voor accelerators, met GPU's in 136 van de 145 versnelde systemen.
Ethernet wordt nog steeds in meer dan de helft van de systemen gebruikt, maar de snelste gebruiken meestal InfiniBand of eigen interconnects zoals Cray Aries en Intel OmniPath.
Maar als er tot nu toe niet veel is veranderd in de lijst, wordt er veel gewerkt aan nieuwe architecturen met het doel om binnen twee jaar een Exascale-machine te produceren.
De VS hebben aangekondigd te werken aan twee grote nieuwe supercomputers.
Het eerste is het Aurora-project in het Argonne National Laboratory van DOE, dat zal worden gebouwd door Cray (nu onderdeel van HPE) en Intel, terwijl het tweede Frontier at Oak Ridge is, dat aangepaste AMD Epyc-processors en Radeon Instinct GPU's zal draaien die zijn verbonden via een Infinity Fabric-verbinding.
In de aanloop naar SC19 kondigde Intel meer details van het Aurora-project aan en zei dat het knooppunten zal gebruiken die bestaan ??uit twee 10nm ++ Sapphire Rapids Xeon-processors en zes van de nieuwe Ponte Vecchio GPU-versnellers, gebaseerd op de aanstaande Xe grafische architectuur, evenals de Firma's Optane DC persistent geheugen.
Intel zei dat Aurora meer dan 10 petabytes aan geheugen en meer dan 230 petabytes aan opslag zal ondersteunen, en de Cray Slingshot-fabric zal gebruiken om knooppunten over meer dan 200 racks te verbinden.
(Het gaf echter geen exacte cijfers voor het totale aantal knooppunten of prestaties).
Intel gaf wat meer details over de Ponte Vecchio-processors en zei dat het zal worden gebouwd rond de Xe-architectuur, maar geoptimaliseerd voor high-performance computing en AI-workloads.
Deze versie wordt vervaardigd op 7nm-technologie en gebruikt Intel's Foveros 3D- en EMIB-verpakkingen om meerdere dobbelstenen in het pakket te hebben.
Het ondersteunt ook geheugen met hoge bandbreedte en de Compute Express Link (CXL) -verbinding.
(Intel had eerder gezegd ergens in 2020 een versie van de Xe-architectuur in een consumenten-GPU te verwachten, vermoedelijk op het 10nm- of 14nm-proces van Intel.)
Intel gaf ook meer details over zijn oneAPI-project, bibliotheken en een nieuwe taalvariant genaamd Data Parallel C ++, die is ontworpen om ontwikkelaars te helpen bij het schrijven van code die kan worden uitgevoerd op CPU's, GPU's en FPGA's.
Om niet achter te blijven, kondigde Nvidia - waarvan de GPU's de meest populaire accelerators zijn - een referentieontwerp aan voor het bouwen van servers die ARM-gebaseerde processors combineren met Nvidia GPU's.
Nvidia werkte samen met Ampere, Fujitsu en Marvell - die allemaal aan ARM-gebaseerde serverprocessors werken, evenals met Cray en HPE, die afzonderlijk hebben gewerkt aan enkele van de vroege ARM-gebaseerde HPC-systemen met Nvidia GPU-accelerators.
Aanbevolen door onze redacteuren
Nvidia introduceerde ook Magnum IO, een softwarepakket dat een techniek genaamd GPUDirect gebruikt om de CPU's te omzeilen bij toegang tot het netwerk; evenals een nieuw element genaamd GPUDirect Storage dat hetzelfde doet bij het openen van opslag- en databestanden voor simulatie, analyse of visualisatie.
Magnum IO is nu beschikbaar, maar met het GPUDirect Storage-gedeelte gepland voor de eerste helft van 2020.
AMD zei dat meer bedrijven zijn tweede generatie EPYC-processors en Radeon Instinct-versnellers gebruiken, wat de selectie van het bedrijf voor de Frontier-computer benadrukt, waarvan het bedrijf zei dat het naar verwachting de best presterende supercomputer ter wereld zou zijn wanneer deze in 2021 wordt geleverd.
een aantal andere systemen die zijn systemen zullen gebruiken, waaronder deals met Atos op zijn BullSequana XH2000-supercomputers voor weersvoorspellingen en onderzoek op het gebied van atmosferische, oceaan- en clientcomputers; en met Cray, met behulp van de Shasta-architectuur in de aanstaande Archer2- en Vulcan-systemen in het VK.
AMD had het over ROCm 3.0, een nieuwe versie van de open source-software voor GPU-computing die het bedrijf ondersteunt.
AMD benadrukte dat Microsoft Azure nu een preview biedt van een HPC-instantie op basis van de tweede generatie Epyc 7742-processor, terwijl Nvidia een nieuwe Azure-instantie heeft aangekondigd die kan opschalen tot 800 V100 GPU's die onderling zijn verbonden via een enkel Mellanox InfiniBand-backend-netwerk.
Nvidia zei dat het 64 van deze instanties in een pre-releaseversie van het cluster gebruikte om BERT, een populair conversational AI-model, in ongeveer drie uur te trainen.
Een van de interessantere aankondigingen kwam van startup Cerebras, dat zich concentreert op zijn Wafer-Scale Engine (WSE), een 300 mm-wafer die 1,2 biljoen transistors bevat, waaronder 400.000 rekenkernen en 18 GB on-chip geheugen.
Tijdens de show lanceerde Cerebras zijn CS-1-systeem en kondigde aan dat het de eerste al aan het Argonne National Laboratory had geleverd.
Het bedrijf benadrukte dat dit systeem:welke verhalen zeggen dat ze zes van deze WSE's bevatten, samen met geheugen en netwerken (de verhalen klopten niet, er zit maar één WSE in elke CS-1) - is slechts 26 inch (15 rack units) hoog, veel kleiner dan racks met GPU-versnelde systemen.
Het is een behoorlijk interessant concept, een concept dat heel anders is dan de andere benaderingen.