Video: 2020 Seminar Series: Intro to Supercomputing (Novembre 2024)
Ci sono state alcune sorprese alla conferenza Supercomputing 17 di questo mese, tra cui un ottimo spettacolo per l'acceleratore PEZY-SC2, nonché il cambio di direzione di Intel per la sua linea Xeon Phi. Inoltre, abbiamo visto anche i primi sistemi basati sul processore scalabile Xeon di Intel (Skylake) e il primo a disporre dell'acceleratore Volta di Nvidia.
Ma forse la più notevole è la notizia che i sistemi cinesi ora rappresentano 202 dei 500 supercomputer nella più recente lista della Top 500 rispetto a soli 143 dagli Stati Uniti. I sistemi americani hanno dominato l'elenco sin dalla sua istituzione 25 anni fa, e solo pochi mesi fa, gli Stati Uniti avevano 169 sistemi sui 160 della Cina. Lo stesso vale quando si tratta di prestazioni aggregate, con i sistemi cinesi combinati che rappresentano il 35, 4 percento di le prestazioni totali dei sistemi Top 500.
I computer più veloci al mondo continuano ad essere le due enormi macchine cinesi che sono in cima alla lista da diversi anni ormai: Sunway TaihuLight, dal centro nazionale cinese di supercomputer di Wuxi, con prestazioni Linpack sostenute di oltre 93 petaflop (93 mila trilioni di punti in virgola mobile operazioni al secondo), e il Tianhe-2, proveniente dal Super Computer Center cinese di Guangzhou, con prestazioni sostenute di oltre 33, 8 petaflop. Queste rimangono le macchine più veloci e con un margine enorme. Il sistema Piz Daint dello Swiss National Supercomputing Center, un sistema Cray che utilizza Intel Xeons e Nvidia Tesla P100s, si è classificato al terzo posto con prestazioni sostenute Linpack di 19, 6 petaflop.
Il più grande cambiamento nella parte superiore è un nuovo sistema al quarto posto: una versione aggiornata del supercomputer Gyoukou, un sistema ZettaScaler-2.2 implementato presso l'Agenzia giapponese per la scienza e la tecnologia marina-terrestre. Questa macchina utilizza acceleratori PEZY-SC2, un chip 2048 core di seconda generazione che offre prestazioni di picco di 4.096 teraflop in doppia precisione, nonché processori Intel Xeon convenzionali, per un totale di 19.860.000 core. (Una precedente macchina ZettaScaler con PEZY-SC2 ha reso l'elenco a un livello inferiore nella versione di giugno). Ciò gli conferisce il maggior numero di core utilizzati insieme, noto anche come il più alto livello di concorrenza, visto fino ad oggi, superando il TaihuLight, che ha 10, 6 milioni di core. La macchina Gyoukou ha raggiunto una prestazione Linpack di 19, 14 petaflop, ma la cosa interessante è che utilizza 1, 35 megawatt di potenza, rispetto a 2, 27 megawatt per PizDaint, 17, 8 megawatt per Tinahe-2 e 15, 4 megawatt per Taihulight. C'è ancora molta potenza, ma è una grande riduzione rispetto agli altri sistemi e una forte indicazione che i problemi di potenza sono importanti, anche per le macchine più veloci del mondo. Vale anche la pena notare che questo dimostra come le nuove architetture possano ridurre drasticamente il consumo energetico.
Il principale sistema statunitense rimane il supercomputer Titan presso l'Oak Ridge National Laboratory, un sistema di cinque anni che utilizza acceleratori GPU Nvidia K20x e consegna 17, 59 petaflop, che ora è al quinto posto nella lista.
Nell'ultimo elenco Green 500 dei supercomputer più efficienti dal punto di vista energetico, quattro dei primi cinque slot, inclusi i primi tre, sono andati ai sistemi giapponesi appena installati, tutti basati sull'architettura ZettaScaler-2.2 e sull'acceleratore PEZY-SC2. Il più efficiente di questi è lo Shoubu System B, installato presso il Centro avanzato di elaborazione e comunicazione di RIKEN. Lo Shoubu System B ha raggiunto 17.0 gigaflops / watt; Shoubu System B e i successivi due sistemi, che utilizzano rispettivamente 16.8 e 16.7 gigaflops / watt, sono tutti nella metà inferiore della Top 500. Il quinto sistema nella classifica Green è il sistema Gyoukou menzionato sopra: il sistema numero quattro nella Top 500, a 14, 2 gigaflop / watt.
Queste sono grandi innovazioni per l'acceleratore PEZY-SC2 e possono indicare direzioni future per architetture supercomputer.
Il quarto supercomputer più ecologico è il sistema DGX SaturnV Volta interno di Nvidia, che ha raggiunto 15, 1 gigaflop / watt e si colloca a 149 nella Top 500. Questo sistema ha 22.440 core Volta (che sembrano essere contati in un modo un po 'diverso nell'elenco rispetto ad alcuni degli altri core.) Nvidia ha avuto un anno molto buono per il suo acceleratore e ha grandi speranze per più macchine che usano Volta Architettura GPU.
Come al solito, i principali fornitori stavano cantando i loro successi nella lista, con Intel che notava che le sue CPU erano in sei dei primi dieci sistemi e un record di 471 su 500 sistemi. Intel ha anche notato che i suoi nuovi processori scalabili Xeon erano in 18 supercomputer con oltre 25 petaflop di prestazioni. Ma ciò che può essere più notevole è che Intel ha affermato che sta annullando Knights Hill, il previsto successore da 10 nm del processore Phn 14em Knights Landing Xeon. La società ha dichiarato che sta pianificando una nuova piattaforma per i sistemi exascale (1.000 petaflop) entro il 2021, ma non ha divulgato alcun dettaglio.
Nvidia ha sottolineato che aveva 34 nuovi sistemi con i suoi acceleratori in lista, portando il totale dell'azienda a 87. Nvidia e il partner IBM stavano discutendo della possibilità che, entro il prossimo elenco a giugno, la macchina Summit a Oak Ridge National Laboratory (ORNL) dovrebbe essere tra le macchine in cima alla lista. Questa macchina presenta 4600 nodi, ciascuno con due CPU di base IBM Power 9 e 6 acceleratori Nvidia Volta, con prestazioni previste di circa 200 petaflop. Ciò differisce dalla soluzione interna di Nvidia, in quanto le CPU e le GPU comunicano tutte su NVLink 2.0 in modo coerente con la cache utilizzando OpenCAPI, in modo che le GPU possano accedere direttamente alla RAM di sistema principale. Il vertice sarà seguito dalla macchina Sierra presso il Lawrence Livermore National Laboratory e dalla macchina AI Bridging Cloud Infrastructure (ABCI) in Giappone.
Ero interessato a sentire Cray annunciare un supercomputer "pronto per la produzione" basato sul processore Cavium ThunderX2 sull'architettura Armv8-A a 64 bit, ora disponibile come parte del suo supercomputer XC50. Le macchine basate su ARM sono in fase di test presso il Supercomputer Center di Barcellona (la cui macchina Mare Nostrum è ora al 16 ° posto nella Top 500), nonché il supercomputer "Post-K" in Giappone e il supercomputer Isambard nel Regno Unito. Cavium aveva alcuni primi benchmark sul ThunderX2, che mostrava che il chip da 14 nm funzionava meglio su applicazioni multi-thread o legate alla memoria rispetto agli Skylake Xeons di Intel, sebbene Intel rimanga il leader nei teraflop a thread singolo e raw. Si noti che oltre al design Cavium, Qualcomm ha anche annunciato un chip server basato su ARM chiamato Centriq.
In altre notizie sui processori, AMD ha annunciato di aver aumentato la produzione dei suoi processori Epyc, anche se questi non sono ancora presenti in alcun sistema Top 500, mentre NEC ha annunciato le versioni della sua scheda acceleratore PCIe Vector Engine per la sua nuova serie di supercomputer TSXASA SX-Aurora, che avere una larghezza di banda di memoria particolarmente veloce.
Dal punto di vista delle interconnessioni, Mellanox ha affermato che il 77 percento dei nuovi sistemi nella Top 500 utilizza InfiniBand, mentre Intel ha propagandato i recenti successi con la sua architettura Omni-Path, utilizzata principalmente nei suoi sistemi Xeon Scalable Processor (Skylake). Nel frattempo, un certo numero di fornitori sta cercando Gen-Z, progettato per essere un approccio incentrato sulla memoria e con latenza inferiore per connessioni ad altissima velocità tra i dispositivi di elaborazione e memoria / archiviazione.
Inoltre, è interessante notare che per la prima volta, tutte le macchine della Top 500 ora eseguono Linux.
Tra la forte prima impressione di PEZY-SC2, la decisione di Intel di scaricare Knights Mill per una nuova architettura, Volta di Nvidia e la nuova concorrenza di AMD, venditori ARM e NEC, ora è un momento emozionante nel mondo del supercalcolo. Le liste del prossimo anno dovrebbero essere piuttosto interessanti, poiché vediamo quali architetture funzionano davvero e quali sono più efficienti, poiché molti dei fornitori e dei siti di supercomputer cercano di posizionarsi nella corsa per produrre un computer exascale (1000 petaflop) con un sub -20 megawatt assorbimento di potenza.
Sei curioso di conoscere la tua velocità Internet a banda larga? Provalo adesso!