Video: Генри Маркрам строит мозг в суперкомпьютере (Novembre 2024)
Oggi il governo degli Stati Uniti ha scommesso che i supercomputer più veloci aiuteranno a risolvere alcuni dei più grandi problemi della scienza, con piani per costruire due enormi supercomputer, ognuno dei quali sarebbe più volte più veloce delle macchine più veloci di oggi.
Ciò include 325 milioni di dollari per la costruzione di nuovi supercomputer, tra cui una nuova macchina chiamata Summit presso Oak Ridge National Laboratories (ORNL) e un'altra chiamata Sierra presso Lawrence Livermore National Laboratory (LLNL), oltre a $ 100 milioni per la ricerca e lo sviluppo estremo ridimensionare la tecnologia di supercomputer in un programma chiamato FastForward2. Si prevede che Summit fornirà da 150 a 300 picchi / peta / s di picco (quadrilioni di calcoli in virgola mobile al secondo) e Sierra oltre 100 petaflop / s rispetto ai 54, 9 petaflop / s di picco della macchina più veloce di oggi (la Tianhe-2) sulla strada verso "il calcolo exascale".
Per mettere questo in prospettiva, la potenza di calcolo totale dei sistemi Top500 fino a pochi mesi fa era 274 petaflop / s (una nuova lista Top500 uscirà la prossima settimana in concomitanza con lo spettacolo SuperComputing 14). Entrambi i sistemi saranno realizzati da IBM e saranno basati su CPU IBM Power Architecture, GPU Nvidia Tesla e interconnessioni Mellanox.
Tom Rosamilla, Senior Vice President di IBM Systems & Technology Group, ha descritto i sistemi utilizzando una nuova "architettura incentrata sui dati" progettata per eliminare il più possibile il movimento dei dati, avvicinando i dati al computer. IBM afferma che questo è progettato per fornire modellazione, simulazione, applicazioni e analisi all'avanguardia sui Big Data e sfrutta l'iniziativa OpenPower (di cui Nvidia e Mellanox sono membri).
Come parte di questo, utilizzerà GPU Nvidia Tesla basate sulla sua prossima architettura Volta (prevista per il 2017, seguendo l'architettura Pascal prevista per il 2016) e sulla tecnologia NVLink dell'azienda per le connessioni tra tutti i processori in un singolo nodo server. Sumit Gupta, General Manager di Tesla GPU Accelerated Computing per Nvidia, ha descritto NVLink come "la prima interconnessione ad alta velocità per la GPU", consentendo comunicazioni punto-punto tra una GPU e un'altra GPU, nonché tra GPU e GPU CPU di potenza. (La prima generazione di NVLink è prevista per il 2016; i nuovi sistemi utilizzeranno la seconda generazione.) I nodi all'interno dei sistemi saranno collegati utilizzando la prossima generazione di interconnessione InfiniBand Mellanox EDR 100 Gb / s.
IBM ha affermato che ogni sistema avrà prestazioni di picco "ben oltre 100 petaflop", bilanciato con oltre cinque petabyte di memoria dinamica e flash, e sarà in grado di spostare i dati nel processore a più di 17 petabyte al secondo (che il la società afferma che equivale a spostare oltre 100 miliardi di foto al secondo).
Jeffrey Nichols, direttore di laboratorio associato di Scienze informatiche e computazionali di ORNL, ha descritto l'architettura come "un numero minore di nodi con un ingombro di memoria condivisa molto più grande" e ha affermato che dovrebbe consentire agli sviluppatori di ottimizzare e gestire in modo più efficiente i carichi paralleli attualmente in esecuzione sull'attuale ORNL Sistema Titan. ORNL afferma che il suo sistema Summit includerà più di 3400 nodi con ogni nodo inclusi più processori IBM Power 9 e più GPU Nvidia Volta, con oltre 512 GB di DDR4 e memoria ad alta larghezza di banda (in un design coerente, in modo che possa funzionare con tutto il CPU e GPU) insieme a 800 GB di RAM non volatile, offrendo oltre 40 teraflop di massime prestazioni. Avrà un sistema GPFS Storage Server con larghezza di banda I / O 1 TB / s e 120 PB di capacità del disco. Questo dovrebbe eventualmente sostituire l'attuale sistema Titan di ORNL, che è un sistema Cray basato su processori AMD Opteron e CPU Nvidia Kepler, in grado di supportare 27 petaflop / s, con Nichols che afferma che Summit dovrebbe fornire da 5 a 10 volte le prestazioni di Titan. Il vertice è previsto per essere consegnato nel 2017 e disponibile per gli utenti nel 2018.
Le applicazioni target per il sistema Summit includono la scienza della combustione (cercando di aumentare l'efficienza dei motori a combustione del 25-50 percento), la scienza dei cambiamenti climatici, lo stoccaggio di energia e l'energia nucleare. Nichols ha affermato che il Summit dovrebbe consentire a ORNL di "espandere gli orizzonti" della scienza che stanno facendo nei laboratori.
Il sistema LLNL, chiamato Sierra, è destinato al programma Advanced Simulation and Computing (ASC) della National Nuclear Security Administration (NNSA), progettato principalmente per la scienza e la valutazione delle armi. Secondo Mike McCoy, direttore del programma ASC di LLNL, il supercomputer consente al laboratorio di eseguire simulazioni sulle scorte nucleari del paese senza dover tornare ai test nucleari. Ha detto che il codice di simulazione di armi 3D del laboratorio era "una delle applicazioni più complicate del pianeta". Ha osservato che questo non è il caso del governo che acquista un sistema standard, ma piuttosto un "co-design" in cui programmatori e progettisti di sistemi lavorano insieme sull'architettura.
Entrambi i sistemi, che fanno parte di un programma del Dipartimento dell'Energia noto come Collaboration of Oak Ridge, Argonne e Lawrence Livermore Labs nazionali (CORAL), hanno lo scopo di accelerare lo sviluppo del calcolo ad alte prestazioni. IBM afferma che la programmazione per tali sistemi può iniziare oggi, ma i sistemi non saranno installati fino al 2017 o al 2018. Come parte del programma CORAL, anche Argonne National Lab riceverà nuovi supercomputer ma non lo ha ancora annunciato.
Nel complesso, Nichols ha affermato di aver visto Summit e Sierra come "primi passi verso l'exascale" e ha affermato che non vedeva l'ora di sistemi futuri lungo lo stesso percorso architettonico e sperava in una lunga collaborazione con i venditori. Circa cinque anni dopo la consegna del Summit, ha detto, spera di avere un computer exascale.
Inoltre, oggi AMD ha annunciato di aver ricevuto $ 32 milioni in due premi DOE, nell'ambito del progetto FastForward2, per ricercare l'architettura dei nodi exascale basata sulle sue unità di elaborazione accelerata (APU) basate sull'Heterogeneous System Architecture (HSA) e per aiutare a progettare un nuovo standard per future interfacce di memoria. DOE ha dichiarato che AMD, Cray, IBM, Intel e Nvidia guideranno i progetti FastForward2. (Intel e Cray non sono coinvolti con i supercomputer annunciati oggi ma continuano ad essere grandi protagonisti nello spazio, quindi sarà interessante vedere se sono coinvolti nei piani di Argonne.)