Casa Lungimiranza I ranghi del supercomputer sono rimasti sostanzialmente invariati, ma restano stretti

I ranghi del supercomputer sono rimasti sostanzialmente invariati, ma restano stretti

Video: Rango di una Matrice e Teorema degli Orlati (Settembre 2024)

Video: Rango di una Matrice e Teorema degli Orlati (Settembre 2024)
Anonim

L'elenco più recente dei supercomputer più veloci del mondo non è cambiato molto, ma lo spettacolo annuale Supercomputing (SC14) ha presentato molte discussioni sui nuovi sistemi nell'elenco, nonché diversi annunci di elaborazione ad alte prestazioni, come i nuovi acceleratori di Intel e Nvidia.

Il supercomputer cinese Tianhe-2, che utilizza CPU Intel Xeon e acceleratori Xeon Phi, è rimasto al primo posto nella lista Top500 con prestazioni di picco di 54, 9 petaflop (quadrilioni di operazioni in virgola mobile al secondo). Quest'anno, infatti, i primi nove sistemi erano identici alla nuova aggiunta al decimo posto: una macchina del sistema governativo statunitense non specificata che è una Cray CS-Storm alimentata da CPU Intel Xeon E5-2660 v2 e GPU Nvidia K40, collegate tramite Infiniband.

Più in basso nell'elenco, c'erano 78 nuovi sistemi, anche se anche questo è un nuovo record basso. E nel complesso, sembra che stiamo assistendo a un rallentamento del tasso di crescita della potenza aggregata dei 500 sistemi.

Le classifiche di questi sistemi si basano sul benchmark LINPACK, anche se ora ci sono una serie di sforzi per creare nuovi benchmark mirati a diversi tipi di elaborazione. Ho trovato interessante il fatto che in un discorso allo show, Horst Simon, editore della lista Top500, abbia detto che nonostante l'obiettivo di raggiungere un computer exascale - 1 exaflop al secondo (circa 1.000 petaflop) - entro il 2020, crede che probabilmente portaci fino alla fine del 2024. In parte ciò è dovuto al fatto che avremo bisogno di più tecniche di risparmio energetico, come la fotonica del silicio, l'integrazione e l'imballaggio 3D, per mantenere la potenza necessaria per un sistema exascale fino a 20 megawatt. Questi sono grandi sistemi.

Nonostante la mancanza di grandi cambiamenti nella parte superiore, abbiamo ascoltato un paio di nuovi annunci, in particolare quelli di Intel e Nvidia, che potrebbero indicare la strada verso macchine più veloci.

Nvidia, il cui linguaggio di programmazione GPU e CUDA ha davvero iniziato il movimento verso acceleratori e coprocessori nel calcolo ad alte prestazioni, è stato presente in tutto lo spettacolo con molti sistemi. Al momento offre l'acceleratore K40 e alla fiera ha annunciato la prossima versione, la Tesla K80, che utilizza un approccio a doppia GPU per offrire ciò che l'azienda afferma è prestazioni quasi due volte superiori e raddoppiare la larghezza di banda della memoria del suo predecessore.

Nvidia afferma che il K80 offre 4.992 core CUDA e 24 megabyte di RAM e ha una capacità di picco di 2, 91 teraflop per scheda. È interessante che il K80 sia ora disponibile e che molti produttori di sistemi stiano già offrendo sistemi con la scheda. Ad esempio, Dell ha mostrato i suoi nuovi server PowerEdge C4130, che consentono di montare fino a quattro schede di accelerazione Nvidia (o acceleratori Intel Xeon Phi) in un server 1U, con la versione K80 che offre fino a 7, 2 teraflop in ogni scatola. È solo una folle quantità di potenza di calcolo in un rack (anche se uno che consumerebbe molta energia e richiederebbe un sacco di raffreddamento).

Nel frattempo, Intel ha annunciato che la prossima versione del suo chip Xeon Phi - una versione nota come Knight's Landing per la quale i primi sistemi commerciali dovrebbero iniziare a essere spediti l'anno prossimo - ora ha più di 50 clienti che pianificano di utilizzare la nuova versione del processore del componente (dove Xeon Phi funge da processore di sistema) nei nuovi supercomputer. Molti altri sistemi utilizzano la versione della scheda PCIe del coprocessore del prodotto.

Tra i clienti di Knights Landing ci sono il supercomputer Trinity, uno sforzo congiunto tra Los Alamos e Sandia National Laboratories, e il supercomputer Cori, annunciato dal centro nazionale di ricerca scientifica (DOE) del Dipartimento dell'Energia degli Stati Uniti. Knight's Landing dovrebbe offrire circa 3 teraflop di prestazioni e integrerà la tecnologia Intel Omni-Path Fabric basata sulla fotonica del silicio, che secondo la società offrirebbe una velocità di linea di 100 Gbps e una latenza del fabric switch inferiore fino al 56% rispetto alle alternative InfiniBand. (Notare che anche i provider InfiniBand stanno parlando anche di nuove versioni.)

Intel ha affermato che il follow-up, noto come Knight's Hill, sarà realizzato utilizzando la tecnologia di processo a 10 nm di Intel e utilizzerà la prossima generazione del tessuto Omni-Path. Seguirà l'atterraggio di Knight, ma i tempi esatti non sono stati resi noti.

Da non lasciare fuori dall'equazione c'è AMD, che ha annunciato e stava mostrando la sua scheda CPU singola FirePro S9150, che secondo lei può offrire 2, 53 teraflop di prestazioni. Questo sistema, programmato con OpenCL, è già in consegna.

In effetti, un nuovo supercomputer chiamato L-CSC dal GSI Helmholtz Center, basato sulle GPU S9150 e sulle CPU 10 core Intel Xeon 2690v2, ha superato la nuova versione dell'elenco Green500, che elenca i supercomputer in ordine di potenza di elaborazione per watt. Ciò ha segnato la prima volta che un sistema è stato in grado di superare 5 gigaflop / watt (miliardi di operazioni al secondo per watt). Nota in quella lista, il secondo sistema era il Suiren, alimentato dagli acceleratori multi-core PEZY-SC e dalle CPU Xeon; mentre il resto della top 10 utilizza GPU Nvidia Tesla, mostrando la gamma di tali sistemi.

Ci sono anche altre opzioni più insolite. Micron sta mostrando il suo chip Automata, essenzialmente un chip per scopi speciali progettato per la corrispondenza dei modelli, per l'uso in cose come la sicurezza della rete e la ricerca genomica. Questo è stato sviluppato in una scheda PCIe 3 con 32 chip ed è previsto per il lancio nel primo trimestre del 2015, inizialmente in volumi bassi. (La società è anche dietro il suo cubo di memoria ibrido per la memoria di prossima generazione per tali sistemi.) IBM ha il suo processore TrueNorth, che spera possa indicare la strada per un "calcolo simile al cervello". NEC sta lavorando alla prossima generazione del suo processore vettoriale SX-ACE, che è più facile da programmare rispetto alle GPU. E, naturalmente, ARM sta cercando di entrare anche nel mercato dei server con X-Gene1 di Applied Micro utilizzato come processore per la connessione a varie schede di accelerazione.

Un certo numero di venditori mostrava nuovi sistemi. Oltre al sistema Dell di cui ho parlato in precedenza, Lenovo ha mostrato un sistema a doppio processore raffreddato ad acqua basato su un processore Intel Xeon E5-2798A personalizzato (con 16 core fino a 3, 2 GHz), che ha dichiarato che fornisce 1.083 teraflop. E ha detto che il processore Knights Landing Xeon Phi del prossimo anno consentirà un sistema "peta-cube" che offre più di un petaflop in soli due rack 42U standard.

I server One Stop hanno mostrato un acceleratore di calcolo ad alta densità, che utilizza PCIe Gen3 per supportare fino a 16 schede acceleratrici di fascia alta da un singolo o più server, con la società che afferma che fornisce fino a 89, 6 teraflop utilizzando schede Tesla K80. Questo può funzionare con il processore Power8 di IBM. Huawei ha mostrato la disponibilità negli Stati Uniti del suo X6800 Data Center Server e una versione raffreddata a liquido del suo server blade FusionServer 9000.

Per collegare i sistemi, Obsidian Technologies ha lanciato l'iniziativa InfiniCortex, progettata per prendere una connessione InfiniBand da 100 Gigabit su lunghe distanze. La società ha annunciato il supporto dell'Agenzia per la scienza, la tecnologia e la ricerca di Singapore (A * STAR). E Mellanox ha mostrato Infiniband da 100 Gigabit che lavora a oltre 100 metri tramite fibra e 8 metri tramite rame.

Per creare i più grandi supercomputer, le organizzazioni in genere si rivolgono ad aziende come IBM e Cray per mettere insieme i sistemi, anche se spesso questi richiedono anni per essere costruiti. Il più grande annuncio di Cray del genere allo show è stato un sistema da 80 milioni di dollari noto come Shaheen II alla King Abdullah University of Science and Technology in Arabia Saudita per un Cray XC40, incluso un dispositivo di analisi dei grafici Urika-GD.

E, ovviamente, poco prima dello spettacolo, il DOE ha assegnato a IBM (e ai fornitori di componenti Nvidia e Mellanox) un enorme contratto per quelli che sarebbero i due più grandi supercomputer del paese, ciascuno con oltre 100 petaflop.

Nota del redattore: questo post è stato aggiornato il 26/11. Il Tianhe-2 ha prestazioni di picco di 54, 9 petaflop, non teraflop.

I ranghi del supercomputer sono rimasti sostanzialmente invariati, ma restano stretti