Video: Hyperloop, 1200 Km/h - il TAV è superato (Novembre 2024)
La notizia di ieri che il supercomputer cinese Tianhe-2 è ora il più veloce al mondo non è poi così scioccante. Dopotutto, una versione precedente era in cima alla lista dei supercomputer nel 2010.
Ciò che è un po 'più sorprendente è l'architettura dietro il Tianhe-2 (noto anche come Via Lattea-2). Si basa sulla nuova architettura Xeon Phi di Intel, che combina un gran numero di core x86 in un singolo chip; il supercomputer quindi combina quei chip in un'unica architettura. Non ci si aspettava che questo sistema fosse implementato per un altro paio d'anni, quindi sono stato sorpreso di vedere un sistema basato su Xeon Phi in cima alla lista. Quello che trovo più affascinante qui è la competizione con sistemi basati principalmente sul GPU Computing. In effetti, un sistema basato sui core GPU CUDA di Nvidia, che è stato in cima alla lista l'ultima volta, è ora al secondo posto.
L'elenco Top500 dei computer più veloci del mondo esce in genere due volte all'anno: una volta in concomitanza con l'International Supercomputing Conference (ISC) che sta accadendo ora in Germania e ancora alla Supercomputing Conference (SC 13) in autunno.
Il Tianhe-2, che ha sede presso la National University of Defense Technology di Changsha, in Cina, mostra prestazioni sostenute di oltre 33, 8 petaflop (oltre 17.500 trilioni di operazioni in virgola mobile al secondo) e prestazioni di picco di 54, 9 petaflop sul benchmark LINPACK. Questo lo rende circa due volte più veloce del precedente leader, il sistema Titan basato presso il Oak Ridge National Laboratory (ORNL) del Dipartimento dell'Energia degli Stati Uniti. Tianhe-2 ha 16.000 nodi, ciascuno con due processori Intel Xeon E5-2692 (processori a 12 core, che utilizzano Ivy Bridge) e tre processori Xeon Phi per un totale combinato di 3.120.000 core di elaborazione. I core Xeon sono basati su una prossima versione a 12 core della famiglia Xeon # 5-2600, basata sull'architettura Ivy Bridge a 22 nm. Il sistema totale assorbe 17, 8 MW, il massimo di qualsiasi sistema top nella top 500 list, ma poiché i numeri delle prestazioni sono così alti, è ancora considerato relativamente efficiente dal punto di vista energetico. L'elenco di giugno dei supercomputer più efficienti, il Green500, uscirà a breve.
Il sistema Titan di ORNL, in cima alla lista precedente, è ora al secondo posto. Questo si basa su un sistema Cray XK7 con 18.688 nodi, ciascuno contenente un AMD Opteron 6274 a 16 core e un acceleratore GPU (Nvidia Tesla K20x Graphics Processing Unit). Questo sistema mostra prestazioni sostenute di 17, 5 petaflop (oltre 17.500 trilioni di operazioni in virgola mobile al secondo) e prestazioni di picco di oltre 27 petaflop sul benchmark LINPACK. Il sistema Sequoia del Lawrence Livermore National Laboratory, basato sul sistema BlueGene / Q di IBM e le sue CPU di potenza, è arrivato secondo nella lista Top500 un anno fa, ma è scivolato al terzo posto. Il sistema al quarto posto rimane il "computer K" presso il giapponese RIKEN Advanced Institute for Computational Science basato sui processori Fujitsu SPARC64.
I primi quattro sistemi mostrano quattro architetture molto diverse. I grandi sistemi di ferro tradizionali, come quelli basati su BlueGene (Power) di IBM e le architetture SPARC di Fujitsu, sono ancora molto in esecuzione ma la maggior parte dell'attenzione è rivolta alla nuova architettura Xeon Phi di Intel e all'architettura CUDA di Nvidia. Nel frattempo, continuano a esserci storie secondo cui la Cina sta lavorando per creare il proprio processore per il supercalcolo.
Più in dettaglio, Nvidia ha annunciato ieri che i ricercatori dell'Università di Stanford stanno usando le GPU per creare la più grande rete neurale artificiale al mondo progettata per modellare l'apprendimento del cervello umano. Ha anche rivelato che il suo toolkit CUDA ora supporterà piattaforme basate su ARM.
Come parte della conferenza sul supercalcolo, Intel ha anche introdotto nuove versioni della sua famiglia di coprocessori Xeon Phi, tra cui il 7100 con 61 core con clock a 1, 23 GHz, 16 GB di supporto di capacità di memoria e oltre 1, 2 T di prestazioni a doppia precisione; la famiglia Xeon Phi 3100 con 57 core con clock a 1.1GHz e 1TFlops con prestazioni a doppia precisione; e un nuovo 5100D, progettato in modo tale che le prese possano essere collegate a una mini-scheda per l'uso in fattori di forma della lama. Intel afferma che la prossima generazione, nota come "Knights Landing" e basata sulla prossima tecnologia di processo a 14 nm, funzionerà non solo come coprocessore, ma anche come processore principale, eliminando così la complessità dello spostamento dei dati in diversi pool di memoria. Ciò integrerà la memoria del pacchetto per accelerare le prestazioni.
Intel chiama la combinazione dei tradizionali processori Xeon e Xeon Phi "architettura neo-eterogenea". L'architettura hardware ha più classi di capacità di calcolo a cui si accede da un modello di programmazione comune. La società sottolinea che dal momento che è tutto x86 che potrebbe semplificare lo sviluppo e l'ottimizzazione in modi che sarebbero più difficili quando si utilizza una combinazione di CPU e acceleratori GPU. Nvidia e le altre società che spingono il calcolo della GPU non sarebbero d'accordo con tale valutazione.
Intel ha anche parlato dell'utilizzo di elaborazione ad alte prestazioni non solo per usi tradizionali come la ricerca governativa e militare e applicazioni commerciali di fascia alta come la simulazione di petrolio e gas, ma anche per applicazioni come i big data. L'obiettivo è rendere il supercalcolo più mainstream.
Vedi l'elenco completo dei supercomputer Top500 qui.