Casa Lungimiranza Il vertice di calcolo aperto mostra enormi innovazioni hardware

Il vertice di calcolo aperto mostra enormi innovazioni hardware

Video: What's inside a Facebook Datacenter Open Compute Rack? (Settembre 2024)

Video: What's inside a Facebook Datacenter Open Compute Rack? (Settembre 2024)
Anonim

Forse la tendenza più interessante nell'hardware dei computer oggi è il progetto Open Compute e gli sforzi che sta compiendo per passare a standard comuni ed efficienti per le apparecchiature dei data center, piuttosto che all'hardware e software proprietario che abbiamo oggi. Quando abbiamo sentito parlare per la prima volta di Open Compute, è sembrato un buon modo per le aziende Web su larga scala progettare server più efficienti dal punto di vista energetico e più facili da mantenere. Ma da allora, Open Compute è cresciuto fino a comprendere molte altre forme di hardware, dallo storage alla rete, e sta diventando applicabile al computing aziendale, non solo alle società di software cloud.

Tutto ciò è stato abbastanza evidente al vertice del progetto Open Compute della scorsa settimana, in cui una serie di aziende ha introdotto un nuovo hardware progettato per funzionare con l'hardware e le specifiche Open Compute, dai server alle reti.

"Nel 2011 abbiamo piantato alcuni semi", ha detto Frank Frankovsky, che presiede la Fondazione OCP, aprendo il vertice. "Cosa succederebbe se applicassimo principi open source allo spazio hardware? Il lavoro che stiamo facendo insieme sta fondamentalmente trasformando il settore".

Nuovi chip e specifiche Push Server basati su ARM

Alcune cose annunciate durante la settimana si sono distinte. La maggior parte dei server, nel mondo reale e nel progetto Open Compute, si basa sui processori Intel Xeon e sull'architettura x86. Anche se è improbabile che ciò cambi presto in qualsiasi momento, concorrenti come ARM e AMD avevano alcune alternative interessanti.

AMD ha annunciato la sua prima CPU server basata su ARM a 64 bit, la Opteron A1100 Series a 28 nm (nome in codice Seattle), che Andrew Feldman, direttore generale e vicepresidente aziendale, dichiarerà che campionerà i clienti "entro poche settimane", anche se è non dovrebbe essere ampiamente disponibile fino alla fine dell'anno. L'A1100 include processori ARM Cortex-A57 a 4 o 8 core, fino a 4 MB di L2 condivisi e 8 MB di cache L3 condivisa, doppi canali di memoria DDR3 o DDR4 con ECC, ARM TrustZone per la sicurezza e coprocessori per crittografia e dati compressione.

Feldman ha parlato di un kit di sviluppo serie A con processore A1100 e ha affermato che la società ha lavorato a stretto contatto con il gruppo Linaro Enterprise e i fornitori di software per sviluppare un sistema operativo Linux compatibile basato su Fedora di Red Hat, stack LAMP ottimizzato, supporto Java e altro software tra cui applicazioni, hypervisor, compilatori e simulatori. Feldman ha mantenuto un piccolo design di micro-server, utilizzando AMD Opteron A-Series e le specifiche di slot comuni del progetto Open Compute Project per schede madri note come "Group Hug", e ha annunciato che la società stava contribuendo al progetto in modo che le aziende hardware potessero iniziare a costruire server basati su di esso.

Mentre Feldman ha affermato che AMD è impegnato in x86 e ARM, ha fortemente suggerito che il futuro del data center punta verso server basati su ARM. "Nella storia dei computer hanno sempre vinto CPU più piccole, a basso costo e di volume maggiore", ha affermato Feldman. "Non c'è eccezione a questo." Ha notato che l'anno scorso sono state spedite 8 miliardi di CPU ARM rispetto a 13 milioni di CPU server x86. (Questo sembra un confronto sciocco poiché include CPU ARM utilizzate in tutti i tipi di applicazioni non di data center ma esclude gli x86 utilizzati in tutto tranne che nei server.) Feldman ha previsto che entro il 2019, ARM controllerà un quarto del mercato dei server e personalizzato I SoC ARM saranno la norma per i grandi data center mentre le CPU x86 più piccole ed efficienti domineranno il mercato dei server x86.

Sempre dal punto di vista dei chip, Applied Micro ha affermato che il suo X-Gene 2 campionerà questa primavera con quella che secondo l'azienda sarà la prima implementazione ARMv8 progettata per i server. Feldman ha anche affermato che questo sarà seguito l'anno prossimo da un X-Gene 3 con 16 o più core ARM realizzati su un processore FinFET.

Una preoccupazione che alcune persone hanno avuto sui server basati su ARM è la frammentazione. Per contrastare questo, Ian Drew, vicepresidente esecutivo per lo sviluppo aziendale e Chief Marketing Officer di ARM, ha annunciato una nuova architettura di base del sistema server. L'idea è di avere una specifica hardware di base per gli sviluppatori di sistemi operativi e firmware e una singola immagine del sistema operativo per tutti i server basati su ARMv8-A. "È una specifica hardware che è stata scritta da ragazzi hardware e ragazzi software insieme", ha detto Drew. Ha osservato che questa non è una standardizzazione in cui tutti saranno monolitici ma è invece progettata in modo tale che la differenziazione avvenga al livello giusto al momento giusto.

Drew ha affermato che ARM vuole assicurarsi che tutti siano d'accordo, quindi è pubblicamente disponibile sul sito web ARM. Ha il supporto degli OEM e di numerosi partner di semiconduttori, tra cui AMD, Applied Micro, Broadcom e Cavium.

Microsoft si unisce a OCP

Microsoft ha dichiarato di aderire a OCP e di fornire un set completo di specifiche per i server che supportano Office 365, Windows Azure e Bing. Il vicepresidente aziendale Bill Laing ha affermato che la società vuole promuovere l'innovazione nei data center cloud. Questo design iniziale è molto diverso dal rack standard da 21 pollici originariamente fornito da Facebook, che finora ha definito gran parte dei server Open Compute. Invece è uno chassis 12U che si inserisce in un rack standard con un blade di elaborazione, un blade di archiviazione, un backplane condiviso, alimentazione e raffreddamento condivisi e un nodo di gestione.

Laing ha affermato che questi design possono essere pre-assemblati e avere un'integrazione minima in loco, poiché i vassoi completi possono essere rimossi e sostituiti. Rispetto a un server aziendale tradizionale, ha affermato che questo design offre un risparmio sui costi fino al 40 percento, un aumento dell'efficienza energetica fino al 15 percento e un miglioramento del 50 percento nei tempi di distribuzione e assistenza. L'idea è quella di consentire ai clienti di ottenere gli stessi vantaggi e "portare avanti il ​​cloud computing proprio come abbiamo trasformato il data center aziendale".

Microsoft gestisce oltre 200 servizi cloud a livello globale, servendo oltre 1 miliardo di clienti e oltre 20 milioni di aziende in oltre 90 mercati e attualmente implementa oltre 1 milione di server nei suoi data center, ha affermato Laing.

Apri calcolo aggiunge rete

Un nuovo progetto è il networking, che è stato lanciato ufficialmente lo scorso maggio. "È un po 'strano che l'open source abbia avuto un impatto straordinariamente positivo su software, server, data center e storage e abbiamo queste isole di tecnologia open source realizzate con amore, ma ciò che collega queste isole è ancora una scatola nera proprietaria", Disse Frankovsky. "Così abbiamo deciso di aprire quella scatola nera e offrire ai clienti flessibilità e scelta nella loro rete e trasparenza. Le stesse cose che attraggono le persone al software open source sono ciò che ci attrae all'hardware open source. È quella naturale curiosità umana su come funziona questo lavoro e come funzionerebbe diversamente se lo smontassi e lo mettessi di nuovo nel modo in cui voglio rimetterlo insieme?"

In pochi mesi, ha affermato, l'OCP aveva ricevuto contributi da Broadcom, Intel, Mellanox, Big Switch e Cumulus Networks.

Mentre diverse aziende hanno parlato di switch top-of-rack non proprietari, sono rimasto incuriosito dal vedere Dell annunciare un accordo con Cumulus Networks in base al quale la società hardware rivenderebbe il software di rete basato su Linux di Cumulus su una rete conforme a OCP hardware.

Altre interessanti novità hardware durante lo spettacolo includevano l'annuncio di Seagate che stava contribuendo con la sua piattaforma di archiviazione Kinetic a OCP, che consente alle applicazioni di connettersi allo storage direttamente su Ethernet anziché passare attraverso i server di archiviazione tradizionali.

Ottimizzazione dell'infrastruttura full-stack di Facebook

Dato il suo ruolo chiave nel lancio di Open Compute, non sorprende che Facebook sia uno dei leader nell'adozione della maggior parte delle tecnologie. Jay Parikh, vicepresidente delle infrastrutture di Facebook, ha fatto una presentazione sul "perché tutte le cose che Facebook sta facendo con le infrastrutture contano davvero". All'inizio, il team delle infrastrutture di Facebook si è concentrato sul mantenimento delle cose, ha affermato Parikh. Ma mentre continuava a crescere, il team ha rapidamente raggiunto i limiti di hardware e software. Hanno avuto alcuni "fallimenti spettacolari", ha detto, ma nel processo hanno appreso una cosa di base: su larga scala, tutti i tuoi problemi sono ingigantiti.

Lungo la strada hanno creato un nuovo design di server che era più economico ed efficiente dal punto di vista energetico e ha reso più semplice la gestione e la riparazione dei server. Oggi Facebook ha un data center personalizzato con rack personalizzati, server di elaborazione e archiviazione e reti.

"Nel corso del tempo siamo stati costretti a prendere il controllo di ogni parte dello stack perché dovevamo tenere il passo con la crescita", ha detto Parikh. Ha parlato del concetto di "ottimizzazione dell'infrastruttura full stack", inclusi software, reti, server e archiviazione. Ora la società utilizza solo hardware Open Compute Project. "Stiamo effettivamente risparmiando un sacco di soldi", ha detto. Negli ultimi tre anni, l'ottimizzazione dello stack completo ha consentito a Facebook di risparmiare oltre $ 1, 2 miliardi.

Parikh ha quindi fornito un aggiornamento sulla cella frigorifera di Facebook. Ha detto che la prima nuova struttura di conservazione frigorifera della società, con una capacità di 30 petabyte, è diventata attiva e una seconda sarà presto online, portando la capacità di archiviazione totale a "ben oltre 100 petabyte" nei prossimi mesi. Ogni struttura è progettata per memorizzare un massimo di tre exabyte, quindi c'è molto spazio per la crescita.

Per la prima volta Parikh ha mostrato un prototipo del server di archiviazione di Facebook che utilizza dischi Blu-ray (un'idea di cui la società ha parlato al summit dello scorso anno). Il server cabinet contiene 10.000 dischi Blu-ray per un totale di 1 petabyte di spazio di archiviazione e Facebook ha in programma di aumentare la densità a 5 petabyte per rack. Rispetto all'attuale sistema di celle frigorifere basato su disco rigido, i server Blu-ray potrebbero dimezzare i costi e ridurre il consumo di energia dell'80%, ha affermato Parikh. Facebook prevede di testare un sistema di produzione entro la fine dell'anno e utilizzerà i server Blu-ray per l'archiviazione a freddo di foto e video di utenti con accesso raro.

Open Compute e aziende più piccole

Una delle cose che mi ha incuriosito di più dal vertice è stata l'indicazione che non erano solo le aziende su scala cloud come Facebook, Rackspace e Microsoft ad abbracciare il concetto. Invece, Frankovsky ha indicato che i clienti di grandi aziende come Bloomberg, Fidelity e Goldman Sachs sono in procinto di implementare Open Compute.

È interessante il fatto che ora ci sono più modi per utilizzare componenti rack standard da 19 pollici con un contenitore Open Rack da 21 pollici e viceversa. Ad esempio, Frankovsky ha sottolineato che Fidelity è arrivato con un Open Bridge Rack in un rack EIA standard in un Open Rack. Hyve Solutions ha preso alcune schede di sistema Open Compute e le ha reimballate in vassoi standard da 19 pollici e ha contribuito a riportare il progetto alla fondazione.

In una tavola rotonda, Marc Andreessen, cofondatore e socio generale di Andreessen Horowitz, e Andy Bechtolsheim, fondatore, direttore dello sviluppo e presidente di Arista Networks, hanno parlato di come la tendenza verso data center meno costosi stia cambiando le attività.

Andreessen ha affermato che esiste ora una radicale opportunità di combinare software open source e hardware open source ad alto volume per ridurre significativamente il costo dei sistemi e fornire servizi basati su cloud in settori come l'assistenza sanitaria e l'istruzione. Le nuove aziende possono girare quasi interamente sul cloud, quindi di conseguenza $ 500.000 ora acquistano una startup due anni di passerella per lanciare un prodotto. Mentre Facebook (Andreessen è sul tavolo) ha ora un grande budget di capitale, ha detto, se fosse esistito nel 1999, avrebbe richiesto un budget di capitale da 50 a 100 volte più grande di quello che è ora, forse spendendo $ 100 miliardi all'anno in capitale attrezzatura, che è impossibile. Lo sviluppo di hardware a basso costo e di volume maggiore è ciò che rende possibili servizi come Facebook o Google. Se proietti in avanti altri 10 anni, ha detto, i servizi che saranno possibili saranno strabilianti.

"Tutta la crescita è nel cloud", ha affermato Bechtolsheim, con la spesa IT tradizionale piatta o in calo. Arista Networks sta sviluppando apparecchiature di rete che soddisfano le esigenze di questi data center su scala cloud. Ha detto che ha molto senso standardizzare l'hardware di rete. Fino all'arrivo dell'Open Compute Project, ha affermato Bechtolsheim, l'industria non ha mai avuto un forum per l'innovazione aperta e collaborativa dell'hardware. Ora, sebbene ci siano ancora alcune aziende che producono i propri chip, e crede che sia un modello legacy. Il vantaggio della rete è che è necessario uno stack software che funzioni davvero. L'hardware è semplice, il software è difficile, ha detto, motivo per cui Arista ha un team di software molto più grande.

Bechtolsheim ha affermato che l'arrivo dell'elaborazione a 64 bit e dei SoC ARM con frequenze più alte (almeno 2 GHz) è ciò che renderà ARM possibile nel data center. È probabile che accada quando ha senso, ha detto. Ha anche affermato che "a difesa di Intel" ha svolto un lavoro straordinario sfruttando la sua tecnologia di processo per fornire processori sever più efficienti dal punto di vista energetico e meno costosi. Intel è un formidabile concorrente qui e hai bisogno di competizioni per continuare l'innovazione, ha affermato. Al ritmo attuale dei progressi, il data center che costa oggi $ 1 miliardo costerà solo $ 10.000 in un decennio. Ciò consentirà la prossima generazione di applicazioni.

Per contribuire a rendere i prodotti Open Compute più ampiamente accettati, Frankovsky ha annunciato un diverso tipo di licenza tecnologica che assomiglia di più a GPL, quindi qualsiasi lavoro derivato verrà restituito alla fondazione, così come la certificazione hardware Open Compute che utilizza nuovi laboratori a Taiwan e presso il Università del Texas a San Antonio.

Il vertice di calcolo aperto mostra enormi innovazioni hardware