Casa Lungimiranza Processori mobili del 2018: l'ascesa delle funzionalità di apprendimento automatico

Processori mobili del 2018: l'ascesa delle funzionalità di apprendimento automatico

Sommario:

Video: The Rise of Machine Learning (ft. Martin Jaggi) (Settembre 2024)

Video: The Rise of Machine Learning (ft. Martin Jaggi) (Settembre 2024)
Anonim

Non sorprende che gli smartphone di quest'anno siano dotati di processori più veloci di quelli dell'anno scorso, cosa che accade ogni anno. Ma la novità di quest'anno è la predominanza delle funzionalità di machine learning che quasi tutti i produttori di processori stanno promuovendo come un modo per differenziare i loro dispositivi. Questo è vero per i venditori di telefoni che progettano i propri chip, i venditori di chip indipendenti o commerciali che vendono processori ai venditori di telefoni e persino i produttori di IP che progettano i core che vanno nei processori stessi.

sfondo

Prima di tutto un po 'di storia: tutti i moderni processori di applicazioni includono progetti (spesso indicati come proprietà intellettuale o proprietà intellettuale) di altre società, in particolare aziende come ARM, Imagination Technologies, MIPS e Ceva. Tale IP può apparire in varie forme: ad esempio, ARM vende di tutto, da una licenza di base per la sua architettura a 32 e 64 bit, a core specifici per CPU, grafica, elaborazione delle immagini, ecc. Che i progettisti di chip possono quindi utilizzare per creare processori. In genere, i progettisti di chip mescolano e abbinano questi core con progetti propri e fanno varie scelte in merito a memoria, interconnessioni e altre funzionalità, nel tentativo di bilanciare le prestazioni con requisiti di alimentazione, dimensioni e costi.

Sul fronte della CPU, la maggior parte dei chip ha una combinazione di core più grandi che sono più potenti e funzionano più velocemente e più caldi e core più piccoli che sono più efficienti. In genere, i telefoni utilizzeranno i core più piccoli per la maggior parte del tempo, ma per le attività più impegnative passeranno ai core con prestazioni più elevate e utilizzeranno una combinazione di core e GPU e altri core per gestire al meglio le esigenze prestazionali e le considerazioni termiche (non è possibile far funzionare i core ad alte prestazioni per molto tempo, perché si surriscalderebbero e di solito non è necessario). Gli esempi più noti per i core più grandi sono i core Cortex-A75 e A73 di ARM; i nuclei più piccoli corrispondenti sarebbero la A55 e la A53. Nei telefoni di fascia alta di oggi, ne vedrai spesso quattro, in quello che è noto come un layout octa-core, anche se alcuni fornitori hanno adottato altri approcci.

Per quanto riguarda la grafica, c'è più diversità, con alcuni fornitori che scelgono la linea Mali di ARM, altri che scelgono PowerVR di Imagination Technologies e altri ancora che scelgono di progettare i propri core grafici. E c'è ancora più diversità quando si tratta di cose come l'elaborazione delle immagini, l'elaborazione del segnale digitale e, di recente, le funzioni AI.

Mela

Apple ha iniziato a spingere le sue capacità di intelligenza artificiale nei suoi annunci telefonici autunnali, tra cui in particolare il chip "A11 Bionic" utilizzato in iPhone 8 e 8 Plus, nonché iPhone X.

A11 Bionic è un'architettura a sei core, con due core ad alte prestazioni e quattro core di efficienza. Apple progetta i propri core (con una licenza di architettura ARM) e tradizionalmente ha migliorato le prestazioni a thread singolo. Questo è un passo in avanti rispetto alla A10 Fusion a quattro core e Apple ha affermato che i core prestazionali nella A11 sono fino al 25 percento più veloci rispetto alla A10, mentre i quattro core di efficienza possono essere fino al 70 percento più veloci del chip A10 Fusion. Ha anche affermato che il processore grafico è fino al 30 percento più veloce.

Apple parla del chip con un "Neural Engine" dual-core, che può aiutare con il riconoscimento delle scene nell'app della fotocamera, e Face ID e Animoji su iPhone X. La società ha anche rilasciato un'API chiamata CoreML, per aiutare terze parti gli sviluppatori creano applicazioni che ne approfittano.

In genere Apple non fornisce molte informazioni sui suoi processori, ma afferma che il motore neurale A11 Bionic è un design dual-core in grado di eseguire fino a 600 miliardi di operazioni al secondo per l'elaborazione in tempo reale.

A differenza della maggior parte degli altri produttori di processori, Apple non integra il modem nei suoi processori applicativi e utilizza invece modem Qualcomm o Intel stand-alone. Ci sono state alcune controversie sul fatto che Apple supporti solo le funzionalità dei suoi modem Qualcomm supportate anche da Intel; in pratica, ciò significa che gli iPhone supportano l'aggregazione dei gestori a 3 vie ma non alcune delle funzionalità più avanzate.

Huawei

Huawei è stato anche presto alla spinta dell'intelligenza artificiale e ha chiamato il suo Kirin 970, che ha annunciato allo show IFA lo scorso autunno, "la prima unità di elaborazione AI mobile al mondo". Il Kirin 970 è attualmente utilizzato nell'Huawei Mate 10. Include quattro core CPU Cortex-A73 che funzionano fino a 2, 4 GHz e quattro A53 che funzionano fino a 1, 8 GHz, insieme alla GPU Mali G72 MP12 di ARM.

Ciò che è particolarmente nuovo nel 970 è ciò che Huawei chiama NPU, o unità di elaborazione neurale. La società ha affermato che le attività che possono essere scaricate su questo processore possono vedere 25 volte le prestazioni e 50 volte l'efficienza rispetto a quelle in esecuzione sul cluster di CPU. Ciò è mirato in particolare a un riconoscimento più rapido delle immagini e una migliore fotografia. Allo show, Huawei ha affermato che il telefono è in grado di elaborare 1.92 TeraFLOP a 16 bit.

Il Kirin 970 ha un processore di segnale a doppia immagine, un modem LTE di categoria 18 con aggregazione di 5 portatori e MIMO 4 per 4 che dovrebbe consentire una velocità massima di download di 1, 2 Gbps.

Al Mobile World Congress, Huawei ha annunciato il suo primo modem 5G, il Balong 5G01, che secondo lui sarebbe stato il primo modem 5G ad essere spedito. Sembra probabile che anche alcuni futuri processori applicativi adotteranno questo modem, ma questo non è stato ancora annunciato. Tecnicamente, tutti questi prodotti sono creati dalla filiale HiSilicon dell'azienda.

Qualcomm

Il chip probabilmente al centro della maggior parte dei telefoni Android di punta negli Stati Uniti quest'anno è lo Snapdragon 845 di Qualcomm. Questo è un aggiornamento dello Snapdragon 835, che è stato utilizzato nella maggior parte dei telefoni Android premium del 2017 ed è già utilizzato in le versioni nordamericane del Galaxy S9.

Come con la maggior parte degli altri fornitori, Qualcomm sta spingendo le reti neurali e l'intelligenza artificiale come una delle maggiori aree di miglioramento nel chip di quest'anno, insieme a una maggiore attenzione alla "immersione", che essenzialmente significa una migliore imaging.

Nell'area AI, Qualcomm ama parlare di avere un Neural Processing Engine (NPE) multi-core, che utilizza una nuova versione del suo DSP Hexagon, nonché la CPU e la GPU per inferire.

Il chip ha il DSP Hexagon 685, che secondo Qualcomm può più che raddoppiare le prestazioni di elaborazione AI; una CPU Kryo 385, che fornisce un aumento delle prestazioni dal 25 al 30 percento per i suoi core prestazionali (quattro core ARM Cortex-A75 fino a 2, 85 GHz) e un aumento delle prestazioni fino al 15 percento per i suoi "core di efficienza (quattro Core Cortex-A55 fino a 1, 8 GHz), tutti con condivisione di una cache L3 da 2 MB e una GPU Adreno 630, che Qualcomm sostiene supporterà un miglioramento delle prestazioni del 30 percento o una riduzione della potenza del 30 percento, nonché fino a 2, 5 volte display più veloci.

Nell'area AI, il chip supporta un gran numero di diversi framework di machine learning e l'azienda afferma che funziona per cose come la classificazione degli oggetti, il rilevamento del volto, la segmentazione delle scene, il riconoscimento degli altoparlanti, ecc. Due applicazioni evidenziate sono effetti bokeh dal vivo (per la produzione di ritratti con uno sfondo sfocato) e il rilevamento della profondità attivo e la luce strutturata, che dovrebbero consentire un migliore riconoscimento del volto. Spostando l'inferenza dal cloud al dispositivo, Qualcomm afferma di ottenere i vantaggi di bassa latenza, privacy e affidabilità migliorata.

Nell'area di imaging, il chip ha una nuova versione dell'ISP Spectra di Qualcomm, una migliore acquisizione video Ultra HD con riduzione del rumore multi-frame, la possibilità di catturare video da 16 megapixel a 60 frame al secondo e video slow-motion 720p a 480 fotogrammi al secondo. Per la realtà virtuale, l'845 supporta display con una risoluzione di 2K per 2K a 120 fotogrammi al secondo, un grande passo in avanti rispetto a 1, 5 K per 1, 5 K a 60 fotogrammi al secondo supportati dall'835.

Altre caratteristiche includono un'unità di elaborazione sicura, che utilizza il proprio core per archiviare le informazioni di sicurezza al di fuori del kernel e funziona con la CPU e la funzionalità TrustZone di Qualcomm.

L'845 integra il modem X20 introdotto da Qualcomm lo scorso anno, in grado di supportare la categoria LTE 18 (con velocità fino a 1, 2 Gbps), fino a 5 aggregazioni di carrier e MIMO 4X4, e utilizza tecniche come l'accesso con licenza per accelerare velocità possibili in più aree.

Il chip è prodotto con processo a bassa potenza da 10 nm di Samsung.

Qualcomm produce anche la famiglia di processori per applicazioni Snapdragon 600, guidata dalla 660, utilizzata da molti fornitori cinesi, tra cui Oppo e Vivo. In vista del Mobile World Congress, ha introdotto la famiglia Snapdragon 700, che ha molte delle stesse caratteristiche della famiglia 800, tra cui DSP Hexagon, ISP Spectra, grafica Adreno e CPU Kryo. Rispetto al 660, Qualcomm afferma che offrirà un miglioramento 2x nelle applicazioni AI sul dispositivo e un miglioramento del 30 percento nell'efficienza energetica.

Samsung

Mentre utilizza processori Qualcomm nella maggior parte dei suoi telefoni nordamericani, in molti altri mercati, Samsung utilizza i propri processori Exynos e sta iniziando a rendere tali processori disponibili per altri produttori di telefoni.

Il suo nuovo top di gamma è Exynos 9810, che Samsung utilizzerà nelle versioni internazionali del Galaxy S9 e S9 +.

Ancora una volta, Samsung sta spingendo nuove funzionalità per "software basato sull'apprendimento profondo", che sostiene aiuta il processore a identificare con precisione oggetti o persone nei telefoni e supporta il rilevamento della profondità per il riconoscimento facciale.

Il 9810 è anche un chip octa-core, con quattro core A55 per l'efficienza energetica e quattro design CPU personalizzati per le prestazioni. Samsung afferma che questi nuovi core, che possono funzionare fino a 2, 9 GHz, hanno una pipeline più ampia e una memoria cache ottimizzata, offrendo loro il doppio delle prestazioni single-core e il 40% in più di prestazioni multi-core rispetto al suo predecessore, l'8895 dell'anno scorso. I benchmark pubblicati mostrano miglioramenti nel mondo reale, ma non tanto quanto affermato; rimango scettico su tutti i benchmark mobili a questo punto.)

Altre caratteristiche includono la grafica Mali-G72 MP18, il supporto per display fino a 3840 per 2400 e display 4096 per 2160, un processore di segnale a doppia immagine (ISP) e il supporto per l'acquisizione 4K a 120 frame al secondo. Il 9810 ha anche un modem di Categoria 18 con aggregazione di 6 carrier e MIMO 4 per 4 per downlink (2 CA per uplink), con una velocità di downlink massima di 1, 2 Gbps e upload di 200 Mb. Sulla carta, questo corrisponde ai modem di Categoria 18 che sia Qualcomm che Huawei hanno nei loro attuali chip migliori. Come lo Snapdragon 845, è prodotto secondo il processo FinFET 10nm di seconda generazione di Samsung.

MediaTek

MediaTek è stato più un giocatore nei telefoni di fascia media e inferiore, e il mese scorso ha introdotto un nuovo chip chiamato Helio P60 destinato al mercato "New Premium" - telefono di fascia media nella gamma $ 200- $ 400 che offre tutto il caratteristiche di base dei telefoni di fascia alta. Il primo telefono annunciato che utilizzerà questo chip è l'Oppo R15.

Il principale processore dell'azienda, annunciato lo scorso anno, è l'Helio X30, che è un processore deca-core destinato ai telefoni premium. Ciò include due core CPU Cortex-A73 che funzionano fino a 2, 5 GHz, quattro core Cortex-A53 che funzionano fino a 2, 2 GHz e quattro core A35 che possono funzionare fino a 1, 9 GHz, insieme alla grafica PowerVR Series 7XT Plus di Imagination su 800 GHz e un modem LTE categoria 10 in grado di aggregare 3 carrier sul downlink. È un chip interessante, prodotto sul processo a 10 nm di TSMC, e spinge l'idea che più core possano essere più flessibili. Tra i telefoni annunciati che usano questo sono il Meizu Pro 7 Plus con doppio schermo e il Vernee Apollo 2 (fotocamera frontale da 8 MP, fotocamere posteriori da 16 MP + 13 MP).

L'anno scorso MediaTek ha annunciato due processori di fascia media, Helio P23 e P30, rivolti in particolare ai mercati globali e alla Cina, ciascuno con otto core Cortex-A53 a 2, 53 GHz e grafica Mali G71 MP2. Questi sono i chip che il P60 è progettato per sostituire e offrono più potenza e consentono una serie di nuove funzionalità.

Il P60 offre maggiori prestazioni ed è un ritorno al grande. Piccola configurazione ARM e MediaTek spinti negli anni precedenti, combinando quattro dei più potenti ARM Cortex-A73 fino a 2, 0 GHz con quattro dei più efficienti Cortex-A53 core, anche a 2, 0 GHz. A questi si aggiunge una GPU ARM Mali G72 NMP3 fino a 800 MHz e sono tutti controllati dalla quarta versione della tecnologia CorePilot di MediaTek per la pianificazione in cui vengono eseguite le attività. Rispetto a P23 e P30, MediaTek afferma che il P60 offre un miglioramento delle prestazioni del 70 percento nelle operazioni CPU e GPU.

Anche MediaTek sta salendo sul carro dell'IA, con il P60 che include la sua piattaforma NeuroPilot per l'accelerazione dell'hardware della rete neurale. Questo supporta Google Android Neural Network (NN) e i comuni framework AI, tra cui TensorFlow, TensorFlow Lite, Caffe e Caffe 2. Questo è effettivamente un processore di segnale digitale specializzato in grado di 280 GMAC (miliardi di operazioni di accumulo multiplo al secondo). È progettato per essere utilizzato per cose come il riconoscimento facciale per sbloccare un telefono (qualcosa che abbiamo visto finora nei telefoni di fascia alta ma non per i telefoni di fascia media) e il riconoscimento degli oggetti, anche nei video, a 60 fotogrammi al secondo.

Inoltre, il P60 ha una serie di nuove funzionalità di immagine, tra cui tre processori di sensori di immagine che possono supportare una configurazione a doppia fotocamera di sensori da 16 e 20 MP o una singola fotocamera fino a 32 MP. (Non ho ancora visto un telefono in produzione con un sensore della fotocamera con così tanti megapixel ma presumibilmente stanno arrivando.) Questi sensori aggiungono funzionalità di riduzione del rumore, insieme al bokeh in tempo reale (la sfocatura dello sfondo utilizzata nelle modalità ritratto).

Il chip include un modem che supporta download di Categoria 7 (fino a 300 Mbps) e upload di Categoria 13 (fino a 150 Mbps con 2 aggregazioni di carrier). È prodotto con il processo FinFet a 12 nm di TSMC, che secondo l'azienda aiuta a garantire un risparmio energetico del 25 percento per applicazioni ad alta intensità di energia come giochi e un risparmio complessivo del 12 percento.

Spreadtrum

Spreadtrum, che produce modem venduti principalmente sul mercato cinese, ha annunciato una partnership con Intel che utilizzerà il modem Intel 5G e CPU compatibili ARM. Mancano ancora un paio d'anni, quindi i dettagli non sono ancora disponibili.

Si noti che mentre Spreadtrum non è molto visibile negli Stati Uniti, trascina solo Qualcomm e MediaTek nel mercato commerciale dei processori di applicazioni. Vende principalmente prodotti con CPU ARM e un proprio modem 4G, ma ha un accordo con Intel ed è di proprietà di minoranza. Ciò ha comportato un chip con CPU Intel e modem Spreadtrum (l'opposto del nuovo annuncio).

BRACCIO

Naturalmente, non sono solo i chipmaker che vedono l'IA come la prossima grande ondata, e anche le aziende che fanno l'IP hanno fatto una grande spinta in questo settore.

ARM, il maggior successo dei produttori di IP, il mese scorso ha annunciato una suite di IP per l'apprendimento automatico, che comprende sia hardware che software, e ha spinto questo al Mobile World Congress.

Soprannominato Trillium Project, include i progetti di processori (IP) sia per Machine Learning (ML) che Object Detection (OD), insieme a una nuova libreria software.

Il processore ML è progettato per essere inserito in un processore applicativo ed essere eseguito accanto a CPU, GPU e display core. La libreria software, nota come ARM NN (rete neurale), è progettata per supportare framework come TensorFlow, Caffe e Android NN. Ciò consente a queste applicazioni di funzionare solo tramite software su processori esistenti con CPU e grafica ARM; sebbene, naturalmente, verrà accelerato considerevolmente quando eseguito su processori che includono i core ML. Il software di terze parti funzionerà anche sul core del processore. ARM afferma che il core ML è stato progettato da zero appositamente per eseguire reti neurali. Può eseguire sia applicazioni a 8 che a 16 bit, sebbene la tendenza sia quella di concentrarsi su 8 bit per semplicità.

Il processore OD è progettato per sedersi accanto a un processore di segnale di immagine (ISP), al fine di fornire il rilevamento di oggetti a bassa potenza, in particolare per applicazioni come il rilevamento del volto e il movimento di localizzazione. Questo è un blocco hardware dedicato progettato per essere utilizzato con nuove tecnologie di sensori come le fotocamere stereoscopiche.

ARM ha affermato che il nuovo IP sarà disponibile per l'anteprima degli sviluppatori ad aprile e sarà generalmente disponibile entro la fine dell'anno, ma dato un tipico ciclo temporale è improbabile che i nuovi core del processore appaiano nei chip fino al 2019 o successivamente. Ovviamente, il software, che funziona su core esistenti, potrebbe essere implementato molto prima.

ARM ha anche spinto alcune nuove soluzioni per l'Internet of Things, tra cui una nuova soluzione SIM chiamata Kigen, progettata per essere costruita all'interno di SoC per dispositivi a basso consumo per sostituire le attuali schede SIM fisiche.

Tecnologie di immaginazione

L'immaginazione, nota per la sua grafica PowerVR, ha annunciato lo scorso autunno il suo IP di rete neurale, il PowerVR 2NX Neural Network Acceleration (NNA). Questa è un'architettura flessibile con da uno a otto core, ognuno dei quali può avere 256 unità di accumulo multiplay (MAC) a 8 bit. L'immaginazione ha detto che può eseguire oltre 3, 2 trilioni di operazioni al secondo.

Ceva

Anche altri venditori IP stanno entrando nel mercato. Ceva, che è nota per i suoi core DSP, ha appena annunciato NeuPro, una famiglia di core di processore AI progettata per dispositivi periferici. Questi si basano su processori che l'azienda ha venduto nell'area della visione artificiale e utilizzano il framework CDNN per una varietà di "processi di intelligenza artificiale". Funzionerà con i framework di machine learning comuni e li convertirà per essere eseguito su processori mobili per l'inferenza. La società prevede processori che vanno da 2 a 12, 5 teraops al secondo (TOPS) progettati per prodotti di consumo, sorveglianza e ADAS (per veicoli autonomi). Ceva ha affermato che un importante cliente automobilistico prevede di abilitare 100 TOPS di prestazioni utilizzando meno di 10 watt di potenza. Le licenze inizieranno nella seconda metà di quest'anno.

Ceva ha anche annunciato la sua piattaforma PentaG di DSP per modem 5G in banda base. La società afferma che i suoi attuali DSP si trovano nel 40 percento dei portatili del mondo, coprendo circa 900 milioni di telefoni all'anno e nei modem di Intel, Samsung e Spreadtrum. La nuova piattaforma ha più intelligenza artificiale, utilizzata in particolare per "adattamento dei collegamenti". Nel mondo 5G, i portatili possono avere più collegamenti a una stazione base e Ceva afferma che l'hardware e il software aiutano a determinare il collegamento migliore ogni pochi millisecondi. Ciò può far risparmiare molta energia rispetto all'utilizzo del solo software. Questo non è un DSP generico o un chip di rete neurale, ma piuttosto uno progettato specificamente per le comunicazioni. È stato appena annunciato e dovrebbe essere disponibile nel terzo trimestre.

Ceva sta anche facendo una grande spinta per i DSP nel mercato delle stazioni base 5G e ha affermato che fino al 50% della nuova infrastruttura radio 5G utilizzerà l'IP DSP dell'azienda, compresi i sistemi di Nokia e ZTE.

Con quale probabilità consiglieresti PCMag.com?

Processori mobili del 2018: l'ascesa delle funzionalità di apprendimento automatico