Casa Recensioni Come le aziende possono dare un senso al mercato dei big data

Come le aziende possono dare un senso al mercato dei big data

Video: "Data science and Big Data... in practice". Come i big data ci stanno cambiando la vita (Novembre 2024)

Video: "Data science and Big Data... in practice". Come i big data ci stanno cambiando la vita (Novembre 2024)
Anonim

Le aziende non ottengono punti per l'efficienza della loro infrastruttura o per quanto possono accumulare tutti i Big Data che raccolgono. Ciò che conta è la qualità dell'analisi e dell'intelligence che i dati producono.

Negli ultimi anni, Hadoop è la parola che è diventata più sinonimo di acquisizione, elaborazione e trasformazione dei dati. Questo framework open source per l'archiviazione e l'elaborazione di dati distribuiti ha generato il proprio spazio aziendale e si è integrato in tutte le principali piattaforme cloud. Hadoop è tutt'altro che l'unica tecnologia di Big Data di cui vale la pena parlare, ma è diventata quella su cui sono costruite molte altre.

Il problema per le aziende è che lo spazio di Hadoop è pieno di distribuzioni e opzioni di strumenti e, come ha spiegato Nick Heudecker, direttore della ricerca di Gartner, molti sembrano uguali. Heudecker, la cui ricerca copre la gestione delle informazioni, compresi gli spazi Big Data e NoSQL, ha affermato che se si stanno esaminando le opzioni generali di elaborazione dei dati, molti fornitori offrono funzionalità molto simili.

Abbattere il mercato

Esistono tre principali start-up Hadoop di puro gioco - Cloudera, Hortonworks e MapR - e sono cresciute costantemente nel 2015. Secondo Gartner, ognuna ha circa 700 clienti, che danno o prendono il 10 percento, mettendo il mercato globale tra 2.100-2.400 clienti Hadoop in tutto il mondo. Tutti e tre offrono sia un livello gratuito che un livello aziendale della loro distribuzione Hadoop e ognuno fornisce significativi contributi open source a progetti nell'ambito del banner Apache Software Foundation (ASF).

"I nostri dati indicano che il 44 percento dell'utilizzo di Hadoop non è attualmente pagato", ha dichiarato Heudecker. "C'è un leader chiaro? Non credo. Stanno tutti conquistando quote di mercato perché è uno spazio molto nuovo."

Negli ultimi mesi, gran parte della concorrenza tra i tre si è ridotta alla concorrenza sulle capacità di analisi dei dati e sui modi creativi di integrare Apache Spark, un motore di elaborazione Big Data open source con casi d'uso dai flussi di dati in tempo reale all'apprendimento automatico. MapR ha recentemente annunciato MapR Streams come parte di una "piattaforma di dati convergenti" che integra Hadoop, elaborazione dei flussi basata su Spark e analisi. Hortonworks ha implementato un aggiornamento di Hortonworks Data Platform (HDP) con analisi Spark in memoria e Cloudera offre una varietà di integrazioni Spark open source tramite la sua One Platform Initiative, oltre a offrire corsi di formazione Spark.

"Succedono molte cose nella gestione delle informazioni e negli spazi delle infrastrutture di informazione, e non è tutto Hadoop", ha spiegato Heudecker. "C'è un enorme slancio dietro la velocità di Spark e il modello di elaborazione dei dati incentrato sulla memoria, sebbene lo sviluppo di Spark sia ancora nelle sue fasi iniziali. Spark sarà un'altra lingua franca nell'elaborazione dei dati, proprio come SQL oggi, e sta sicuramente mostrando segni che ha alcune gambe poiché sempre più aziende vi investono ".

Heudecker ha anche sottolineato l'importanza dei giocatori cloud nei Big Data; i giganti della tecnologia che hanno integrato Hadoop e altre tecnologie di Big Data nelle loro offerte di infrastruttura come servizio (IaaS).

Amazon Web Services (AWS) utilizza il servizio Amazon Elastic MapReduce (EMR) per l'orchestrazione Hadoop basata su cloud. Microsoft offre tutta una serie di servizi Big Data all'interno della sua piattaforma cloud di Azure, collaborando con Hortonworks sul suo servizio HDInsight per la gestione di Apache Hadoop, Spark, HBase e Storm, insieme a Azure Data Lake basato su SQL e Azure Data Analytics. IBM ha sia la sua offerta IBM Open Platform locale per Hadoop che IBM BigInsights, un pacchetto di analisi da eseguire su di esso, insieme a Hadoop gestito e Apache Spark-as-a-service nel suo cloud Bluemix. L'elenco continua e le aziende trovano i casi d'uso più applicabili nel cloud.

"Stimiamo che AWS da solo abbia circa 5.000 clienti, quindi questo è oltre il doppio della base clienti dei giochi puri combinati", ha dichiarato Heudecker. "Uno dei vantaggi di spostarsi nel cloud è che si ottiene un ecosistema. È possibile ottenere le distribuzioni Hadoop pure-play su una qualsiasi delle offerte IaaS. MapR è disponibile in tutti i cloud a cui riesci a pensare, oltre a IBM; stesso per Cloudera e Hortonworks. Non abbiamo visto la disponibilità del cloud diventare un fattore determinante nella scelta tra un fornitore e l'altro ".

Scelta di una strategia per i dati aziendali

Sia per le piccole e medie imprese (PMI) che per le imprese in crescita, quando investono in soluzioni di elaborazione e analisi dei dati, Heudecker ha affermato che il fattore decisivo è quale piattaforma può fornire il massimo livello di servizio. La più grande sfida per le aziende, secondo Gartner, è il divario di competenze: capire chi gestirà la piattaforma una volta installata e distribuita.

"Se le aziende sono alla ricerca di un partner della piattaforma dati, che li aiuterà con l'inserimento dei dati? Chi li aiuterà a costruire l'applicazione analitica? Per quanto riguarda i tre giocatori di Hadoop, i criteri di valutazione tendono a essere maturità degli strumenti e delle console di gestione, degli strumenti di governance dei dati e delle prestazioni."

L'altro aspetto interessante della scelta di una piattaforma Hadoop è la mancanza di lealtà. Le aziende rivalutano la propria piattaforma Hadoop ogni 6-12 mesi per vedere se i componenti di elaborazione dei dati sono ancora adatti, a causa della rapidità con cui lo spazio sta cambiando e di quanto poco i grandi attori si sono differenziati. Heudecker ha dichiarato che il 20 percento delle aziende con cui ha parlato ha più distribuzioni Hadoop in esecuzione nei propri data center o cloud, sia lasciando che team diversi scelgano la propria piattaforma di scelta o diversificandosi intenzionalmente per evitare di rimanere bloccati con una sola distribuzione Hadoop.

Questo tipo di portafoglio di piattaforme diversificate si nutre di ciò che Frank Buytendijk, vicepresidente della ricerca Gartner e distinto analista incentrato sulla strategia digitale, definisce "l'informazione come una risorsa". Come se non fosse possibile gestire un'azienda senza capitale, manodopera, materiali e strutture fisiche o virtuali, Buytendijk ha affermato che non è possibile gestire un'azienda senza informazioni.

"Abbiamo usato il business in termini di tre flussi: il flusso primario era quello delle merci, il flusso secondario era il denaro e il flusso terziario era l'informazione per assicurarsi che i beni e il denaro fossero allineati. Ora nella maggior parte delle aziende è il contrario Il flusso principale sono le informazioni, dall'identificazione e configurazione al marketing dei contenuti, ecc. Non importa se chiami o meno i Big Data."

"Big Data" non è aggiornato

Buytendjik ha affermato di non vedere i Big Data come una tecnologia separata per le aziende, ma come un tema o una mentalità all'interno della tua strategia digitale complessiva.

"Non credo di avere una strategia per i Big Data", ha dichiarato Buytendjik. "Non esiste quasi più una strategia aziendale senza componenti digitali, quindi credo che abbia una strategia digitale in cui tutti i tipi di tecnologie offrono capacità critiche. Ciò include mobile, social, cloud, IoT, smart machine e Big Data".

Heudecker ritiene che inizieremo a parlare sempre più spesso di "Big Data", perché ora sono solo dati. È il modo in cui vengono fatti gli affari. Volumi massicci e alta velocità di dati non sono più scoraggianti.

"I big data vengono nuovamente inclusi nelle informazioni e nell'analisi", ha affermato Heudecker. "La categoria dei Big Data non è francamente differenziante. Ci viene sempre chiesto la dimensione del mercato dei Big Data, ma cosa significa questo? I Big Data non sono in realtà un mercato, è un concetto. Per un'azienda, pensando ai Big Data come qualcosa di unico e speciale radicalmente diverso da quello che hai fatto prima è un errore. A questo punto, i dati sono semplicemente normali."

Come le aziende possono dare un senso al mercato dei big data