I Data Scientist non esistono: leggenda o realtà?

 

 

Il contesto in essere

 

Data Intelligence, Analytics, Machine Learning, Intelligenza Artificiale, sono settori in crescita e sui quali ci sono molti investimenti. Allo stesso tempo più il tema è caldo maggiore è la confusione e il rumore di fondo che i tanti attori che ruotano intorno a questa filiera stanno generando, a volte contribuendo alla nascita di vere e proprie leggende.

Perché nascono questi miti?

La maggior parte delle volte nascono perché le persone che lavorano in questi ambiti, il cui ruolo è anche quello di fare chiarezza, rendendo semplice un argomento così complicato per i non addetti ai lavori, hanno delle carenze metodologiche e di conoscenza delle componenti basilari della Data Science, mischiando e confondendo le diverse soluzioni.

Ma dove finisce la realtà e inizia il mito?

Sicuramente nella Data Science gli ambiti, seppur numerosi, sono ben definiti e lo studio e divulgazione scientifica che da decenni avviene su questi temi può rappresentare il punto di partenza più solido che ci sia.

 

Essere chiari fin da subito

 

In primis va fatta chiarezza su alcuni punti:

 

  • Data Science non è un tool o una tecnologia
  • Big Data non vuol dire Data Science
  • Data e Tecnologia sono alcuni degli ingredienti fondamentali per un’applicazione basata sulla Data Science
  • Data Science non è un frullatore di dati dove magicamente escono soluzioni
  • Senza obiettivi, percorsi e metodologia non si ottiene nulla e quello che si ottiene può essere deviante per i risultati di business
  • Data Science, Machine Learning, Intelligenza Artificiale non sono nate ieri, da decenni in ambito scientifico si studiano soluzioni basate su queste metodologie e tecniche. Recente è la loro applicazione a fini di Business grazie all’innovazione tecnologica esponenziale degli ultimi anni
  • Non esistono solo i Data Scientist esistono altre figure che sono attori protagonisti nella Data Science
  • Data Science richiede un approccio e un mindset aziendale Data Driven

 

I Data Scientist e le altre figure mitologiche

 

Quando si parla di Data Science è inevitabile parlare di Data Scientist, definito dalla Harvard Business Review come il lavoro più sexy del ventunesimo secolo.

 

Data Scientist Harvard Business Review Sexiest Job lavoro più sexy del ventunesimo secolo

 

Anche in questo caso nel mercato sembra che ci sia un po’ di confusione e alcune professionalità chiave vengono dimenticate oppure menzionate raramente.

 

Se si analizza l’ambito della Data Science, in termini di:

 

  • obiettivi di business (a fronte dei quali sviluppare soluzioni di Data Science) ad esempio:
    • miglioramento dei processi aziendali
    • riduzione ed ottimizzazione dei costi
    • riduzione ed ottimizzazione dei tempi
    • advertising e programmatic
    • data monetization
    • disegno di nuovi prodotti o servizi
    • ottimizzazione del pricing
    • competitive intelligence
    • identificazione frodi
    • previsione della domanda e ottimizzazione dell’offerta
    • manutenzione predittiva
    • etc.

 

  • settori di applicazione:
    • medicina
    • urbanistica
    • retail
    • automotive
    • fashion
    • banking
    • insurance
    • etc.

 

  • tipologia di dati:
    • dati strutturati
    • dati non strutturati
    • streaming data
    • dati provenienti dalla sensoristica
    • etc

 

 

  • competenza tecnologica:
    • Data Lake
    • DMP
    • CRM
    • Soluzioni “on premises”
    • Soluzioni “cloud”
    • Ecosistema API
    • IoT
    • etc.

 

  • linguaggi di programmazione:
    • R
    • Python
    • Java
    • SAS
    • etc.

 

  • competenze e skills (solo per indicarne alcune):
    • statistiche, matematiche, ingegneria informatica
    • coding
    • hacker mindset
    • storytelling e comunicazione dei risultati
    • modellistica predittiva e machine learning
    • metodologia solida e robusta
    • etc.

 

è evidente che tutto questo va ricercato in un team di persone e non in singole tipologie professionali.

 

Il Data Scientist esiste e ha competenze ben definite ma non copre tutto il processo di sviluppo di una soluzione o applicazione di Data Science.

 

Un team di Data Science al contrario è composto da diverse figure, ad esempio:

 

  • Data Engineer
  • Data Architect
  • Developer
  • Data Analyst
  • Data Scientist

 

 

Pertanto esistono team di Data Science con competenze variegate e complementari il cui obiettivo è la contaminazione e condivisione di conoscenza. Un team di Data Science deve avere al suo interno un processo di osmosi inversa per il trasferimento di conoscenza

 

 

Miti e leggende quando si parla di Data Science

 

 

Leggenda #1 – Le analisi richiedono troppo tempo

 

Definire chiaramente gli obiettivi, applicare una corretta metodologia e formare un team con il giusto mix di competenze permette di velocizzare l’analisi e la soluzione che si sta sviluppando. Se fino a poco tempo fa analisi avanzate richiedevano trimestri se non semestri, oggi giorno l’innovazione tecnologica permette di ridurre sensibilmente i tempi progettuali.

 

Leggenda #2 – Conosco già tutto, i risultati non mi diranno nulla di nuovo

 

I risultati di una soluzione di Data Science vanno letti e interpretati su differenti livelli, quello tattico e quello strategico. In entrambi i casi non si esclude che possono confermare fenomeni già noti, ma lo fanno comunque sulla base di metriche oggettive e non sulla base di sensazioni. L’informazione oggettiva fornisce maggior solidità e sicurezza nella presa di decisioni.

Se invece si presume di conoscere già tutto senza elementi oggettivi allora il passo successivo è capire se i risultati di questa conoscenza portano o meno vantaggi al business.

 

Leggenda #3 – Machine Learning e Intelligenza Artificiale sono la stessa cosa

 

Machine Learning e Intelligenza Artificiale non sono la stessa cosa, il Machine Learning è uno degli elementi che fanno parte di una soluzione di Intelligenza Artificiale. Se tutto quello che è Machine Learning rientra nell’AI, non tutta l’AI è Machine Learning.

 

Leggenda #4 – L’azienda è troppo piccola per questo tipo di soluzioni

 

Le aziende più piccole possono trarre i maggiori vantaggi dall’analisi dei dati e dalle soluzioni di Data Science poiché vengono sviluppate in un contesto nel quale non è stato ancora fatto molto da questo punto di vista. Quando si parte da zero i risultati portano vantaggi esponenziali al business e ai processi aziendali.

 

Leggenda #5 – Il budget limitato

 

Il budget limitato non è un problema perché non tutti i progetti di analisi dati richiedono investimenti cospicui, inoltre bisogna considerare la diffusione sul mercato di architetture e soluzioni che permettono di limitare i costi della tecnologia e delle competenze richieste.

In Excelle ad esempio mettiamo a disposizione, oltre alle competenze consulenziali di Data Science, anche un’infrastruttura analitica in modalità “pay x use” consentendo a tutte le aziende, di piccole e grandi dimensioni, di poter accedere a questo tipo di soluzioni.

 

Leggenda #6 – Faccio già Data Science con tool di Reporting

 

Fare reporting, monitorare gli eventi e le metriche è sicuramente importante ma non è Data Science.

Nella Data Science l’analisi dei dati evolve dall’attività di reporting (che effettua una valutazione a posteriori) a quella di previsione, automazione ed ottimizzazione di eventi futuri.

 

Leggenda #7 – Drag & Drop e ho fatto l’algoritmo di Machine Learning

 

Non è così semplice. Uno studio che utilizza tecniche di apprendimento automatico (Machine Learning) è un processo composto da numerose fasi che non riguardano solo il tool che si utilizza per lo studio statistico, l’addestramento dell’algoritmo e la sua messa in produzione, ma anche fasi di comprensione del contesto, dell’ambiente in cui dovrà operare la soluzione, fasi di trasformazione delle variabili e creazione di nuove metriche, etc. Tutto questo non si costruisce con un banale “drag & drop” ma richiede, oltre alla seppur fondamentale tecnologia, la componente umana e l’interazione tra differenti tipologie di professionisti.

 

Leggenda #8 – Reti Neurali Docet

 

Seppur valide ed assolutamente efficaci per alcune soluzioni e ambiti, non esistono solo le reti neurali, ma esistono tantissime tipologie di algoritmi il cui utilizzo è specifico, delineato e definito da decenni.

 

Leggenda #9 – Intelligenza Artificiale ci ruberà il lavoro a tutti

 

Intelligenza Artificiale e altre tecniche o soluzioni di Data Science non ruberanno ma trasformeranno il mondo del lavoro nei prossimi decenni, rendendo obsolete alcune professioni a vantaggio di alcune già presenti sul mercato e altre che oggi non sono ancora nate. E’ un processo già visto nella storia passata, sicuramente questa volta sta accadendo con una velocità esponenziale che richiede un altrettanto veloce adattamento da parte della società.

Nonostante queste premesse la componente umana sarà sempre necessaria e fondamentale, anche in questi ambiti.

 

Leggenda #10 – L’agenzia che mi segue ha i miei dati e mi fa Data Science

 

I Dati rappresentano il tuo tesoro, già il fatto che non sono in tuo possesso vuol dire che c’è qualcosa che non va nella tua strategia di Business. Grandi agenzie effettivamente si stanno strutturando con funzioni e risorse per integrare nella loro offerta anche la Data Science, ma nel mercato sono ancora in pochissime in grado di offrire veramente soluzioni di questo tipo.

Sei davvero certo che quello che ti stanno vendendo è Data Science oppure è un semplice tool slegato da obiettivi e strategie che non porta a miglioramenti concreti e misurabili nel tuo business?

 

Se sei interessato a soluzioni di Data Science contattaci, saremo lieti di fornirti tutte le informazioni e rispondere alla tue domande.

Rimani sempre aggiornato con la nostra newsletter. Se non sei ancora iscritto clicca qui

All’interno della nostra Accademia del Dato eroghiamo corsi di formazione in ambito Machine Learning & Data Science.