data science big data analisi dei dati

I dati raccolti assumono significati importanti quando elaborati, e trasformati in informazione.

La Data Science si riferisce al processo di estrazione di conoscenza dei dati, questo ci suggerisce Wikipedia.

Vediamo in questo articolo come la Data Science si è evoluta, diventando sempre più importante per diversi settori merceologici.

L’analisi dei dati e i big data sono pratiche sempre più importanti per la Data Science, e le competenze del Data Scientist.

Il Data Scientist e la Data Science

Si potrebbe dire che il lavoro del Data Scientist sia quello di analizzare i dati per acquisire nuove conoscenze, ispezionare e modellare i dati. Praticamente il Data Scientist esegue una Data Analysis. Vale a dire il processo di ispezione, pulizia, trasformazione e modellazione di dati con il fine di evidenziare informazioni a supporto di decisioni strategiche aziendali.

Il Data Mining per l’analisi dei dati

Qui ci viene in aiuto il Data Mining, cioè quell’insieme di tecniche e metodologie che hanno per oggetto l’estrazione di un sapere, o di una conoscenza a partire da una grande quantità di dati. Il Data Mining è una tecnica particolare di analisi dei dati che si focalizza sulla modellazione e scoperta di conoscenza per scopi descrittivi e predittivi.

Tutte queste definizioni hanno un forte legame con la disciplina regina in tema di estrazione di informazioni dai dati, e cioè la statistica.

Molti ritengono che la Data Science è un’evoluzione attualizzata della disciplina statistica classica, ma considerando che il ruolo del Data Scientist è decisamente più complesso.

cos'è la data science e il ruolo del data scientist | bloginnovazione.it

Big Data

L’uso di un grande volume di dati implicano l’uso di strumenti di “stoccaggio e archiviazione adeguati”. In base alla tipologia di “dati”, si possono usare supporti esterni. L’approccio Big Data presuppone di accumulare il maggior quantitativo di dati rispetto uno specifico fenomeno. C’è da considerare che un numero elevato di informazioni, spesso vuol dire elevato rumore e ridondanza informatica.

Il lavoro di preparazione dell’insieme dei dati, da parte del Data Scientist, potrebbe assumere un peso maggiore in caso di Big Data, rispetto un approccio puramente statistico. I dati sono spesso Big a causa del fatto che la sorgente raccoglie e rende disponibili valori numerici con elevata frequenza.

Autore

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *