Cosa sono i classificatori nel machine learning: gli Alberi Decisionali

I classificatori sono algoritmi di machine learning che operano assegnando una classe a ogni elemento del Data Set.
Ci sono diversi tipi di classificatori, quello che approfondiremo in questo articolo è il classificatore che si basa sugli alberi decisionali.
Con il passare del tempo, sono aumentate a dismisura le implementazioni di machine learning che coinvolgono classificatori e alberi decisionali, è aumentato l’interesse e i corsi di formazione.
Le figure professionali che si occupano di alberi decisionali e machine learning sono molteplici, ma fondamentalmente è un professionista dotato di ampie conoscenze nell’ambito della statistica che, partendo dall’analisi e dall’aggregazione dei dati, può elaborare complesse strategie e analisi.
Se l’argomento ti interessa e stai iniziando a chiederti come diventare uno specialista di machine learning, allora questo è l’approfondimento che fa al tuo caso. Nelle righe successive, proverò infatti a fornirti alcune nozioni sui classificatori e sugli alberi decisionali, in modo da schiarirti le idee in merito. Ti auguro una buona lettura.
Alberi Decisionali
Gli alberi decisionali sono una rappresentazione dell’apprendimento nel machine learning. Un albero è una struttura dati le cui informazioni sono contenute nei nodi, e i nodi sono collegati tra loro tramite degli archi. I nodi sono posizionati proprio dove un arco ne incontra un altro.
Qui di seguito una rappresentazione grafica di un albero. Gli alberi possono contenere informazioni di vario tipo

Graficamente possiamo notare 6 nodi che contengono gli elementi A, B, C, D, E, F mentre gli archi sono i segmenti che collegano le informazioni.
Una struttura ad albero di questo tipo ha:
- un nodo chiamato radice o root, nel nostro caso è quello contenente l’informazione A. E’ sempre il nodo da cui discende tutto l’albero;
- i nodi B e C sono discendenti del nodo A, perchè ci sono archi che legano i discendenti da un nodo superiore;
- i nodi che non hanno discendenti si chiamano foglie, e in questo caso sono i nodi D, F e C;
- l’albero ha anche una profondità, cioè la maggiore distanza dalla radice alla foglia, nel nostro caso 3
Nel machine learning la struttura albero decisionale deriva esattamente da questa tipologia di struttura, l’unica differenza è che ogni nodo non contiene una informazione ma bensì contiene una condizione, una condizione da valutare. Questi alberi sono anche detti Classification And Regression Tree (C.A.R.T.), e vengono costruiti nel modello in fase di addestramento della macchina.
Esempio di Classificazione
Vediamo ora un caso in cui vengono analizzati i dati di otto automobili. Per ogni automobile conosciamo la cilindrata e il prezzo di vendita come features, e a ogni automobile corrisponde un target Vero o Falso che ci dice se l’automobile è un’occasione o meno.
Qui di seguito la tabella riassuntiva:
