Poiché il volume di dati non strutturati continua a crescere in modo esponenziale, la necessità di strumenti di analisi del testo accurati ed efficienti è diventata sempre più critica in diversi ambiti, come marketing, finanza, assistenza sanitaria e scienze sociali.
Tradizionalmente, l’analisi del testo è stata eseguita utilizzando metodi basati su regole e tecniche di apprendimento automatico come SpaCY e la tecnica del trasformatore. Sebbene questi metodi si siano dimostrati efficaci, richiedono un notevole impegno e competenza per perfezionarli.
Con l’avvento di modelli di linguaggio di grandi dimensioni (LLM) come ChatGPT di OpenAI. Ha dimostrato notevoli capacità nella generazione di testo simile a quello umano e nella comprensione del contesto, rendendolo uno strumento promettente per attività di analisi del testo come entity recognition
, sentiment analysis
, e topic modeling
.
Andiamo a vedere ora come possiamo eseguire l’analisi del testo utilizzando ChatGPT.
In passato, abbiamo sempre utilizzato modelli diversi per compiti diversi nell’apprendimento automatico. Ad esempio, se voglio estrarre conoscenza da un testo, avrò bisogno di utilizzare un modello di riconoscimento di entità nominate (NER – Named Entity Recognition
), se ho bisogno di classificare il mio testo in classi separate, avrò bisogno di un modello di classificazione. Ogni attività diversa richiedeva che i modelli venissero addestrati in modo diverso a seconda delle attività, mediante trasferimento dell’apprendimento o addestramento.
Con l’introduzione dei Large Language Models (LLM), un modello LLM sarà in grado di eseguire più attività di PNL con o senza formazione. Ogni attività può essere definita semplicemente modificando le istruzioni nei prompt.
Vediamo ora come eseguire l’attività NLP tradizionale in ChatGPT e confrontarla con il modo tradizionale. Le attività di PNL che verranno eseguite da ChatGPT in questo articolo sono:
Sentiment analysis
Named Entity Recognition (NER) si riferisce al compito di identificare automaticamente i termini in diversi blocchi di dati testuali. Viene utilizzato principalmente per estrarre importanti categorie di entità come nomi di farmaci da note cliniche, termini relativi a incidenti da richieste di risarcimento assicurativo e altri domini – termini specifici dai record.
Si noti che questa attività è specifica del dominio medico. In passato ci richiedeva di annotare e addestrare più di 10.000 righe di dati affinché un singolo modello conoscesse la classe e il termine specifici nel testo. ChatGPT può identificare correttamente il termine senza alcun testo pre-addestrato o messa a punto, il che è un risultato relativamente buono!
Le classificazioni di testo si riferiscono al processo automatico per trovare e classificare il testo in categorie da enormi dati, svolge un ruolo essenziale nel recupero e nell’estrazione di dati di testo. Esempi di applicazioni di classificazione del testo includono allarmi clinici o categorizzazione dei fattori di rischio, classificazione diagnostica automatica e rilevamento di posta indesiderata.
Sentiment analysis
Sentiment analysis
implica la determinazione del sentimento o dell’emozione espressa in un pezzo di testo. Ha lo scopo di classificare il testo in categorie predefinite, come positivo, negativo o neutro, in base sul sentimento sottostante trasmesso dall’autore.
Le applicazioni dell’analisi del sentiment includono:
I riepiloghi automatici si riferiscono al processo mediante il quale gli argomenti principali di uno o più documenti vengono identificati e presentati in modo conciso e preciso. Ciò consente all’utente di dare un’occhiata a grandi blocchi di dati in breve tempo. Esempi di applicazioni includono un sistema di riepilogo che consente la generazione automatica di riassunti da articoli di notizie e il riepilogo di informazioni estraendo frasi da abstract di documenti di ricerca.
ChatGPT è un eccellente strumento di riepilogo, soprattutto per articoli lunghi e recensioni complicate. Incollando le recensioni in ChatGPT, possiamo facilmente conoscere il riepilogo delle recensioni dei prodotti a colpo d’occhio.
Poiché lo scopo di questo articolo è esplorare la capacità degli LLM di eseguire attività di analisi del testo, è essenziale riconoscere anche i loro limiti. Alcune delle principali limitazioni degli LLM includono:
Ercole Palmeri
Reply annuncia il lancio di MLFRAME Reply, un nuovo framework di intelligenza artificiale generativa per basi di conoscenza eterogenee. Ideato…
Giunge alla sua 17a edizione il Premio IMSA per le giovani startup nate dalla ricerca nell’ambito delle Università e degli…
Il Premio Zayed per la Sostenibilità è il premio globale per la sostenibilità e l'impegno umanitario degli Emirati Arabi Uniti.…
Reply, società di consulenza e system integrator a livello globale e Oracle Cloud Managed Service Provider, annuncia di aver ricevuto…
MasterZ Blockchain, aumenta il valore per il Master d’ eccellenza WEB 3.0 più grande d' Europa. Il team tutto italiano…
33 finalisti selezionati tra 5.213 candidature in 163 paesi I finalisti sostengono un'azione climatica incisiva e supportano l'accesso all'energia pulita,…
I prodotti biologici si sono evidenziati come una classe farmaceutica innovativa, rivoluzionando il campo della medicina attraverso terapie mirate. A…
L'internalizzazione delle stampanti per la produzione di metalli e polimeri negli stabilimenti di Riom, Francia e Rock Hill, Carolina del…
L'analisi dei dati senza librerie e potenziata dall'apprendimento automatico con Spectronaut ® 18 offre quantificazione e produttività delle proteine leader del settore…
Mattermost presenta un ecosistema ampliato di alleati con un'enfasi sui nuovi casi d'uso del Dipartimento della Difesa per le soluzioni…