Cikkek

Szövegelemzés a chatGPT használatával

A szövegelemzés vagy a szövegbányászat létfontosságú technika a nagy mennyiségű strukturálatlan szöveges adatból értékes ismeretek kinyerésére. 

Ez magában foglalja a szöveg feldolgozását és elemzését a minták, trendek és kapcsolatok felfedezése érdekében.

Lehetővé teszi a vállalatok, kutatók és szervezetek számára, hogy döntéseket hozzanak a szövegekből gyűjtött információk alapján. 

Ahogy a strukturálatlan adatok mennyisége továbbra is exponenciálisan növekszik, a pontos és hatékony szövegelemző eszközök iránti igény egyre kritikusabbá vált az olyan sokszínű iparágakban, mint a marketing, a pénzügy, az egészségügy és a társadalomtudomány.

Hagyományosan a szövegelemzést szabályalapú módszerekkel és gépi tanulási technikákkal, például a SpaCY-vel és a transzformátortechnikával végezték. Bár ezek a módszerek hatékonynak bizonyultak, a tökéletesítésük jelentős erőfeszítést és szakértelmet igényel.

A nagy nyelvi modellek (LLM) megjelenésével, mint pl ChatGPT di OpenAI. Figyelemre méltó képességekről tett tanúbizonyságot az emberszerű szöveg létrehozásában és a kontextus megértésében, így ígéretes eszközzé teszi olyan szövegelemzési feladatokhoz, mint pl. entity recognition, sentiment analysisÉs topic modeling.

Lássuk most, hogyan hajthatunk végre szövegelemzést a ChatGPT használatával.

Hagyományos módszer (egyes modellek) vs. LLM

A múltban mindig különböző modelleket használtunk a gépi tanulás különböző feladataihoz. Például, ha tudást akarok kinyerni egy szövegből, akkor egy elnevezett entitásfelismerési modellt (NER – Named Entity Recognition), ha a szövegemet külön osztályokba kell sorolnom, szükségem lesz egy osztályozási modellre. Minden egyes tevékenység megkövetelte, hogy a modelleket az egyes tevékenységekhez eltérően képezzék, akár transzfertanulás, akár képzés útján.

Bevezetésével Large Language Models (LLM), egy LLM modell képes lesz több NLP feladat végrehajtására képzéssel vagy anélkül. Bármilyen tevékenység lehet defiegyszerűen a promptokban lévő utasítások megváltoztatásával érhető el.

Most nézzük meg, hogyan kell elvégezni a hagyományos NLP feladatot ChatGPT és hasonlítsa össze a hagyományos módon. Azok az NLP feladatok, amelyeket a ChatGPT ebben a cikkben a következők:

  • Tudáskinyerés (NER)
  • Szöveg osztályozás
  • Sentiment analysis
  • Összegzés

Tudáskinyerés (NER)

A nevesített entitásfelismerés (NER) a különböző szöveges adatblokkokban lévő kifejezések automatikus azonosításának feladatára utal. Főleg olyan fontos entitáskategóriák kinyerésére szolgál, mint a gyógyszernevek a klinikai feljegyzésekből, a balesetekkel kapcsolatos kifejezések a biztosítási kárigényekből, és más, tartományspecifikus kifejezések a nyilvántartásokból.

Vegye figyelembe, hogy ez a tevékenység az orvosi területre jellemző. Korábban több mint 10.000 XNUMX adatsort kellett megjegyzésekkel ellátnunk és betanítani egyetlen modellhez, hogy ismerjük az adott osztályt és kifejezést a szövegben. A ChatGPT minden előre betanított szöveg vagy finomhangolás nélkül pontosan tudja azonosítani a kifejezést, ami viszonylag jó eredmény!

Szöveg osztályozás

A szövegbesorolás a hatalmas adatokból a szöveg keresésének és kategóriákba sorolásának automatikus folyamatát jelenti, lényeges szerepet játszik a szöveges adatok visszakeresésében és kinyerésében. A szöveges osztályozási alkalmazások példái közé tartoznak a klinikai figyelmeztetések vagy a kockázati tényezők kategorizálása, az automatikus diagnosztikai osztályozás és a levélszemét-észlelés.

Sentiment analysis

Sentiment analysis magában foglalja a szövegrészben kifejezett érzés vagy érzelem meghatározását. Célja, hogy a szöveget előzetes kategóriákba soroljadefivéges, mint pozitív, negatív vagy semleges, a szerző által közvetített mögöttes érzelmek alapján. 

A hangulatelemzés alkalmazásai a következők:

  • vásárlói vélemények és visszajelzések elemzése,
  • a közösségi média hangulatának nyomon követése,
  • piaci trendek nyomon követése e
  • a politikai hangulat mérése a választási kampányok során.

Összegzés

Az automatikus összefoglalók azt a folyamatot jelentik, amelynek során egy vagy több dokumentum fő témáit azonosítják, és tömören és pontosan bemutatják. Ez lehetővé teszi a felhasználó számára, hogy rövid időn belül nagy mennyiségű adatot tekintsen meg. A példaalkalmazások közé tartozik egy összefoglaló rendszer, amely lehetővé teszi a hírcikkek kivonatainak automatikus generálását és az információk összegzését a kutatási cikkek absztraktjaiból származó mondatok kivonásával.

A ChatGPT kiváló összefoglaló eszköz, különösen hosszú cikkekhez és bonyolult áttekintésekhez. Ha beilleszti a véleményeket a ChatGPT-be, egy pillantással könnyen megismerhetjük a termékértékelés összefoglalóját.

Az LLM-ek korlátja

Mivel ennek a cikknek az a célja, hogy feltárja az LLM-ek azon képességét, hogy szövegelemzési feladatokat végezzenek, elengedhetetlen, hogy felismerjük korlátaikat is. Az LLM-ek néhány fő korlátozása a következők:

  1. Erőforrás-felhasználás : Az LLM-ek használata jelentős számítási és pénzügyi erőforrásokat igényel, ami kihívást jelenthet a kisebb szervezetek vagy a korlátozott erőforrásokkal rendelkező egyéni kutatók számára. A mai napig a ChatGPT csak körülbelül 8.000 tokent fogad el bevitelre és kimenetre, nagy mennyiségű adat elemzéséhez, megköveteli a felhasználótól, hogy a szöveget több adatdarabra bontsa, és előfordulhat, hogy a feladatokhoz több API-hívás is szükséges.
  2. Érzékenység az azonnali megfogalmazásra : Az LLM-ek teljesítményét befolyásolhatja a promptok megfogalmazásának módja. Az azonnali megfogalmazás enyhe változtatása eltérő eredményeket eredményezhet, ami aggodalomra adhat okot, ha következetes és megbízható kimenetet keres.
  3. Szakterület-specifikus szakértelem hiánya : Míg az LLM-ek általános ismeretekkel rendelkeznek a különböző területekről, előfordulhat, hogy nem rendelkeznek ugyanolyan szintű szakértelemmel, mint a tartományspecifikus adatokra képzett speciális modellek. Ennek eredményeként előfordulhat, hogy teljesítményük bizonyos esetekben nem optimális, és finomhangolást vagy külső ismereteket igényelhet, különösen, ha nagyon speciális vagy technikai információkkal foglalkoznak.

Ercole Palmeri

Innovációs hírlevél
Ne maradjon le az innovációval kapcsolatos legfontosabb hírekről. Regisztráljon, hogy megkapja őket e-mailben.

Friss cikkek

A színező oldalak előnyei gyerekeknek – a varázslatok világa minden korosztály számára

A finom motoros készségek színezéssel történő fejlesztése felkészíti a gyerekeket olyan összetettebb készségekre, mint az írás. Kiszínezni…

Május 2 2024

A jövő itt van: Hogyan forradalmasítja a hajózási ágazat a globális gazdaságot

A haditengerészeti szektor igazi világgazdasági hatalom, amely egy 150 milliárdos piac felé navigált...

Május 1 2024

A kiadók és az OpenAI megállapodásokat írnak alá a mesterséges intelligencia által feldolgozott információáramlás szabályozására

Múlt hétfőn a Financial Times bejelentette, hogy megállapodást köt az OpenAI-val. Az FT engedélyezi világszínvonalú újságírását…

30 április 2024

Online fizetés: Így fizethet örökké a streaming szolgáltatások

Emberek milliói fizetnek a streaming szolgáltatásokért, havi előfizetési díjat fizetve. Általános vélemény, hogy Ön…

29 április 2024