De réir mar a leanann líon na sonraí neamhstruchtúrtha ag méadú go heaspónantúil, tá an gá atá le huirlisí anailíse téacs cruinne agus éifeachtacha ag éirí níos tábhachtaí i réimsí éagsúla, mar mhargaíocht, airgeadas, cúram sláinte agus eolaíochtaí sóisialta.
Go traidisiúnta, rinneadh anailís ar théacs trí úsáid a bhaint as modhanna bunaithe ar rialacha agus as teicnící meaisínfhoghlama ar nós SpaCY agus an teicníc claochladáin. Cé go bhfuil sé cruthaithe go bhfuil na modhanna seo éifeachtach, teastaíonn sáriarracht agus saineolas uathu chun iad a chur i gcrích.
Le teacht na múnlaí móra teanga (LLManna) mar ComhráGPT di OpenAI. Tá cumais shuntasacha léirithe aige maidir le téacs atá cosúil leis an duine a ghiniúint agus comhthéacs a thuiscint, rud a fhágann gur uirlis fhiúntach é le haghaidh tascanna anailíse téacs ar nós entity recognition
, sentiment analysis
Agus topic modeling
.
Feicfimid anois conas is féidir linn anailís téacs a dhéanamh ag baint úsáide as ChatGPT.
San am atá caite, d'úsáideamar samhlacha éagsúla i gcónaí le haghaidh tascanna éagsúla i meaisínfhoghlaim. Mar shampla, má theastaíonn uaim eolas a bhaint as téacs, beidh orm samhail aitheantais aonáin ainmnithe a úsáid (NER – Named Entity Recognition
), más gá dom mo théacs a rangú i ranganna ar leith, beidh múnla aicmithe de dhíth orm. Bhí gá le hoiliúint dhifriúil ar na múnlaí do gach tasc difriúil ag brath ar an tasc, trí fhoghlaim aistrithe nó oiliúint.
Le tabhairt isteach na Large Language Models (LLM), beidh samhail LLM in ann tascanna iomadúla NLP a dhéanamh le nó gan oiliúint. Is féidir le gach gníomhaíocht deficríochnaithe go simplí trí na treoracha sna leideanna a mhodhnú.
Anois féachaimis conas an tasc traidisiúnta NLP a dhéanamh i ComhráGPT agus é a chur i gcomparáid leis an mbealach traidisiúnta. Na tascanna NLP a bheidh le comhlíonadh ag ComhráGPT san alt seo tá:
Sentiment analysis
Tagraíonn Aitheantas Aonán Ainmnithe (NER) don tasc téarmaí a aithint go huathoibríoch i mbloic éagsúla de shonraí téacsúla. Úsáidtear go príomha é chun catagóirí tábhachtacha eintitis amhail ainmneacha drugaí a bhaint as nótaí cliniciúla, téarmaí tionóisce ó éilimh árachais, agus téarmaí eile a bhaineann go sonrach leis an bhfearann ó thaifid.
Tabhair faoi deara go mbaineann an tasc seo go sonrach leis an bhfearann leighis. Roimhe seo d’éiligh sé orainn níos mó ná 10.000 sraith sonraí a anótáil agus a oiliúint le haghaidh múnla amháin chun eolas a bheith againn ar an aicme agus ar an téarma ar leith sa téacs. Is féidir le ChatGPT an téarma a aithint i gceart gan aon téacs réamhoilte nó mionchoigeartú, agus is toradh réasúnta maith é sin!
Tagraíonn aicmithe téacs don phróiseas uathoibríoch chun téacs a aimsiú agus a rangú i gcatagóirí ó shonraí ollmhóra, tá ról riachtanach aige maidir le haisghabháil sonraí téacs agus mianadóireacht. I measc samplaí d’fheidhmchláir aicmithe téacs tá catagóiriú foláirimh chliniciúil nó fachtóir riosca, aicmiú uathoibríoch diagnóiseach, agus braite turscair.
Sentiment analysis
Sentiment analysis
Is éard atá i gceist leis an mothúchán nó an mhothúchán a chuirtear in iúl i bpíosa téacs a chinneadh. Tá sé mar aidhm aige an téacs a rangú i réamhchatagóirídefinite, mar shampla dearfach, diúltach nó neodrach, bunaithe ar an mbunmhothúchán a chuir an t-údar in iúl.
Áirítear le hiarratais anailíse meon:
Tagraíonn achoimrí uathoibríocha don phróiseas trína sainaithnítear príomhábhair dhoiciméad amháin nó níos mó agus trína gcuirtear i láthair go gonta agus go cruinn iad. Ligeann sé seo don úsáideoir breathnú ar bhlocanna móra sonraí i mbeagán ama. I measc na n-iarratas samplach tá córas achoimrithe a chumasaíonn giniúint uathoibríoch achoimrí as ailt nuachta agus faisnéis a achoimriú trí abairtí a bhaint as achoimrí páipéir thaighde.
Is uirlis achoimre den scoth é ChatGPT, go háirithe le haghaidh ailt fhada agus athbhreithnithe casta. Trí léirmheasanna a ghreamú isteach i ChatGPT, is féidir linn achoimre na n-athbhreithnithe táirge a fháil go héasca.
Ós rud é gurb é cuspóir an ailt seo iniúchadh a dhéanamh ar chumas LLM tascanna anailíse téacs a dhéanamh, tá sé riachtanach a dteorainneacha a aithint freisin. I measc cuid de phríomhtheorainneacha LLManna tá:
Ercole Palmeri
Dé Luain seo caite, d'fhógair an Financial Times comhaontú le OpenAI. Ceadaíonn FT a iriseoireacht den scoth…
Íocann na milliúin daoine as seirbhísí sruthú, ag íoc táillí síntiús míosúla. Is tuairim choitianta é go bhfuil tú…
Leanfaidh Coveware le Veeam ag soláthar seirbhísí freagartha teagmhais cibear-sracadh. Cuirfidh Coveware cumais fhóiréinseacha agus leasúcháin ar fáil…
Tá an earnáil ola & gáis á réabhlóidiú ag cothabháil thuarthach, le cur chuige nuálaíoch agus réamhghníomhach maidir le bainistíocht gléasra.…