Članci

Kratka analiza novih vještina u velikim jezičkim modelima

Veliki dio istraživanja o umjetnoj inteligenciji u posljednje dvije decenije fokusiran je na obuku neuronskih mreža, kako bi se izvršio jedan zadatak sa specifičnim skupovima podataka za obuku. Na primjer, klasificirajte ako slika sadrži mačku, sumirajte članak, prevedite s engleskog na svahili...

Posljednjih godina se oko jezičkih modela razvila nova paradigma: neuronske mreže koje jednostavno predviđaju sljedeće riječi u rečenici s obzirom na prethodne riječi u rečenici.

Nakon što su obučeni na velikom tijelu neoznačenog teksta, lingvistički modeli mogu biti "pozvani" da izvode proizvoljne zadatke kao što je predviđanje riječi nakon rečenice. Na primjer, zadatak prevođenja engleske rečenice na svahili mogao bi se preformulisati kao predviđanje sljedeće riječi: "Svahili prijevod 'vještačke inteligencije' je..."

Od specifičnog zadatka do općeg zadatka

Ova nova paradigma predstavlja pomak od modela specifičan za zadatak, obučeni za obavljanje jednog zadatka, u modelima generalni zadatak, koji može obavljati različite zadatke. Plus modeli generalni zadatak mogu obavljati i nove aktivnosti koje nisu eksplicitno uključene u podatke o obuci. Na primjer, GPT-3 pokazao da lingvistički modeli mogu uspješno množenje dvocifrenih brojeva, čak i ako nisu eksplicitno obučeni za to. Međutim, ova sposobnost izvršavanja novih zadataka javlja se samo kod modela sa određenim brojem parametara i obučenih na dovoljno velikom skupu podataka.

Hitan slučaj kao ponašanje

Ideja da kvantitativne promjene u sistemu mogu dovesti do novog ponašanja poznata je kao vanredno stanje, koncept koji je popularizirao esej nobelovca Philipa Andersona iz 1972. godine “Više je drugačije”. U mnogim disciplinama kao što su fizika, biologija, ekonomija i informatika, pojava koja se pojavljuje je uočena u složenim sistemima.

U nedavni članak Objavljeno dana Transakcije o istraživanju mašinskog učenja, laboratorija Hai in Stanford University defizavršava nove vještine u velikim jezičkim modelima na sljedeći način:

Vještina je emergentni ako nije prisutan u manjim modelima, ali je prisutan u većim modelima.

Okarakterizirati prisustvo vještina u nastajanju, naš članak je objedinio nalaze za različite modele i pristupe koji su se pojavili u protekle dvije godine od objavljivanja GPT-3. U radu su ispitana istraživanja koja su analizirala utjecaj razmjera: modeli različitih veličina obučeni s različitim računskim resursima. Za mnoge aktivnosti, ponašanje modela raste predvidljivo sa skalom ili se nepredvidivo povećava od nasumičnih performansi do vrijednosti viših od slučajnih na određenom pragu skale.

Da biste saznali više, pročitajte članak na nove vještine u lingvističkim modelima

Jason Wei je istraživač u Google Brain-u. Rishi Bommasani je student druge godine doktorskih studija na Stanfordskom odsjeku za kompjuterske nauke koji je pomogao u pokretanju Stanford centar za istraživanje modela temelja (CRFM). Pročitajte njihovu studiju "Emerging Abilities of Large Language Models,", napisan u saradnji sa naučnicima iz Google Research-a, Univerziteta Stanford, UNC Chapel Hill i DeepMind-a.

izrada BlogInnovazione.it

Tagovi: vještačka inteligencijalarge language modelsLLMumjetne neuronske mreže

4. oktobar 2022. 8:04

sljedeći Japan promoviše WEB3 usluge koje koriste Metaverse i NFT"

Prethodna «Šta je održivost? Jedanaesti cilj UN-ove agende 2030: Održivi gradovi

Nedavni članak

Comunicati Stampa

Veeam nudi najsveobuhvatniju podršku za ransomware, od zaštite do odgovora i oporavka

Coveware od strane Veeam-a će nastaviti da pruža usluge odgovora na incidente u slučaju sajber iznude. Coveware će ponuditi mogućnosti forenzike i sanacije…

23 april 2024

Članci

Zelena i digitalna revolucija: Kako prediktivno održavanje transformira industriju nafte i plina

Prediktivno održavanje revolucionira sektor nafte i plina, s inovativnim i proaktivnim pristupom upravljanju postrojenjima.…

22 april 2024

Članci

Britanski antimonopolski regulator podigao je BigTech uzbunu zbog GenAI

UK CMA izdao je upozorenje o ponašanju Big Tech-a na tržištu umjetne inteligencije. Tamo…

18 april 2024

Comunicati Stampa

Casa Green: energetska revolucija za održivu budućnost u Italiji

Uredba o „zelenim kućama“, koju je formulisala Evropska unija za poboljšanje energetske efikasnosti zgrada, završila je svoj zakonodavni proces sa…

18 april 2024

Kratka analiza novih vještina u velikim jezičkim modelima

Od specifičnog zadatka do općeg zadatka

Hitan slučaj kao ponašanje

Nedavni članak

Veeam nudi najsveobuhvatniju podršku za ransomware, od zaštite do odgovora i oporavka

Zelena i digitalna revolucija: Kako prediktivno održavanje transformira industriju nafte i plina

Britanski antimonopolski regulator podigao je BigTech uzbunu zbog GenAI

Casa Green: energetska revolucija za održivu budućnost u Italiji

Nedavni članak

Citat