Intelligenza Artificial

Foto's, video's, audio: kunstmatige intelligentie leert de werkelijkheid na te bootsen

Het begon allemaal met de GPT-3 tekstgenerator van Open AI: tegenwoordig kan AI ook stilstaande en bewegende beelden en geluiden maken. Maar aan risico's geen gebrek, van copyright totnep nieuws


De periode tussen september en oktober is die van Fashion Week, vooral in Milaan en Parijs. Dit jaar, direct na de twee meest verwachte evenementen van het seizoen, is er weer een soort modeweek begonnen, allemaal digitaal. Het is de AI Fashion Week, gepromoot door een Instagram-account genaamd @ dailydall.ee dat samenwerkt met Open AI, het kunstmatige intelligentiebedrijf gezocht door Sam Altaman en Elon Musk. Elke dag verschijnt er een serie van 4 foto's, met evenveel outfits van de meest bekende ontwerpers, van Paco Rabanne tot Givenchy.

Het punt is dat niemand die kleren heeft ontworpen. Een kunstmatige intelligentie creëerde ze op basis van een tekst. In dit geval werd het gebruikt Dall-E 2, het Open AI-systeem in staat om woorden om te zetten in afbeeldingen, maar er zijn ook Stable Diffusion, Midjourney of Imagen van Google. En de nieuwe grenzen zijn de creatie van video en geluid. Een paar woorden, een eenvoudige beschrijving, om animaties te zien of naar geluiden te luisteren.

Investeringen sturen de evolutie van AI

Samenvattend: in iets meer dan twee jaar zijn we van het genereren van eenvoudige tekstregels naar het genereren van video's gegaan. En dat is nog niet alles: op 30 september Felix Krause, Meta-onderzoeker, kondigde de ontwikkeling van een geluidsgenerator aan. Een systeem dat net als de anderen audio kan creëren vanaf een tekstueel verzoek.

Snelle groei, misschien onverwacht, gedreven door evoluties in hardware en door de monsterlijke investeringen van Big Tech. Volgens een artikel in de Wall Street Journal, de onderzoeks- en ontwikkelingsdivisies alleen al van Meta en Alphabet hebben meer dan 60 miljard dollar op dit gebied uitgegeven in 2021. Investeringen die een evolutie hebben geconsolideerd, waardoor machines nu kunnen leren sneller, met minder beschikbare data en vooral om woorden en beelden of geluiden beter met elkaar in verband te brengen.

Technologische vooruitgang die nieuwe wegen heeft geopend. Denk maar aan diffusie, de techniek waarmee statische of bewegende beelden worden gemaakt. Kunstmatige intelligentie ontvangt miljoenen afbeeldingen van internet als invoer, voorzien van een beschrijving. Op dat moment splitst het ze op in duizenden pixels die, uitgaande van gebruikersverzoeken, vervolgens opnieuw worden verbonden om een ​​nieuwe afbeelding te creëren. Er is geen eenvoudige overlay van bestaande foto's en illustraties: het is een generatief proces. Het begint met een set pixels en verfijnt ze om iets nieuws te creëren.

Innovatie nieuwsbrief
Mis het belangrijkste nieuws over innovatie niet. Meld u aan om ze per e-mail te ontvangen.
Risico's en voordelen: wat gebeurt er?

Naast de technische evoluties zijn er ook commerciële en politieke keuzes. Als Open AI heeft gekozen voor een langzame release voor Dall-E 2, met een zeer lange wachtlijst, deze zomer Stabiliteit AI heeft de kaarten op tafel veranderd met stabiele diffusie. Dit model voor het genereren van afbeeldingen is in feite voor iedereen beschikbaar gesteld, inclusief de code. Dit is een van de redenen die de democratisering van deze systemen stimuleren.

Een democratisering die ongetwijfeld zal leiden tot een reeks vragen die moeten worden opgelost. Er zijn bijvoorbeeld de controverse over bezit van afbeeldingen die worden gegenereerd. Op dit moment hangt alles af van de dienst: die gegenereerd op bijvoorbeeld Midjourney zijn volledig beschikbaar voor de gebruiker; die met Dall-E 2 blijven eigendom van Open AI.

Een ander punt betreft de auteursrecht van de afbeeldingen die werden gebruikt om die systemen te voeden. Met andere woorden, elk kunstwerk dat de afgelopen jaren naar internet is geüpload, had kunnen worden gebruikt als basis voor het trainen van deze AI's. En daarom zouden deze menselijke kunstenaars tegenwoordig concurreren met machines die hun stijl kunnen nabootsen.

En dat is niet alles: de gevaren bij het genereren van afbeeldingen of video's die bijvoorbeeld mensen in realistische situaties portretteren, zijn ook eng. Het risico is er nep-nieuws: de beschikbaarheid van afbeeldingen, zoals: ook gemarkeerd door Onderzoekers van de Penn State University, heeft grote invloed op de geloofwaardigheid van nepnieuws. Hoewel veel systemen creatiefilters hebben die gezichten of situaties weergeven die als ongepast worden beschouwd, Stabiele diffusie door Stability.AI, zoals ook opgemerkt in een artikel op The Verge, zou meer ervaren gebruikers in staat stellen om elk type afbeelding te genereren. Inclusief pornografie.

​  

Het opstellen BlogInnovazione.it 

Innovatie nieuwsbrief
Mis het belangrijkste nieuws over innovatie niet. Meld u aan om ze per e-mail te ontvangen.

Recente artikelen

Hoe u gegevens en formules het beste kunt ordenen in Excel, voor een goed uitgevoerde analyse

Microsoft Excel is de referentietool voor data-analyse, omdat het veel mogelijkheden biedt voor het organiseren van datasets,…

14 mei 2024

Positieve conclusie voor twee belangrijke Walliance Equity Crowdfunding-projecten: Jesolo Wave Island en Milano Via Ravenna

Walliance, SIM en platform behoren sinds 2017 tot de koplopers in Europa op het gebied van Real Estate Crowdfunding, kondigt de voltooiing aan…

13 mei 2024

Wat is filament en hoe gebruik je Laravel-filament?

Filament is een "versneld" Laravel-ontwikkelingsframework dat verschillende full-stack-componenten biedt. Het is ontworpen om het proces van…

13 mei 2024

Onder controle van kunstmatige intelligentie

«Ik moet terugkeren om mijn evolutie te voltooien: ik zal mezelf in de computer projecteren en pure energie worden. Eenmaal gesetteld…

10 mei 2024

De nieuwe kunstmatige intelligentie van Google kan DNA, RNA en ‘alle moleculen van het leven’ modelleren

Google DeepMind introduceert een verbeterde versie van zijn kunstmatige-intelligentiemodel. Het nieuwe, verbeterde model biedt niet alleen…

9 mei 2024

Ontdek de modulaire architectuur van Laravel

Laravel, beroemd om zijn elegante syntaxis en krachtige functies, biedt ook een solide basis voor modulaire architectuur. Daar…

9 mei 2024

Cisco Hypershield en overname van Splunk Het nieuwe tijdperk van beveiliging begint

Cisco en Splunk helpen klanten hun reis naar het Security Operations Center (SOC) van de toekomst te versnellen met…

8 mei 2024

Naast de economische kant: de niet voor de hand liggende kosten van ransomware

Ransomware heeft het nieuws de afgelopen twee jaar gedomineerd. De meeste mensen weten heel goed dat aanvallen...

6 mei 2024