Artikler

Utgivere og OpenAI signerer avtaler for å regulere flyten av informasjon som behandles av kunstig intelligens

Sist mandag ble Financial Times annonserte en avtale med OpenAI.

FT lisensierer sin journalistikk i verdensklasse for å trene ChatGPT-modeller.

Axel Springer og Associated Press har allerede inngått lignende avtaler, der OpenAI tilbyr millioner for retten til å bruke innhold.

Innholdsfortegnelse

Beregnet lesetid: 4 minutter

ChatGPT har imidlertid blitt trent på mye annet web-cracket innhold som OpenAI betalte ikke. Så hvorfor betaler OpenAI for noen datasett og ikke andre?

Lisensavtaler

OpenAIs lisensavtaler ser ut til å sende en klar melding: vi bruker innholdet ditt uansett, så signer en avtale med oss, ellers blir du etterlatt. Hovedfordelen med en lisensavtale ser ut til å være fremtredende i ChatGPTs svar. Noen utgivere vil kanskje også befeste et forhold til den neste store informasjonsdistribusjonskanalen før den tar over. Det ser imidlertid ut til at OpenAI fortsatt bruker mye innhold fra utgivere.

The New York Times, som brukes mye mer i GPT-2s WebText-datasett, saksøker OpenAI for brudd på opphavsrett om akkurat dette emnet.

strategi

En innholdslisensavtale med OpenAI virker som den eneste måten for utgivere å holde seg relevante i en tidsalder med kunstig intelligens. I pressemeldingen, John Ridding, administrerende direktør i Financial Times Group, sier at denne avtalen vil "utvide omfanget" av arbeidet deres, samtidig som det gir "foreløpig innsikt i hvordan innhold vises gjennom kunstig intelligens."

Teknologiselskapenes meninger

OpenAIs lisensavtaler har reist flere spørsmål om innholdet ChatGPT bruker gratis. Teknologiselskaper hevder at generativ AI er en "rettferdig bruk" av opphavsrettsbeskyttede verk fordi det forvandler dem til noe nytt. AI-verdenen hevdet også å bruke en lignende modell som Google Search, som cacher opphavsrettsbeskyttet innhold for å lage et nyttig verktøy for å søke etter informasjon. I likhet med Google har AI chatbots nylig begynt å inkludere hyperkoblinger. Før eller senere vil en domstol måtte avgjøre om generativ kunstig intelligens er «rettferdig bruk».

Bokforfattere og utgivere er ikke de eneste OpenAI ser ut til å hente innhold fra. New York Times rapporterte nylig at OpenAI trente GPT-4 på over en million timer med transkriberte YouTube-videoer. Dager før rapporten ble publisert, sa YouTubes administrerende direktør at bruk av videoene for AI-trening ville være et "klart brudd" på retningslinjene.

OpenAIs innholdslisensavtaler gjør vannet i diskusjonen. Selskapet bruker på en eller annen måte Internett-innhold gratis, samtidig som de betaler andre for arbeidet deres. Andre teknologiselskaper, som Apple, har angivelig vært mer proaktive når det gjelder å betale for all treningsdata. Adobe betalte angivelig $3 per minutt med video for å trene opp AI-videogeneratoren.