Artikler

Utgivere og OpenAI signerer avtaler for å regulere flyten av informasjon som behandles av kunstig intelligens

Sist mandag ble Financial Times annonserte en avtale med OpenAI.

FT lisensierer sin journalistikk i verdensklasse for å trene ChatGPT-modeller.

Axel Springer og Associated Press har allerede inngått lignende avtaler, der OpenAI tilbyr millioner for retten til å bruke innhold.

Beregnet lesetid: 4 minutter

ChatGPT har imidlertid blitt trent på mye annet web-cracket innhold som OpenAI betalte ikke. Så hvorfor betaler OpenAI for noen datasett og ikke andre?

Lisensavtaler

OpenAIs lisensavtaler ser ut til å sende en klar melding: vi bruker innholdet ditt uansett, så signer en avtale med oss, ellers blir du etterlatt. Hovedfordelen med en lisensavtale ser ut til å være fremtredende i ChatGPTs svar. Noen utgivere vil kanskje også befeste et forhold til den neste store informasjonsdistribusjonskanalen før den tar over. Det ser imidlertid ut til at OpenAI fortsatt bruker mye innhold fra utgivere.

The New York Times, som brukes mye mer i GPT-2s WebText-datasett, saksøker OpenAI for brudd på opphavsrett om akkurat dette emnet.

strategi

En innholdslisensavtale med OpenAI virker som den eneste måten for utgivere å holde seg relevante i en tidsalder med kunstig intelligens. I pressemeldingen, John Ridding, administrerende direktør i Financial Times Group, sier at denne avtalen vil "utvide omfanget" av arbeidet deres, samtidig som det gir "foreløpig innsikt i hvordan innhold vises gjennom kunstig intelligens."

Nyhetsbrev for innovasjon
Ikke gå glipp av de viktigste nyhetene om innovasjon. Registrer deg for å motta dem på e-post.

Teknologiselskapenes meninger

OpenAIs lisensavtaler har reist flere spørsmål om innholdet ChatGPT bruker gratis. Teknologiselskaper hevder at generativ AI er en "rettferdig bruk" av opphavsrettsbeskyttede verk fordi det forvandler dem til noe nytt. AI-verdenen hevdet også å bruke en lignende modell som Google Search, som cacher opphavsrettsbeskyttet innhold for å lage et nyttig verktøy for å søke etter informasjon. I likhet med Google har AI chatbots nylig begynt å inkludere hyperkoblinger. Før eller senere vil en domstol måtte avgjøre om generativ kunstig intelligens er «rettferdig bruk».

Bokforfattere og utgivere er ikke de eneste OpenAI ser ut til å hente innhold fra. New York Times rapporterte nylig at OpenAI trente GPT-4 på over en million timer med transkriberte YouTube-videoer. Dager før rapporten ble publisert, sa YouTubes administrerende direktør at bruk av videoene for AI-trening ville være et "klart brudd" på retningslinjene.

OpenAIs innholdslisensavtaler gjør vannet i diskusjonen. Selskapet bruker på en eller annen måte Internett-innhold gratis, samtidig som de betaler andre for arbeidet deres. Andre teknologiselskaper, som Apple, har angivelig vært mer proaktive når det gjelder å betale for all treningsdata. Adobe betalte angivelig $3 per minutt med video for å trene opp AI-videogeneratoren.

Relaterte lesninger

BlogInnovazione.it

Nyhetsbrev for innovasjon
Ikke gå glipp av de viktigste nyhetene om innovasjon. Registrer deg for å motta dem på e-post.

Siste artikler

Maskinlæring: Sammenligning mellom Random Forest og beslutningstre

I en verden av maskinlæring spiller både tilfeldige skog- og beslutningstrealgoritmer en viktig rolle i kategorisering og...

17 mai 2024

Hvordan forbedre Power Point-presentasjoner, nyttige tips

Det er mange tips og triks for å lage flotte presentasjoner. Målet med disse reglene er å forbedre effektiviteten, smidigheten til...

16 mai 2024

Hastighet er fortsatt spaken i produktutviklingen, ifølge Protolabs-rapporten

"Protolabs Product Development Outlook"-rapport utgitt. Undersøk hvordan nye produkter bringes ut på markedet i dag...

16 mai 2024

De fire pilarene for bærekraft

Begrepet bærekraft er nå mye brukt for å indikere programmer, initiativer og handlinger som tar sikte på å bevare en bestemt ressurs...

15 mai 2024

Hvordan konsolidere data i Excel

Enhver virksomhet produserer mye data, selv i forskjellige former. Skriv inn disse dataene manuelt fra et Excel-ark for å...

14 mai 2024

Cisco Talos kvartalsvise analyser: bedrifts-e-poster målrettet av kriminelle Produksjon, utdanning og helsevesen er de mest berørte sektorene

Kompromisset med bedrifts-e-poster økte mer enn det dobbelte i de tre første månedene av 2024 sammenlignet med siste kvartal av...

14 mai 2024

Interface segregation principle (ISP), fjerde SOLID-prinsipp

Prinsippet for grensesnittsegregering er ett av de fem SOLID prinsippene for objektorientert design. En klasse skal ha...

14 mai 2024

Hvordan organisere data og formler best i Excel, for en godt utført analyse

Microsoft Excel er referanseverktøyet for dataanalyse, fordi det tilbyr mange funksjoner for å organisere datasett,...

14 mai 2024

Les Innovasjon på ditt språk

Nyhetsbrev for innovasjon
Ikke gå glipp av de viktigste nyhetene om innovasjon. Registrer deg for å motta dem på e-post.

Følg oss