Beregnet lesetid: 4 minutter
ChatGPT har imidlertid blitt trent på mye annet web-cracket innhold som OpenAI betalte ikke. Så hvorfor betaler OpenAI for noen datasett og ikke andre?
OpenAIs lisensavtaler ser ut til å sende en klar melding: vi bruker innholdet ditt uansett, så signer en avtale med oss, ellers blir du etterlatt. Hovedfordelen med en lisensavtale ser ut til å være fremtredende i ChatGPTs svar. Noen utgivere vil kanskje også befeste et forhold til den neste store informasjonsdistribusjonskanalen før den tar over. Det ser imidlertid ut til at OpenAI fortsatt bruker mye innhold fra utgivere.
The New York Times, som brukes mye mer i GPT-2s WebText-datasett, saksøker OpenAI for brudd på opphavsrett om akkurat dette emnet.
En innholdslisensavtale med OpenAI virker som den eneste måten for utgivere å holde seg relevante i en tidsalder med kunstig intelligens. I pressemeldingen, John Ridding, administrerende direktør i Financial Times Group, sier at denne avtalen vil "utvide omfanget" av arbeidet deres, samtidig som det gir "foreløpig innsikt i hvordan innhold vises gjennom kunstig intelligens."
OpenAIs lisensavtaler har reist flere spørsmål om innholdet ChatGPT bruker gratis. Teknologiselskaper hevder at generativ AI er en "rettferdig bruk" av opphavsrettsbeskyttede verk fordi det forvandler dem til noe nytt. AI-verdenen hevdet også å bruke en lignende modell som Google Search, som cacher opphavsrettsbeskyttet innhold for å lage et nyttig verktøy for å søke etter informasjon. I likhet med Google har AI chatbots nylig begynt å inkludere hyperkoblinger. Før eller senere vil en domstol måtte avgjøre om generativ kunstig intelligens er «rettferdig bruk».
Bokforfattere og utgivere er ikke de eneste OpenAI ser ut til å hente innhold fra. New York Times rapporterte nylig at OpenAI trente GPT-4 på over en million timer med transkriberte YouTube-videoer. Dager før rapporten ble publisert, sa YouTubes administrerende direktør at bruk av videoene for AI-trening ville være et "klart brudd" på retningslinjene.
OpenAIs innholdslisensavtaler gjør vannet i diskusjonen. Selskapet bruker på en eller annen måte Internett-innhold gratis, samtidig som de betaler andre for arbeidet deres. Andre teknologiselskaper, som Apple, har angivelig vært mer proaktive når det gjelder å betale for all treningsdata. Adobe betalte angivelig $3 per minutt med video for å trene opp AI-videogeneratoren.
BlogInnovazione.it
I en verden av maskinlæring spiller både tilfeldige skog- og beslutningstrealgoritmer en viktig rolle i kategorisering og...
Det er mange tips og triks for å lage flotte presentasjoner. Målet med disse reglene er å forbedre effektiviteten, smidigheten til...
"Protolabs Product Development Outlook"-rapport utgitt. Undersøk hvordan nye produkter bringes ut på markedet i dag...
Begrepet bærekraft er nå mye brukt for å indikere programmer, initiativer og handlinger som tar sikte på å bevare en bestemt ressurs...
Enhver virksomhet produserer mye data, selv i forskjellige former. Skriv inn disse dataene manuelt fra et Excel-ark for å...
Kompromisset med bedrifts-e-poster økte mer enn det dobbelte i de tre første månedene av 2024 sammenlignet med siste kvartal av...
Prinsippet for grensesnittsegregering er ett av de fem SOLID prinsippene for objektorientert design. En klasse skal ha...
Microsoft Excel er referanseverktøyet for dataanalyse, fordi det tilbyr mange funksjoner for å organisere datasett,...