Wouter Hoeffnagel - 09 april 2024

AI-modellen OpenAI en Google getraind met YouTube-videos

Zowel OpenAI als Google hebben AI-modellen getraind met behulp van transcripties van YouTube-video's. In het geval van OpenAI gaat het om meer dan een miljoen uur aan YouTube-video's.

AI-modellen OpenAI en Google getraind met YouTube-videos image

Dit meldt The New York Times op basis van bronnen. OpenAI zou voor de werkwijze gebruik hebben gemaakt van een spraakherkenningstool genaamd Whisper. Deze tool was in staat YouTube-video's te transcriberen. Meer dan een miljoen uur aan YouTube-video's zijn naar verluid met behulp van de tool omgezet in tekst.

Ook Google zelf hanteert werkwijze

Google zou op de hoogte zijn geweest van het scrapen van de YouTube-videos en dit oogluikend hebben toegelaten. Aanleiding hiervoor was dat het Amerikaanse techbedrijven zelf eveneens AI-modellen traint met behulp van dergelijke transcripties. Het gebruik van transcripties van YouTube-videos schendt mogelijk echter de auteursrechten van videomakers.

The New York Times wijst op op interne opnames van Meta. Hieruit blijkt dat managers, technici en juridisch experts onder meer onderzochten of zik auteursrechtelijk beschermd materiaal op internet zonder toestemming konden gebruiken, ondanks het risico op rechtszaken.

Nutanix BW start 6 mei - 20 mei
Nutanix BN start 6 mei - 20 mei