Wikipedia bundelt krachten met techbedrijven voor AI-training
Wikipedia kondigt samenwerkingen aan met verschillende grote technologiebedrijven, waaronder Microsoft, Meta en Amazon. Daarmee zet de non-profitorganisatie een belangrijke stap om te verdienen aan de sterke afhankelijkheid van techbedrijven van haar content.
De Wikimedia Foundation, die de online encyclopedie beheert, liet weten dat zij het voorbije jaar ook overeenkomsten sloot met AI-start-ups zoals Perplexity en het Franse Mistral AI. Meta en Amazon waren al eerder als partners toegetreden. Daarnaast bestond er al een samenwerking met Google, aangekondigd in 2022. Wikimedia deed de aankondigingen over samenwerkingen met bigtechbedrijven ter gelegenheid van de 25ste verjaardag van Wikipedia.
65 miljoen artikelen
De inhoud van Wikipedia speelt een cruciale rol bij het trainen van AI-modellen. De encyclopedie telt zo’n 65 miljoen artikelen in meer dan 300 talen. De inhoud van Wikipedia komt tot stand dankzij ongeveer 250.000 vrijwillige redacteuren wereldwijd. Zij schrijven, bewerken en controleren de artikelen. Het platform vormt daarmee een belangrijk onderdeel van de trainingsdata voor generatieve AI-chatbots van grote technologiebedrijven.
Dat massale gebruik heeft echter een keerzijde. Bedrijven die grote hoeveelheden vrij toegankelijke Wikipedia-informatie scrapen voor AI-training zorgen voor een sterk stijgende serverbelasting en hogere kosten. Dat weegt zwaar op de Wikimedia Foundation, die voornamelijk draait op kleine donaties van het publiek.
Om die druk te verlichten, zet Wikimedia sterker in op zijn Enterprise-dienst. Die biedt technologiebedrijven betaalde toegang tot Wikipedia-content voor trainingsdoeleinden in gestructureerde, herbruikbare formaten.
Duurzaam content-ecosysteem opbouwen
‘De toegang tot hoogwaardige en betrouwbare informatie staat centraal in onze visie op de toekomst van AI bij Microsoft,’ zegt Tim Frank, corporate vice president bij Microsoft, in een persbericht van Wikimedia. ‘Samen met Wikimedia helpen we een duurzaam content-ecosysteem op te bouwen voor het AI-internet, waarin bijdragen van makers worden gewaardeerd.’
Nieuwe omzet, zoals de pas aangekondigde techdeals, helpt Wikimedia ook om te investeren in nieuwe infrastructuur, zoals zijn netwerk van datacenters wereldwijd. De organisatie heeft zeven datacenters in de Verenigde Staten, Singapore, Nederland, Frankrijk en Brazilië. Die laatste is de recentste toevoeging en opende twee jaar geleden. Investeringen in datacenters helpen om de laadtijden van Wikipedia wereldwijd te verkorten.
In samenwerking met Data News