Witold Kepinski - 25 maart 2024

Python is de favoriete programmeertaal voor AI-ontwikkeling

Python is de favoriete programmeertaal voor AI-ontwikkeling en de verwerking van ongestructureerde data is het afgelopen jaar met 123% toegenomen. Deze resultaten zijn gebaseerd op gebruiksgegevens van meer dan 9.000 Snowflake-klanten en samengevat in het nieuwe Data Trends 2024-rapport van Snowflake.

Python is de favoriete programmeertaal voor AI-ontwikkeling image

Volgens het datacloud-bedrijf Snowflake worden grote taalmodellen (LLM's) steeds vaker ingezet voor het creëren van chatbots. Met de voortdurende revolutie in generatieve AI is het percentage chatbots ten opzichte van het totale aantal beschikbare LLM-apps gestegen van ongeveer 18 naar zo'n 46% in mei 2023 - en deze trend zet zich voort. Na onderzoek onder de ontwikkelaarsgemeenschap van Streamlit, blijkt bovendien dat bijna 65% van de respondenten hun LLM-projecten richt op werkgerelateerde doeleinden. Dit duidt op een groeiende belangstelling voor het benutten van generatieve AI om de medewerkersproductiviteit, efficiëntie en inzichten te verbeteren.

Deze resultaten zijn gebaseerd op gebruiksgegevens van meer dan 9.000 Snowflake-klanten en samengevat in het nieuwe Data Trends 2024-rapport van Snowflake. Het rapport richt zich op hoe wereldwijde bedrijfs- en technologieleiders resources zoals AI gebruiken om hun datafundament op te bouwen en toekomstige bedrijfsvoeringen te transformeren. De nieuwe data tonen een verschuiving van LLM-applicaties met op tekst gebaseerde invoer (2023: 82%, 2024: 54%) naar chatbots met iteratieve invoer, met de mogelijkheid om een natuurlijk gesprek te voeren.

"Conversatie-apps zijn in opkomst, omdat dat de manier is waarop mensen zijn geprogrammeerd om te communiceren. En nu is het zelfs nog eenvoudiger om te praten met een applicatie," legt Jennifer Belissent, Principal Data Strategist bij Snowflake uit. "We verwachten dat deze trend zich zal voortzetten zodra het gemakkelijker wordt om converserende LLM-applicaties te bouwen en implementeren, vooral wetende dat de onderliggende data goed beheerd en beschermd blijven. Met die gemoedsrust zullen deze nieuwe interactieve en zeer veelzijdige chatbots zowel aan de zakelijke behoeften als aan de gebruikersverwachtingen voldoen."

Meer dan 33.000 LLM-applicaties in negen maanden

De afgelopen negen maanden hebben 20.076 ontwikkelaars uit de Streamlit-gemeenschap van Snowflake meer dan 33.143 LLM-apps gebouwd. Python staat bovenaan als de meest prominente programmeertaal voor het ontwikkelen van AI-projecten vanwege zijn gebruiksgemak, actieve ontwikkelaarsgemeenschap en uitgebreide ecosysteem van bibliotheken en frameworks. In Snowpark, een platform waarmee ontwikkelaars snel en kosteneffectief apps kunnen bouwen, is het gebruik van Python significant sneller gegroeid dan dat van Java en Scala (het afgelopen jaar) - Python groeide met 571%, Scala met 387%en Java met 131%. Python stelt ontwikkelaars in staat om sneller te werken, prototyping en experimenten te versnellen, waardoor ontwikkelingsteams over het algemeen meer kunnen leren tijdens de vroege verkenningen van baanbrekende AI-projecten.

Wat betreft applicatieontwikkeling, is het een trend om de programmering van LLM-applicaties direct op het platform te laten plaatsvinden waar de data worden beheerd. Dit blijkt uit een stijging van 311% in Snowflake Native Apps - waarmee de ontwikkeling van apps direct op het Snowflake-platform mogelijk is - tussen juli 2023 en januari 2024. Door applicaties te ontwikkelen op één enkel dataplatform, wordt de noodzaak om data naar derde partijen te exporteren geëlimineerd, wat resulteert in een snellere ontwikkeling en implementatie van applicaties, terwijl operationele onderhoudskosten worden verlaagd.

Data Governance in bedrijven wordt steeds belangrijker

Met de adoptie van AI verhogen bedrijven de analyse en verwerking van hun ongestructureerde data. Dit stelt bedrijven in staat om onontdekte databronnen te ontdekken, waardoor een moderne benadering van databeheer cruciaal is om gevoelige data te beschermen. Uit het rapport blijkt dat bedrijven de verwerking van ongestructureerde data het afgelopen jaar met 123% hebben verhoogd. IDC schat dat tot 90% van de data in de wereld ongestructureerd is, zoals video's, afbeeldingen en documenten. Schone data geven taalmodellen een voorsprong, dus het ontsluiten van deze onontgonnen 90% biedt een aantal zakelijke voordelen.

“Data governance gaat niet over het afsluiten van data, maar uiteindelijk over het ontsluiten van de waarde van data,” zei Belissent. “We verdelen governance in drie pijlers: het kennen, het beveiligen en het gebruiken van data om die waarde te leveren. Onze klanten gebruiken nieuwe functies om data te taggen en te classificeren, zodat de juiste toegangs- en gebruikspolicies kunnen worden toegepast. Het gebruik van alle functies voor databeheer is met 70 tot 100% toegenomen. Als gevolg hiervan is het aantal query's van beschermde objecten met 142% gegroeid. Wanneer de data zijn beschermd, kunnen ze veilig worden gebruikt. Dat geeft gemoedsrust.”

“Afzonderlijk beschouwd is elk van deze trends een enkel datapunt dat laat zien hoe organisaties over de hele wereld verschillende uitdagingen aanpakken. Wanneer ze samen worden overwogen, vertellen ze een groter verhaal over hoe CIO's, CTO's en CDO's hun organisaties moderniseren, AI-experimenten aanpakken en dataproblemen oplossen - allemaal noodzakelijke stappen om te profiteren van de kansen die geavanceerde AI biedt,” zegt Belissent. “Het belangrijkste om te begrijpen is dat het tijdperk van generatieve AI geen fundamentele verandering in de datastrategie vereist. Het vereist echter wel een versnelde uitvoering van die strategie. Het vereist het nog sneller afbreken van datasilo’s en het openen van toegang tot databronnen, waar ze zich ook bevinden in het bedrijf of in een breder data-ecosysteem.”

Het volledige rapport "Data Trends 2024" is hier te vinden.