SQL meets AI: de technische doorbraken van Snowflake
Op 30 oktober zat ik in het Taets Art & Event Park in Zaandam voor de Snowflake World Tour, best druk met 1100 mensen uit allerlei sectoren verdeeld over 16 sessies met 31 sprekers. Enri Peters (foto), AWS Community Builder & Freelance Data Platform Engineer bij Alliander, pakt in deze blog de dingen eruit die hem zijn bijgebleven.
Martin en Maria over eenvoud
Martin Frederik begon met een quote die de toon zette: "The best ideas don't happen in isolation." Klinkt misschien cliché, maar het punt klopt als je ziet hoeveel bedrijven nog steeds in silo's werken in plaats van echt samen te werken.
Maria Wiss nam het over en maakte Snowflake's missie concreet met drie woorden: easy, connected, trusted. Het hele platform is gebouwd om complexe zaken simpel te maken, zodat je met je data kunt praten zonder data scientist te zijn, apps kunt bouwen met low code, en AI kunt gebruiken zonder technische barrières.
Belangrijk nieuws voor Nederland: Snowflake wordt launch partner voor AWS EU sovereign cloud, wat betekent dat je data gegarandeerd in Europa blijft en je volledige controle hebt over toegang. Voor finance en healthcare die streng gereguleerd zijn is dit geen nice to have maar echt nodig voor compliance.
Maria maakte nog een grap over Apache Iceberg support: "God forbid users put their data not on Snowflake storage." Grappig eigenlijk, want juist die openheid om data ook buiten Snowflake storage te kunnen gebruiken is waarom veel mensen voor het platform kiezen omdat je niet vast zit aan hun storage.
Grace over het echte probleem
Grace Adamson, AI product manager, zei gewoon waar het op staat: iedereen wil AI maar bijna niemand heeft zijn data op orde, wat resulteert in hoge ambitie maar lage gereedheid. Klinkt waarschijnlijk bekend voor veel bedrijven.
Haar aanpak om die kloof te overbruggen was praktisch met het framework "I want, Can do, You can." Eerst moet je weten wat je wil bereiken, dan zorg je dat je de goede tools hebt zoals Cortex AI, en pas dan kun je echt met AI aan de slag omdat alles op orde is.
Cortex AI doet iets belangrijks door context toe te voegen aan data zodat AI snapt waar het naar kijkt, want anders is "100" gewoon een getal terwijl het met context "100 euro omzet in Q3 voor product X in Amsterdam" wordt. Pas dan kan AI er iets zinnigs mee doen.
Ze liet ook Cortex knowledge extensions zien voor het integreren van externe data en benadrukte dat governance op elke laag zit ingebakken: RBAC, guardrails en monitoring. Het Cortex AI laboratory haalt nu 90% accuracy en wordt blijkbaar steeds beter met continue verbetering.
Voorbeelden van bedrijven die het echt gebruiken
Canva heeft 230 miljoen gebruikers waarvan een kwart vorig kwartaal AI features gebruikte om automatisch designs te maken en achtergronden te verwijderen, allemaal zonder dat gebruikers technisch hoeven te zijn.
AstraZeneca draait meer dan 118 data products in Snowflake en migreert naar Openflow, waarbij hun AI gestuurde analyse van chest x rays heeft geleid tot 90% verbetering in survival rates. Dat zijn echte levens die gered worden, niet alleen maar mooie cijfers in een presentatie.
Siemens gebruikt unified connected data om duizenden fabrieken wereldwijd te verbinden, waardoor ze real time productie kunnen optimaliseren en predictive maintenance mogelijk maken.
Ook Fiserv en PayPal werden genoemd als voorbeelden van streng gereguleerde sectoren die toch innoveren met het platform, wat aantoont dat je met de juiste governance echt vooruit kunt.
Dash en zijn demo
Dash Desai is blijkbaar de "demo king" in de Snowflake community en hij liet Snowflake Intelligence zien, wat je kunt vergelijken met de ChatGPT webinterface maar dan specifiek voor je bedrijfsdata.
Je typt vragen in gewone taal en het systeem geeft antwoorden met visualisaties waarbij je ook de onderliggende SQL queries kunt bekijken, wat best handig is voor mensen die SQL kunnen maar niet de hele dag queries willen schrijven.
Het systeem kan gepersonaliseerde agents creëren, gebruikt analyst verified queries voor accurate antwoorden, en toont citaten van de brondata zodat je kunt verifiëren waar informatie vandaan komt. Als iets onduidelijk is vraagt het om verduidelijking en werkt het iteratief naar het antwoord toe, terwijl door integratie met identity providers zoals Okta en Entra ID de data veilig toegankelijk blijft binnen je bestaande security setup.
Dash toonde semantic models met logical tables en hun relaties, waarbij het systeem begrijpt dat "beste klanten" niet alleen maar hoge omzet betekent maar ook frequente orders en hoge tevredenheid. De output kan variëren van tekst tot graphs en diagrams, met de mogelijkheid om direct vanuit de interface emails te versturen naar collega's of klanten.
De technische dingen die ertoe doen
Cortex Search gebruikt vector based search die betekenis snapt in plaats van alleen maar keywords, dus als je zoekt naar "problemen met betalen" vindt het ook "payment issues", "transactie mislukt" en "creditcard geweigerd" omdat het de onderliggende betekenis begrijpt.
Snowflake Openflow met streaming biedt 10GB per seconde data ingest en na 5 tot 10 seconden kun je al queries draaien, wat perfect is voor real time analytics en fraude detectie waar elke seconde telt.
Gen2 warehouses schalen automatisch op basis van workload, wat betekent dat een drukke ochtend meer compute krijgt en een rustige nacht minder resources gebruikt. Je betaalt alleen voor wat je daadwerkelijk gebruikt in plaats van capaciteit die je misschien nodig hebt.
Snowconvert AI automatiseert migraties door niet alleen syntax te converteren maar ook business logic te begrijpen, waardoor maanden handmatig werk nu in dagen kan gebeuren zonder dat je hele teams maandenlang bezig zijn met omzetten.
Cortex AISQL: gewoon AI in SQL
Cortex AISQL is geen losse functie maar de complete set AI capabilities binnen SQL die structured en unstructured data verenigt, zodat je met één query databases, PDFs, images en emails tegelijk kunt doorzoeken. Een verzekeraar kan bijvoorbeeld alle claims met waterschade analyseren ongeacht waar de informatie staat, of het nu in een database is of in gescande documenten.
Binnen Cortex AISQL heb je specifieke functions zoals AI_COMPLETE() voor tekst generatie en AI_AGG() voor het samenvatten van grote datasets. Met AI_COMPLETE vraag je de AI om bijvoorbeeld klantfeedback samen te vatten, gewoon in je SQL query zonder dat je Python kennis nodig hebt of aparte scripts moet schrijven.
AI_AGG() lost een echt probleem op dat veel mensen tegenkomen: normale AI functies falen bij datasets groter dan ongeveer 100 pagina's tekst vanwege de context window limieten van LLMs. AI_AGG verwerkt data in automatische batches door ze op te splitsen, parallel te verwerken en slim samen te voegen, wat in feite map reduce voor AI is. Hierdoor kun je 50.000 support tickets analyseren of zelfs terabytes data zonder je zorgen te maken over model limieten, al moet je misschien wel opletten met je rekening.
Het is ook multimodal dus je kunt text, images en audio files analyseren die als Snowflake FILE objects zijn opgeslagen, allemaal met dezelfde SQL aanpak. Wel jammer dat de betere modellen nog alleen in de US supported worden, want sommige geavanceerde modellen zijn nog niet in de EU beschikbaar dus daar wacht ik nog even op.
Waarom combineren interessant is
De echte kracht zit in het combineren van meerdere AI functions in één query, wat de mogelijkheden flink uitbreidt. Stel je voor: een verzekeraar wil dagelijks alle claims analyseren en gebruikt daarbij AI_FILTER om te checken welke claims mogelijk frauduleus zijn, terwijl ze tegelijkertijd AI_AGG gebruiken om patronen te vinden en de vraag te beantwoorden wat de top 3 redenen voor claims deze maand zijn.
Dit gebeurt allemaal in één SQL statement waarbij je filtert op fraude risico, de beschrijvingen aggregeert om trends te spotten, en alleen de verdachte gevallen te zien krijgt met de onderliggende patronen. Geen aparte tools, geen complexe pipelines, gewoon structured data zoals datums en bedragen gecombineerd met unstructured text analyse waarbij de AI het zware werk doet.
Dus de volgende keer dat iemand vraagt of je insights kunt halen uit die rommelige PDF folder of audio bestanden hoef je geen heel AI project op te starten met teams en maandenlange doorlooptijden. Je schrijft gewoon SQL zoals je altijd al deed.
Horizon Catalog voor governance
Horizon Catalog is de nieuwe umbrella naam voor collaboration tools zoals de Marketplace en Polaris, en met support voor external catalogs en Apache Iceberg kunnen bedrijven data beheren ongeacht waar het staat: AWS S3, Azure blob storage of Google Cloud Storage.
Het belangrijkste verschil met traditionele catalogs is dat Horizon business context begrijpt en weet dat "customer_id" in systeem A hetzelfde is als "klant_nummer" in systeem B. Deze semantic layer maakt cross system analytics mogelijk zonder complexe ETL pipelines die je anders zou moeten bouwen en onderhouden.
Voor bedrijven die migreren van on premise Hadoop naar de cloud biedt dit een geleidelijk migratiepad zonder dat je alles in één keer moet overzetten. Een praktisch voordeel is Snowflake connect voor Apache Spark, wat betekent dat bestaande Spark workloads gewoon kunnen blijven draaien zodat je kunt migreren zonder je hele setup overhoop te gooien.
Wat het betekent voor Nederland
Voor Nederlandse bedrijven met legacy systemen en data silo's biedt Snowflake een praktische uitweg waarbij je stap voor stap kunt moderniseren terwijl oude systemen blijven draaien. Met AWS EU sovereign cloud garanties en focus op compliance voldoet het platform aan strenge Nederlandse en Europese regelgeving zoals de AVG, waarbij de sovereign cloud belooft dat data binnen Europa blijft met controle over toegang. Het blijft natuurlijk wel een Amerikaanse cloud provider, dat moet je je realiseren.
Wat ik ervan vind
De Snowflake World Tour 2025 Amsterdam toonde dat AI voor enterprises geen verre toekomst is maar vandaag al werkt bij bedrijven zoals AstraZeneca, Canva en Siemens die er nu al echte waarde mee leveren. Het motto "Where data does more" gaat over data die actief bijdraagt aan betere beslissingen en processen in plaats van alleen maar opgeslagen te worden.
Voor Nederlandse bedrijven is de boodschap simpel: begin waar je bent, gebruik wat je hebt, en bouw stap voor stap zonder te wachten tot alles perfect is. De tools zijn beschikbaar, de voorbeelden zijn er, nu is het aan ons om ermee aan de slag te gaan en te kijken wat het voor onze eigen situatie kan betekenen.
Door: Enri Peters, AWS Community Builder & Freelance Data Platform Engineer bij Alliander