Assister cette année au Snowflake Summit, la plus grande conférence Data et IA au monde, fut une expérience électrisante. Dès l'ouverture de la keynote, le message était clair : Snowflake ne se contente pas d'itérer, l'entreprise redéfinit le champ des possibles sur les plateformes de données, les workloads d'IA et la productivité métier. Avec une vague de lancements axés sur l'économie de la plateforme, la gouvernance et l'automatisation intelligente, les annonces de cette année marquent un bond en avant majeur pour les organisations data-driven.
Passons en revue l'ensemble des annonces du Snowflake Summit 2025 !
Économie de la plateforme
Snowflake a multiplié les annonces autour de l'amélioration de son modèle économique : observabilité des coûts et meilleure rentabilité côté compute et ingestion.
Organizational Usage Views
Ces vues offrent un point de contrôle unique pour visualiser l'ensemble des dépenses et de la consommation Snowflake à travers différentes régions et différents clouds, et obtenir une vision globale de l'utilisation des ressources. Une avancée notable, car il était auparavant difficile d'interroger des vues comme "query_history" sur plusieurs comptes Snowflake. À noter cependant : la plupart de ces Account Views sont mises à jour avec un délai pouvant atteindre 24 heures et entraînent un coût supplémentaire, puisqu'elles sont considérées comme des premium views.
Spend Anomalies
Cette fonctionnalité envoie des notifications lorsque les dépenses Snowflake d'une organisation sortent des plages attendues, ce qui permet d'identifier et de maîtriser proactivement les hausses de coûts imprévues. Bon point : on peut abonner n'importe quelle adresse e-mail à ces alertes, contrairement aux monitors classiques qui ne notifient que les administrateurs de compte. Autre atout : les monitors aux niveaux Account et Org sont accessibles depuis la même page.
Budgets par Query Tags et Object Tags
Jusqu'ici, Snowflake ne permettait de définir des budgets que par Warehouse. Cette nouveauté permet de classifier la consommation et ouvre la voie à des modèles de refacturation plus granulaires, liés à des requêtes ou des objets de base de données spécifiques. Une excellente nouvelle, car elle encourage les bonnes pratiques de réduction des coûts en autorisant la budgétisation et l'attribution des coûts ailleurs que sur un Virtual Warehouse.
Adaptive Compute
L'une des annonces les plus enthousiasmantes du Summit : cette innovation permet aux clients de définir des politiques et des intentions, et Snowflake détermine automatiquement les ressources de calcul nécessaires (types, tailles, propriétés de scaling) pour faciliter la gestion, améliorer les performances et optimiser l'utilisation. Plus besoin de se demander quelle taille de warehouse choisir pour un job : Snowflake décide à votre place et ne facture que le compute réellement utilisé, sans temps mort une fois la requête terminée.
Modèle de tarification Snowpipe Ingest simplifié
Le nouveau modèle tarifaire repose sur le volume de données ingérées dans Snowflake, et non plus sur le nombre de fichiers et le temps de compute. Beaucoup plus simple à comprendre et à anticiper, il offre une rentabilité améliorée de 50 % sur l'ingestion de données. Une tarification simplifiée, tout le monde y gagne !
Warehouses de génération 2
Ces warehouses proposent un matériel plus rapide et des optimisations logicielles, avec à la clé des performances 2,1× supérieures sur les benchmarks Snowflake et 1,9× plus rapides que Spark managé pour le scan de fichiers parquet dans des tables Iceberg. Nous avons déjà recueilli de nombreux retours clients positifs sur la Gen2 — vivement la suite !
Gouvernance des données
Snowflake Horizon Catalog (plateforme globale de gouvernance)
Il s'agit de la plateforme centrale pour gérer et gouverner les données, avec une pleine interopérabilité avec les catalogues REST basés sur Iceberg. Elle aide à identifier les données existantes et à les gouverner. Voici la liste des nouveautés rattachées à Horizon Catalog.
Sensitive Data Insights
Les évolutions d'Horizon Catalog incluent la classification automatique, le tagging et la propagation des tags pour les données sensibles, au bénéfice de la confidentialité et de la conformité. La propagation automatique des tags PII est très bienvenue : la gestion du lineage des PII reste l'un des aspects les plus délicats de la gouvernance des données !
Expectations for Data Quality
Cette fonctionnalité permet de définir des attentes en matière de fraîcheur et de volume des données, et de recevoir des alertes d'anomalie en cas d'écart. L'alerting sur la fraîcheur ouvre la voie à davantage de workloads de data engineering directement dans Snowflake, sans recourir à un orchestrateur tiers. Disponible en Private Preview.
AI Model RBAC (Role-Based Access Control)
Permet aux organisations de choisir quels modèles d'IA peuvent être utilisés par tel ou tel rôle, garantissant un accès sécurisé et contrôlé aux capacités d'IA. Un point essentiel, car certaines organisations veulent ouvrir largement l'accès à l'IA, tandis que d'autres souhaitent restreindre l'usage des modèles les plus coûteux.
Améliorations de la sécurité
Suppression progressive des connexions par simple mot de passe, introduction des programmatic access tokens, des passkeys, des applications d'authentification, du monitoring d'identifiants sur le dark web et du blocage d'IP pour renforcer la sécurité. Personnellement, c'est l'authentification par passkey qui m'enthousiasme le plus : elle réduit considérablement la friction du MFA. Les passkeys s'intègrent parfaitement à votre gestionnaire de mots de passe (ou au trousseau de votre OS) — un simple clic suffit pour se connecter.
Horizon Co-Pilot
Un assistant IA intégré à Horizon Catalog qui permet de poser des questions sur les objets non protégés ou les tags manquants, simplifiant ainsi les tâches de gouvernance. Il ouvre la voie aux utilisateurs moins techniques pour interroger leurs assets de données. Disponible en Private Preview.
External Asset Management
Autre annonce d'envergure : Horizon Catalog s'étend désormais à la découverte, à l'exposition et à la gestion des assets situés en dehors de Snowflake. Le support initial couvrira Power BI et Tableau, dbt, Airflow, SQL Server, Postgres, MySQL et Databricks. On ne sait pas encore précisément dans quelle mesure ces assets pourront être découverts et gérés, ni comment cela se traduira dans l'UI, mais nous avons hâte d'en savoir plus.
Améliorations de l'Internal Marketplace
Au menu : possibilité de curer et de publier des data products (notebooks, modèles ML, datasets), nouveaux workflows d'approbation des demandes, gestion simplifiée et interface utilisateur revisitée. De quoi fluidifier les demandes d'accès aux datasets pour les utilisateurs finaux. Actuellement en Public Preview.
Data Engineering et ingestion
Snowflake a annoncé plusieurs nouveautés côté Data Engineering : OpenFlow, Workspaces et dbt in Snowflake.
Snowflake OpenFlow
Snowflake OpenFlow est un nouveau service managé pour ingérer et traiter des données issues d'une grande variété de sources structurées et non structurées, dont SharePoint, Slack, Google Drive et les SGBDR les plus populaires. Il s'appuie sur Apache NiFi et prend en charge le déploiement sur des ressources managées par Snowflake ou dans des VPC personnalisés.
Snowflake s'invite progressivement sur le marché des connecteurs, mais cette annonce signale clairement sa volonté de devenir un acteur de premier plan de l'ingestion. Si le service managé tient ses promesses, c'est une belle opportunité pour les clients de réduire le nombre de fournisseurs. Cela étant, à ce jour, il faut configurer une infrastructure dans AWS, ce qui sera probablement rédhibitoire pour les clients en quête d'une solution entièrement managée.
Partenariat avec Oracle (intégration Xstream API)
L'intégration Xstream API permet un Change Data Capture (CDC) fluide et quasi en temps réel depuis les bases Oracle vers Snowflake. Une avancée majeure pour les clients qui utilisent des ERP basés sur Oracle (Fusion Cloud, JDE, NetSuite, etc.) et souhaitent activer l'analytique en temps réel dans Snowflake.
Snowpipe Streaming, nouvelle version
La nouvelle version de Snowpipe Streaming propose un accès SDK amélioré, des transformations stateless, du pre-clustering à l'ingestion, un débit élevé (jusqu'à 10 Go/s), et rend les données interrogeables en 5 à 10 secondes. Le nouveau SDK reste toutefois uniquement disponible en Java, ce qui en limite la portée par rapport à Python. Nous serions ravis que Snowflake propose un SDK Python (écrit en Rust, bien entendu) pour Snowpipe Streaming !
Workspaces dans Snowsight
Un environnement de développement moderne dans Snowsight pour l'édition et la curation des données, prenant en charge les worksheets, Streamlit, les notebooks, les opérations sur fichiers, les dossiers et l'intégration au contrôle de code source. Les Workspaces sont en Public Preview.
C'est personnellement l'une de mes annonces préférées de Snowflake cette année, car elle simplifie considérablement le data engineering. Nous disposons désormais d'un endroit unique pour rédiger, versionner et planifier nos pipelines de données de bout en bout. Avant les Workspaces, utiliser une intégration Git avec Snowflake relevait du parcours du combattant. Désormais, on peut naviguer dans une arborescence de fichiers, les éditer, visualiser les diffs, committer et pousser — le tout sans quitter Snowsight. J'ai hâte de me lancer avec ce nouvel outil !
dbt Projects in Snowflake
(Public Preview) Un environnement d'édition permettant de construire, tester et déployer des pipelines dbt directement dans Snowflake, avec des fonctionnalités d'observabilité et un partenariat avec dbt Labs pour intégrer le moteur dbt Fusion.
Prise en charge des providers Git auto-hébergés
Snowflake prend désormais en charge les intégrations Git auto-hébergées, dont GitLab, GitHub Enterprise, Bitbucket, Azure DevOps et AWS CodeCommit. Les équipes peuvent ainsi connecter leurs dépôts Git privés à Snowflake pour la gestion de versions, le CI/CD et le développement in-platform. Les utilisateurs peuvent cloner des dépôts, récupérer les mises à jour et référencer du code dans du SQL, des procédures ou des applications, tout en préservant la gouvernance. Cette mise à jour intègre des workflows DevOps sécurisés et flexibles directement dans Snowflake.
Migration Assistant
Migration Assistant est un service de migration de données piloté par l'IA qui accompagne les utilisateurs tout au long du processus en exploitant la sortie de Snow Convert, simplifiant ainsi les transitions complexes.
PostgreSQL dans Snowflake
Snowflake a répondu aux clients qui demandaient un magasin de données transactionnel en faisant l'acquisition de Crunchy Data, une plateforme PostgreSQL éprouvée. Postgres étant la plateforme de prédilection des agents IA, sa disponibilité dans Snowflake rendra le développement d'applications pilotées par l'IA encore plus pratique.
Snowflake Postgres proposera un service PostgreSQL managé, avec des capacités d'entreprise telles que les customer-managed keys et l'intégration au périmètre de sécurité de Snowflake, complétant l'offre par un véritable magasin de données transactionnel.
IA, agents et ML
SnowConvert AI
S'appuie sur l'IA pour simplifier les migrations de bases de données, avec tests automatisés et validation du code migré. SnowConvert AI est un logiciel autonome téléchargeable dès maintenant, ici. La conversion de dialecte semble être la fonctionnalité principale, en s'appuyant sur un Abstract Syntax Tree (AST) et une Symbol Table pour créer un modèle sémantique du code source et faciliter la conversion vers du SQL Snowflake.
Notebooks et API ML distribuées
Les notebooks Snowflake et le container runtime sont désormais en disponibilité générale, accompagnés d'API ML distribuées pour accélérer l'exécution et le runtime des modèles.
Cortex AI SQL
Étend les Cortex Functions avec un ensemble de fonctions d'extraction d'entités, d'agrégation et de filtrage sur des données multimodales (texte, image, audio) directement en SQL. Snowflake parle de la plus grande évolution de SQL depuis le "group by all", et nous sommes du même avis !
- Les fonctions concernées sont : ai_filter, ai_agg, as_summarize_agg, ai_classify, ai_transcribe, ai_embed, ai_similarity
AI Join permet de joindre des tables à partir de prompts en langage naturel (semantic join), avec une optimisation du moteur de requête pour une exécution plus rapide et moins coûteuse. Par exemple : joindre des CV à des offres d'emploi sur la base d'une évaluation d'adéquation par l'IA.
À noter : Snowflake mise fortement sur le stockage de données non structurées, qui peuvent désormais être interrogées via l'IA. Cas d'usage typique : laisser l'IA analyser une colonne contenant des fichiers .wav ou des PDF, et lui demander d'identifier les plaintes clients les plus fréquentes dans ces enregistrements ou documents.
Fonction AI Complete
Utilise de grands modèles de langage pour comprendre des images, transcrire de l'audio et synthétiser des insights, ce qui permet de stocker texte, image et audio dans une seule table. Une nouvelle avancée dans l'univers des données non structurées, qui ouvre un champ immense de possibilités analytiques.
Fonction AI Aggregate
Gère les limites de fenêtre de contexte sur de gros volumes de données via une approche map-reduce multi-étapes, fournissant des insights synthétisés sur plusieurs lignes.
Semantic Views
Un nouveau type de vue conçu pour capturer et exposer le contexte métier — métriques, dimensions, définitions — autour des données, aussi bien pour des usages IA que BI.
Semantic SQL
Un langage de requête enrichi conçu spécifiquement pour interroger les semantic views, gage de meilleures performances et de réponses plus précises.
Cortex Knowledge Extensions
Ces extensions permettent aux organisations d'intégrer des données non structurées issues de sources externes — articles de presse, papiers de recherche, revues scientifiques — dans leurs applications d'IA, tout en garantissant le respect des droits de propriété intellectuelle grâce à l'isolation et à une attribution claire. Disponibles via le Marketplace.
Cortex Agents
Cortex Agents, désormais en disponibilité générale, permettent d'interroger en langage naturel des données structurées et non structurées dans Snowflake. Ils orchestrent des workflows complexes, fournissent du raisonnement et interagissent avec divers backends et jeux de données. Ils routent automatiquement chaque portion d'une requête vers les bons outils (Cortex Analyst ou Cortex Search, par exemple) et affinent leurs réponses en fonction du contexte. Les agents peuvent aussi invoquer d'autres outils ou agents pour soutenir des applications agentiques. Une gouvernance intégrée assure un accès sécurisé et conforme, apportant à la donnée d'entreprise une IA conversationnelle digne de confiance, sans sacrifier le contrôle.
Intégration Microsoft Teams
Cette intégration amène les Cortex Agents dans Microsoft Teams, rendant la puissance de la donnée disponible directement là où les utilisateurs métier travaillent au quotidien.
Produits agentiques sur le Marketplace
Le Snowflake Marketplace prend désormais en charge les produits et applications agentiques des partenaires, élargissant l'écosystème de solutions propulsées par l'IA.
Snowflake Intelligence
Snowflake Intelligence est un nouvel agent conçu pour aider les utilisateurs métier à accéder aux insights via le langage naturel, sans compétences SQL ni programmation. Il permet d'interroger ses données en langage courant : l'agent décompose intelligemment la requête, l'achemine via les bons outils et fournit des réponses transparentes et précises. Il fonctionne aussi bien sur les données structurées que sur les documents déjà présents dans Snowflake, et prend en charge les questions de relance pour pousser l'analyse plus loin. C'est une avancée importante : elle permet aux équipes métier de prendre des décisions plus rapides et mieux éclairées, sans dépendre des équipes techniques, tout en conservant une gouvernance et une sécurité de niveau entreprise. Snowflake Intelligence sera bientôt en Public Preview. Vous pouvez vérifier votre accès sur ai.snowflake.com, la nouvelle interface destinée aux utilisateurs métier non techniques.
Data Science Agent
Data Science Agent s'inscrit dans la lignée de Snowflake Intelligence, mais s'adresse aux data scientists plutôt qu'aux utilisateurs métier non techniques. Il est conçu pour fluidifier et faire passer à l'échelle les workflows de machine learning au sein de Snowflake. Il prend en charge les prompts en langage naturel pour générer, évaluer et déployer des modèles ML directement sur les données Snowflake, réduisant le besoin d'outils externes ou de pipelines complexes. L'agent peut suggérer des features pertinentes, recommander des types de modèles, et même automatiser l'entraînement et le tuning, accélérant ainsi le développement. Résultat : la barrière d'entrée à l'analytique avancée baisse, l'expérimentation s'accélère, et l'ensemble de la modélisation et de la gouvernance des données reste au sein de la plateforme Snowflake.
In-line Co-Pilot
Un assistant IA en ligne activable via un raccourci clavier (Command+i ou Control+i) au sein de l'environnement Snowflake, pour une assistance contextuelle immédiate.
Conclusion
Avec ces avancées, Snowflake pose les bases d'un avenir où les plateformes de données sont non seulement scalables, mais aussi intelligentes, efficaces et profondément alignées sur les résultats métier. Les clients y gagnent des coûts réduits, une meilleure visibilité, une gouvernance renforcée et des outils propulsés par l'IA, accessibles là où ils travaillent. Une chose est claire : Snowflake ne se contente pas de répondre aux besoins de ses clients, l'entreprise les anticipe. La prochaine ère de la data et de l'IA est arrivée — rapide, sécurisée et profondément transformatrice. Chez SELECT, nous avons hâte de découvrir comment vous exploitez ces nouvelles fonctionnalités !
Jeff est consultant Data et Analytics, fort de plus de 15 ans d'expérience dans l'automatisation des insights et l'exploitation de la donnée pour piloter les processus métier. Côté technologie, il est spécialisé sur Snowflake + dbt + Tableau. Côté secteurs, il a travaillé pour le service public, les essais cliniques, l'édition, les biens de consommation et l'industrie. N'hésitez pas à le contacter, [email protected].