SELECTSELECT

SELECT

Snowflake BUILD 2025 : récapitulatif

By Jeff SkoldbergNov 20, 20257 min read

Cette page est également disponible en English, Deutsch, Español, Italiano, 日本語 et Português.

Snowflake BUILD 2025 a apporté son lot de nouvelles fonctionnalités et de partenariats axés sur l'IA, l'intégration de données et la productivité des développeurs. Voici un tour d'horizon rapide des principales annonces.

Socle de données : intégration et connectivité

Concevoir des produits d'IA commence par la mise en place d'un socle de données propre.

Openflow Snowflake Deployment (GA)

Un service d'intégration de données ouvert, extensible, managé et multimodal, qui prend en charge les données structurées et non structurées, en batch comme en streaming. Désormais en GA sur AWS et Azure pour le déploiement managé par Snowflake, il rend les flux de données fluides. Auparavant, ce service n'était proposé qu'en mode Bring your own Cloud, avec un Openflow déployé sur AWS puis connecté à Snowflake. Le déploiement Snowflake simplifie considérablement la création et la gestion. Je l'ai testé ce week-end : la configuration s'est faite sans difficulté, mais la prise en main du produit demande un petit temps d'apprentissage.

Snowflake AI Data Cloud rencontre SAP Business Data Cloud

Snowflake a annoncé une intégration zero-copy bidirectionnelle entre SAP Business Data Cloud et Snowflake AI Data Cloud. Cette fonctionnalité offre un accès simplifié à des données SAP organisées et prêtes à l'emploi, avec préservation du contexte métier, pour accélérer l'IA et l'analytique. SAP BDC harmonise les données entre les applications SAP. Les clients SAP qui ne sont pas encore clients Snowflake auront accès à SAP Snowflake, un produit Snowflake intégré à SAP BDC.

Snowflake propose désormais des intégrations zero-copy avec Workday (en développement), Salesforce, Oracle (Public Preview prochainement) et SAP.

Annonces Snowflake AI

Snowflake Intelligence (GA)

Snowflake Intelligence est présenté comme l'avenir du travail : il s'agit de l'interface façon ChatGPT de Snowflake destinée aux utilisateurs métiers non techniques. Nous en parlons beaucoup chez SELECT ; la fonctionnalité est désormais en GA sur tous les clouds Snowflake.

Cortex Code (Private Preview)

Cortex Code est un assistant IA pour coder et explorer votre infrastructure Snowflake, directement intégré à Snowsight. Il facilite les tâches d'administration, la sécurité et la gouvernance, et propose un assistant de codage IA piloté en langage naturel.

Cortex Agents API (GA)

Les agents IA managés de Snowflake récupèrent et analysent à la fois des données structurées et non structurées en s'appuyant sur des modèles de raisonnement robustes. Ils délivrent des insights précis via une API REST pratique, avec une sécurité et une gouvernance unifiées.

Cortex Knowledge Extensions (GA)

Les CKE de Snowflake intègrent des données non structurées tierces aux systèmes agentiques grâce au partage sécurisé de documents indexés via Cortex Search Service. Accédez à des sources de contenu sous licence — actualités, recherches — en quasi temps réel, tout en gardant vos prompts au sein de votre compte. Cette fonctionnalité passe de Public Preview à GA.

Snowflake Managed MCP Server (GA)

Le MCP managé de Snowflake permet à l'ensemble de vos investissements Snowflake d'être pilotés par l'outil d'IA de votre choix grâce au Model Context Protocol. Des outils comme Claude, ChatGPT ou d'autres applications basées sur des LLM peuvent ainsi accéder en toute sécurité à vos données et à votre infrastructure Snowflake et interagir avec elles. En adoptant le standard ouvert MCP, Snowflake permet à votre assistant IA d'interroger les données, de comprendre votre schéma, d'exécuter du SQL et d'exploiter tous vos investissements Snowflake sans avoir à développer d'intégrations sur mesure.

Pour en savoir plus sur la création du serveur MCP au sein de votre compte Snowflake, consultez la documentation ici.

Online Feature Store for ML (Public Preview)

Service à faible latence (<50 ms P90) de features ML pour des cas d'usage d'inférence en ligne tels que la détection de fraude et les recommandations en temps réel. Cohérence automatisée avec les pipelines de features offline et haute disponibilité, sans gestion d'infrastructure.

Contrôles de gouvernance des coûts pour AISQL (GA prochainement)

Un framework de tagging personnalisable qui permet aux administrateurs de suivre, gérer et appliquer automatiquement des budgets de dépenses IA. Configurez des notifications ou des actions personnalisées déclenchées dès que les dépenses dépassent certains seuils.

Partenariat Snowflake / Vercel

Snowflake a annoncé une intégration avec l'outil de développement assisté par IA de Vercel, v0. Elle permet de créer et de déployer des applications Next.js orientées données sur Snowpark Container Services en langage naturel. L'architecture séparée maintient le calcul et les données dans Snowflake, tandis que Vercel gère les couches applicative et d'authentification, en héritant automatiquement des politiques de sécurité Snowflake existantes. Les utilisateurs peuvent dialoguer avec v0 pour interroger des données et générer des applications complètes avec des routes API déployables en un clic. L'intégration est actuellement en phase de liste d'attente.

D'après ce que j'en perçois, cela facilitera grandement la création d'applications IA modernes et soignées déployées dans Snowflake.

Plateforme de données et infrastructure

Storage Lifecycle Policies

Voici une fonctionnalité que tout data engineer devrait s'approprier : les Storage Lifecycle Policies permettent de déplacer automatiquement des données vers le stockage COOL ou COLD, ou de supprimer une ligne, selon la politique définie et l'âge de l'enregistrement. Plus besoin de procédures stockées pour appliquer une politique de rétention, et vous bénéficiez en prime de tiers de stockage moins coûteux. Une image valant mille mots, voici quelques visuels issus de la documentation Snowflake :

Passons en revue tous les éléments de coût des Storage Lifecycle Policies de Snowflake :

Stockage :

  • Le stockage Cool coûte 4 $ par To/mois sur AWS et les données restent immédiatement interrogeables. Une fois les données déplacées, vous devez les conserver 90 jours, sans quoi des frais de durée minimale de stockage seront facturés.
  • Le stockage Cold coûte 1 $ par To/mois. La récupération des données du tier Cold peut prendre jusqu'à 48 heures. La durée d'archivage minimale est de 180 jours, avec des frais en cas de suppression anticipée.

Coût d'exécution de la policy / coût d'archivage :

  • Les policies s'exécutent une fois toutes les 24 heures via le Serverless Compute managé par Snowflake pour déplacer vos données. Ce compute serverless bénéficie d'un multiplicateur de crédits de 50 %, autrement dit il coûte la moitié d'un warehouse traditionnel. Snowflake détermine la taille de compute nécessaire.
  • Vous êtes également facturé 0,05 crédit par tranche de 1 000 fichiers archivés.

Coût de récupération des données :

  • Vous êtes facturé 0,05 crédit par tranche de 1 000 fichiers récupérés.

Snowflake Postgres (Public Preview prochainement, régions limitées)

Un service PostgreSQL entièrement managé sur Snowflake AI Data Cloud, conçu pour des workloads transactionnels rapides à fort volume (OLTP). Avec ce service, vous êtes opérationnel en quelques minutes, avec une charge d'administration et de gestion réduite. Les extensions Postgres populaires telles que PG Vector et PGIS sont incluses d'office.

pg_lake (GA)

pg_lake est un ensemble d'extensions PostgreSQL open source qui permet à PostgreSQL de gérer votre catalogue Iceberg. Ducklake a été le premier à le proposer, et il est logique de pouvoir s'appuyer sur une base de données relationnelle pour gérer le catalogue Iceberg. Cela devrait faciliter l'exploration des versions et le time travel, tout en améliorant les performances de la couche de métadonnées Iceberg. Pour en savoir plus, consultez le repo GitHub.

Crédit image

Hybrid Tables sur Azure (GA)

Les Hybrid Tables, qui combinent capacités transactionnelles et analytiques, sont désormais disponibles en GA sur Azure.

Horizon Catalog : écriture vers n'importe quel Iceberg (GA)

Apache Polaris est désormais intégré à Horizon Catalog et permet d'écrire dans n'importe quelle table Iceberg avec les mêmes capacités de tagging, de gouvernance et de lineage.

Continuité d'activité et reprise après sinistre pour les tables Iceberg managées par Snowflake (GA)

La BDCR est désormais disponible pour les tables Iceberg managées par Snowflake.

Interactive Tables et Warehouses (GA prochainement)

Les Interactive Tables sont optimisées pour l'ingestion et l'interrogation en streaming temps réel. Elles s'appuient sur les Interactive Warehouses, toujours actifs avec des caches préchauffés. Elles sont conçues pour des analyses en moins d'une seconde nécessitant faible latence et forte concurrence.

Expérience développeur

Workspaces (GA)

Les Workspaces passent en GA ! Pour rappel, il s'agit d'un environnement de développement centralisé et basé sur des fichiers, intégré à Snowsight, pour unifier l'édition de code et le contrôle de version. Les Workspaces se connectent à Git pour la gestion de version et la collaboration, et peuvent également exécuter dbt. Snowflake a aussi annoncé les Shared Workspaces : vous pouvez désormais partager votre workspace avec une équipe.

Intégration Git améliorée (GA)

Snowsight prend désormais en charge les dépôts auto-hébergés, avec des améliorations majeures de l'intégration Git. Une application GitHub Actions est disponible sur la Marketplace pour simplifier l'intégration CI/CD.

dbt Projects on Snowflake (GA)

Créez, testez, déployez et supervisez vos projets de transformation de données dbt directement dans Snowflake. Plus besoin de gérer l'infrastructure dbt Core. Vous pouvez désormais importer des projets existants ou en créer de nouveaux dans les Snowsight Workspaces. Cette fonctionnalité, en Public Preview depuis le Snowflake Summit de juin, passe aujourd'hui en GA.

Snowpark Connect pour Apache Spark™ (GA)

Exécutez votre code Apache Spark existant (DataFrame, SQL) directement sur Snowflake, avec un effort de migration minimal. Snowpark Connect élimine la gestion des clusters Spark et les frais d'egress, tout en délivrant des performances 5,6x supérieures et 41 % d'économies de TCO en moyenne. Cette fonctionnalité était en Preview depuis notre dernier récapitulatif What's New in Snowflake et passe désormais en GA.

Snowflake Optima (GA)

Un moteur d'optimisation de workloads qui apprend automatiquement et en continu de vos patterns d'utilisation. Il prend en charge l'indexation et la collecte de métadonnées, supprimant le besoin de tuning manuel pour améliorer les performances des requêtes.

Partage et collaboration de données

Partage des Semantic Views (GA)

Les fournisseurs de données peuvent désormais partager des semantic views en complément des données structurées, ouvrant la voie à l'interrogation en langage naturel. Les développeurs peuvent ainsi intégrer facilement les données partagées dans des applications IA et des systèmes agentiques, sans prétraitement supplémentaire.

Partage de formats de tables ouverts (GA)

Partagez des données stockées dans des formats de tables ouverts comme Iceberg sur l'ensemble de la plateforme Snowflake.

En conclusion

Cet article couvre les temps forts de Snowflake Build 2025. Je tiens à remercier Vino Duraisamy pour la publication sur LinkedIn de cette excellente slide de synthèse, qui aborde quelques annonces supplémentaires.

Jeff est consultant Data & Analytics, fort de plus de 15 ans d'expérience dans l'automatisation des insights et l'exploitation des données pour piloter les processus métier. Côté technologie, il est spécialisé sur Snowflake + dbt + Tableau. Côté secteurs, il a travaillé dans les services publics, les essais cliniques, l'édition, les biens de grande consommation et l'industrie manufacturière. N'hésitez pas à le contacter à tout moment : [email protected].