Snowflake enchaîne les nouveautés ! Tour d'horizon des fonctionnalités publiées en mars 2025, côté administration, SQL et pipelines de données.
Administration Snowflake
Classification automatique des données sensibles
Fonctionnalité en disponibilité générale depuis le 6 mars 2025. Voir la documentation pour plus de détails.
De quoi s'agit-il
La classification automatique des données sensibles est une fonctionnalité serverless de Snowflake qui détecte et tague automatiquement les données sensibles dans vos tables. Les utilisateurs créent un profil de classification et l'attribuent à un schéma : Snowflake se charge ensuite de surveiller et de taguer les colonnes sensibles, notamment les données personnelles (PII) et financières.
Pourquoi c'est important
Cette fonctionnalité aide les organisations à renforcer leur gouvernance des données et leur posture de conformité. En identifiant et en taguant automatiquement les données sensibles, elles peuvent :
- Garantir l'application des contrôles d'accès et des mesures de protection adéquats.
- Démontrer leur conformité aux réglementations sur la confidentialité des données telles que le RGPD, le CCPA et l'HIPAA.
- Réduire le risque de fuite de données grâce à un inventaire à jour des données sensibles.
L'automatisation de ce processus réduit le travail manuel, limite les erreurs humaines et assure une classification cohérente à l'échelle de l'organisation.
Attribution de rôles de base de données à une Snowflake Native App
Fonctionnalité en Public Preview depuis le 17 mars 2025. Voir la documentation pour plus de détails.
De quoi s'agit-il
L'attribution de rôles de base de données à une Snowflake Native App permet aux fournisseurs d'assigner des rôles de base de données aux Snowflake Native Apps, y compris des rôles issus de bases importées depuis des data shares ou depuis la base SNOWFLAKE. Grâce à ces rôles, la native app peut accéder à des objets précis, comme des tables, dans le compte du consommateur.
Pourquoi c'est important
Cette capacité renforce la flexibilité et la sécurité des Snowflake Native Apps grâce à un contrôle d'accès fin. Les fournisseurs définissent précisément les objets de base de données auxquels l'application peut accéder, et les consommateurs conservent la maîtrise de leurs données. Particulièrement utile pour les applications qui exploitent des données partagées ou interagissent avec des jeux de données spécifiques dans l'environnement du consommateur.
Désactiver le téléchargement de données dans l'interface
Fonctionnalité en disponibilité générale depuis le 17 mars 2025. Voir la documentation pour plus de détails.
De quoi s'agit-il
Paramètre DISABLE_UI_DOWNLOAD_BUTTON : Snowflake introduit un nouveau paramètre d'objet, DISABLE_UI_DOWNLOAD_BUTTON. Il permet aux administrateurs de gérer la disponibilité du bouton de téléchargement, à la fois dans l'interface web Snowsight et dans la Classic Console. En l'activant, les organisations empêchent les utilisateurs de télécharger des données directement depuis l'interface.
Pourquoi c'est important
Certaines organisations souhaitent bloquer l'export de données pour des raisons de sécurité (vol de données) ou de gouvernance (shadow BI). Ce contrôle est précieux dans les secteurs réglementés ou lorsque des politiques strictes de gouvernance des données s'appliquent.
Réplication au niveau du schéma pour les failover groups
Fonctionnalité en disponibilité générale depuis le 27 mars 2025. Voir la documentation pour plus de détails.
De quoi s'agit-il
La réplication au niveau du schéma pour les failover groups permet aux administrateurs de répliquer des schémas précis d'une base de données entre plusieurs comptes via des failover groups. Le contrôle de la réplication devient plus granulaire : seules les parties utiles d'une base sont répliquées, plutôt que la base entière.
Pourquoi c'est important
Cette fonctionnalité s'adresse aux organisations qui ont besoin d'une réplication sélective, par exemple pour la conformité régionale, la souveraineté des données ou le partage ciblé. En ne répliquant que les schémas nécessaires, elles optimisent l'utilisation des ressources et gardent un contrôle plus strict sur la diffusion de leurs données.
Mises à jour SQL
Jobs enfants asynchrones
Fonctionnalité en disponibilité générale depuis le 5 mars 2025. Voir la documentation pour plus de détails.
De quoi s'agit-il
Les jobs enfants asynchrones dans Snowflake Scripting permettent aux procédures stockées d'exécuter plusieurs instructions SQL en parallèle. Avec le mot-clé ASYNC, les développeurs lancent des requêtes — SELECT, INSERT ou UPDATE — qui s'exécutent en tâche de fond, simultanément, au sein d'une même procédure stockée.
Pourquoi c'est important
Cette fonctionnalité améliore les performances et la scalabilité du traitement des données dans Snowflake. En parallélisant les opérations, les développeurs réduisent le temps total d'exécution des procédures complexes : traitement plus rapide, meilleure utilisation des ressources, et au bout du compte des économies à la clé.
Search optimization : prise en charge des collations de colonnes
Fonctionnalité en disponibilité générale depuis le 12 mars 2025. Voir la documentation pour plus de détails.
De quoi s'agit-il
La prise en charge des collations de colonnes par la Search Optimization est une amélioration du Search Optimization Service de Snowflake. Le service accélère désormais les requêtes sur les colonnes dotées d'une clause COLLATE. La collation définit la manière dont les chaînes de caractères sont comparées, un point essentiel pour trier et filtrer du texte selon des règles linguistiques spécifiques.
Pourquoi c'est important
Cette amélioration élargit le bénéfice de la search optimization à un éventail plus large de requêtes, notamment celles qui impliquent des comparaisons de chaînes propres à une locale. Snowflake accélère ainsi les requêtes sur les colonnes avec collation et rend les tris et filtres linguistiques plus rapides.
Nouveau format de fichier : XML
Fonctionnalité en disponibilité générale depuis le 27 mars 2025. Voir la documentation pour plus de détails.
De quoi s'agit-il
La prise en charge du format de fichier XML permet de définir un format de fichier de type XML dans Snowflake. On peut désormais créer des formats de fichier nommés qui précisent la façon dont les fichiers XML sont interprétés lors du chargement de données dans des tables Snowflake ou de la création de tables externes. Le format XML accepte notamment des paramètres comme STRIP_OUTER_ELEMENT et DISABLE_SNOWFLAKE_DATA, qui pilotent le traitement des données XML à l'ingestion.
Pourquoi c'est important
Snowflake permettait déjà d'analyser des données XML dans des colonnes variant via des fonctions comme XMLGET, mais la prise en charge du format de fichier XML simplifie le chargement. Les utilisateurs maîtrisent la façon dont les fichiers XML sont chargés, gagnent en efficacité et garantissent un parsing cohérent sur de gros volumes ou des jeux de données variés.
Opérateur spread
Fonctionnalité en disponibilité générale depuis le 27 mars 2025. Voir la documentation pour plus de détails.
De quoi s'agit-il
L'opérateur spread (**) de Snowflake SQL est un nouvel opérateur d'expansion qui déploie un tableau en une liste de valeurs individuelles au sein d'expressions SQL. Il est particulièrement utile pour :
- les clauses
INappliquées à des tableaux ; - l'appel de fonctions système comme
COALESCE,GREATESTetLEASTavec des tableaux en entrée ; - le passage de tableaux en arguments à des fonctions SQL définies par l'utilisateur ;
- l'utilisation de tableaux dans les procédures stockées Snowflake avec des bind variables.
La syntaxe est simple : ** <array>.
Pourquoi c'est important
L'opérateur spread gagne en flexibilité et en lisibilité dans le code SQL Snowflake. Il simplifie le travail avec les tableaux en autorisant une expansion directe au sein des instructions SQL, sans recourir à des logiques d'unnesting complexes ou itératives. Résultat : un code plus concis et plus facile à maintenir, en particulier face à des listes de valeurs dynamiques.
Mises à jour des pipelines de données
Dynamic tables : limite portée à 50 000 par compte
Fonctionnalité en disponibilité générale depuis le 12 mars 2025. Voir la documentation pour plus de détails.
De quoi s'agit-il
Snowflake relève de 10 000 à 50 000 le nombre maximum de dynamic tables autorisées par compte. Les dynamic tables permettent de créer des tables dont les données sont automatiquement actualisées selon une requête et une planification définies.
Pourquoi c'est important
Cette évolution compte pour les organisations qui gèrent des pipelines de données à grande échelle. En autorisant jusqu'à 50 000 dynamic tables par compte, Snowflake offre plus de flexibilité et de scalabilité, et rend possibles des workflows plus complexes et plus étendus, sans buter sur les limites du système.
Jeff est consultant Data & Analytics, fort de plus de 15 ans d'expérience dans l'automatisation des insights et l'exploitation de la donnée pour piloter les processus métier. Côté technologies, il est spécialiste de Snowflake + dbt + Tableau. Côté secteurs, il a travaillé dans les services publics, les essais cliniques, l'édition, les biens de grande consommation et l'industrie manufacturière. N'hésitez pas à le contacter : [email protected].