Snowflake continua a rilasciare nuove funzionalità a ritmo serrato. Vediamo insieme le novità di marzo 2025, dedicate ad amministrazione, aggiornamenti SQL e data pipeline.
Amministrazione di Snowflake
Classificazione automatica dei dati sensibili
Funzionalità Generally Available dal 6 marzo 2025. Per i dettagli, consulta la documentazione.
Di cosa si tratta
La classificazione automatica dei dati sensibili è una funzionalità serverless di Snowflake che rileva e tagga in automatico i dati sensibili presenti nelle tabelle. Basta creare un profilo di classificazione e assegnarlo a uno schema: Snowflake si occupa di monitorare e taggare le colonne sensibili, inclusi PII e dati finanziari.
Perché è importante
Questa funzionalità aiuta le aziende a rafforzare data governance e compliance. Identificando e taggando in automatico i dati sensibili, è possibile:
- applicare controlli di accesso e misure di protezione adeguati;
- dimostrare la conformità a normative sulla privacy come GDPR, CCPA e HIPAA;
- ridurre il rischio di data breach grazie a un inventario sempre aggiornato dei dati sensibili.
L'automazione riduce al minimo il lavoro manuale, abbatte il rischio di errori umani e garantisce coerenza nella classificazione dei dati in tutta l'azienda.
Concedere ruoli di database a una Snowflake Native App
Funzionalità in Public Preview dal 17 marzo 2025. Per i dettagli, consulta la documentazione.
Di cosa si tratta
La concessione di ruoli di database a una Snowflake Native App permette ai provider di assegnare ruoli di database alle Snowflake Native App, compresi quelli relativi a database importati da data share o al database SNOWFLAKE. In questo modo la native app può accedere a oggetti specifici del database, come le tabelle, all'interno dell'account del consumer.
Perché è importante
Questa novità aumenta flessibilità e sicurezza delle Snowflake Native App grazie a un controllo degli accessi granulare. I provider possono indicare con precisione a quali oggetti del database può accedere l'app, lasciando ai consumer il pieno controllo dei propri dati. È un vantaggio concreto per le applicazioni che richiedono accesso a dati condivisi o che devono interagire con dataset specifici nell'ambiente del consumer.
Disabilitare il download dei dati dall'interfaccia utente
Funzionalità Generally Available dal 17 marzo 2025. Per i dettagli, consulta la documentazione.
Di cosa si tratta
Parametro DISABLE_UI_DOWNLOAD_BUTTON: Snowflake ha introdotto un nuovo parametro a livello di oggetto, DISABLE_UI_DOWNLOAD_BUTTON, che permette agli amministratori di gestire la disponibilità del pulsante di download sia nell'interfaccia web Snowsight sia nella Classic Console. Impostandolo, è possibile impedire agli utenti di scaricare i dati direttamente dall'interfaccia.
Perché è importante
Molte aziende hanno la necessità di bloccare l'esportazione dei dati per ragioni di sicurezza (data theft) o di data governance (shadow BI). Si tratta di un controllo particolarmente utile nei settori regolamentati o negli scenari con policy di data governance stringenti.
Replica a livello di schema per i failover group
Funzionalità Generally Available dal 27 marzo 2025. Per i dettagli, consulta la documentazione.
Di cosa si tratta
La replica a livello di schema per i failover group permette agli amministratori di replicare schemi specifici di un database su più account tramite i failover group. Il risultato è un controllo molto più granulare sulla replica dei dati: si possono replicare solo le parti necessarie di un database, senza dover replicare l'intero database.
Perché è importante
Una funzionalità preziosa per le aziende che hanno bisogno di una replica selettiva dei dati per esigenze come compliance regionale, sovranità dei dati o condivisione mirata. Replicando solo gli schemi necessari, si ottimizza l'utilizzo delle risorse e si mantiene un controllo più stretto sulla distribuzione dei dati.
Aggiornamenti SQL
Job figli asincroni
Funzionalità Generally Available dal 5 marzo 2025. Per i dettagli, consulta la documentazione.
Di cosa si tratta
I job figli asincroni in Snowflake Scripting permettono alle stored procedure di eseguire più istruzioni SQL in parallelo. Con la keyword ASYNC gli sviluppatori possono avviare query — come SELECT, INSERT o UPDATE — che girano in parallelo come task in background all'interno di una singola stored procedure.
Perché è importante
Questa funzionalità migliora performance e scalabilità dell'elaborazione dati in Snowflake. Eseguendo più operazioni in parallelo, gli sviluppatori riducono il tempo complessivo delle procedure più complesse, ottenendo un'elaborazione più rapida, un uso più efficiente delle risorse e, di conseguenza, un risparmio sui costi.
Search optimization: supporto per le collation di colonna
Funzionalità Generally Available dal 12 marzo 2025. Per i dettagli, consulta la documentazione.
Di cosa si tratta
Il supporto della Search Optimization per le collation di colonna è un'evoluzione del Search Optimization Service di Snowflake. Il servizio è ora in grado di migliorare le performance delle query sulle colonne in cui è definita una clausola COLLATE. La collation stabilisce come avviene il confronto tra stringhe, aspetto essenziale per ordinare e filtrare dati testuali secondo regole linguistiche specifiche.
Perché è importante
Questa evoluzione estende i benefici della search optimization a una gamma più ampia di query, in particolare quelle che coinvolgono confronti tra stringhe specifici per locale. Snowflake accelera le query sulle colonne con collation, rendendo più rapidi ordinamento e filtraggio specifici per lingua.
Nuovo formato file: XML
Funzionalità Generally Available dal 27 marzo 2025. Per i dettagli, consulta la documentazione.
Di cosa si tratta
Il supporto al formato file XML consente di definire un formato file di tipo XML in Snowflake. Gli utenti possono creare formati file con nome che specificano come interpretare i file XML durante il caricamento dei dati nelle tabelle di Snowflake o la creazione di tabelle esterne. Definendo un formato file XML è possibile impostare parametri come STRIP_OUTER_ELEMENT e DISABLE_SNOWFLAKE_DATA, che governano l'elaborazione dei dati XML durante l'ingestion.
Perché è importante
Snowflake permetteva già da tempo il parsing dei dati XML in colonne variant tramite funzioni come XMLGET, ma con il nuovo supporto al formato file XML il caricamento dei dati diventa molto più semplice. Gli utenti possono controllare come vengono caricati i file XML, migliorando l'efficienza e garantendo un parsing coerente anche su dataset estesi o eterogenei.
Operatore spread
Funzionalità Generally Available dal 27 marzo 2025. Per i dettagli, consulta la documentazione.
Di cosa si tratta
L'operatore spread (**) in Snowflake SQL è un nuovo operatore di espansione che permette di trasformare un array in un elenco di valori singoli all'interno delle espressioni SQL. È particolarmente utile in scenari come:
- uso di clausole
INcon array; - chiamata di funzioni di sistema come
COALESCE,GREATESTeLEASTcon array in input; - passaggio di array come argomenti a funzioni SQL definite dall'utente;
- utilizzo di array nelle stored procedure di Snowflake con bind variable.
La sintassi è immediata: ** <array>.
Perché è importante
L'operatore spread rende il codice SQL in Snowflake più flessibile e leggibile. Semplifica il lavoro con gli array, consentendone l'espansione diretta nelle istruzioni SQL e riducendo il ricorso a complesse operazioni di unnesting o a logiche iterative. Il risultato è un codice più conciso e manutenibile, soprattutto quando si lavora con elenchi di valori dinamici.
Aggiornamenti sulle data pipeline
Dynamic table: il limite per account sale a 50.000
Funzionalità Generally Available dal 12 marzo 2025. Per i dettagli, consulta la documentazione.
Di cosa si tratta
Snowflake ha portato il numero massimo di dynamic table per account da 10.000 a 50.000. Le dynamic table sono una funzionalità di Snowflake che permette di creare tabelle i cui dati vengono aggiornati in automatico in base a una query e a una pianificazione definite.
Perché è importante
Una novità rilevante per chi gestisce data pipeline su larga scala. Con un tetto di 50.000 dynamic table per account, Snowflake offre maggiore flessibilità e scalabilità, abilitando workflow di dati più complessi ed estesi senza scontrarsi con i limiti del sistema.
Jeff è un Data and Analytics Consultant con oltre 15 anni di esperienza nell'automazione degli insight e nell'uso dei dati a supporto dei processi di business. Sul piano tecnologico è specializzato in Snowflake + dbt + Tableau. Sul piano dei settori, ha maturato esperienza in Public Utility, Clinical Trials, Publishing, CPG e Manufacturing. Per contattarlo: [email protected].