SELECTSELECT

SELECT

Snowflake BUILD 2025: il recap

By Jeff SkoldbergNov 20, 20257 min read

Questa pagina è disponibile anche in English, Deutsch, Español, Français, 日本語 e Português.

Snowflake BUILD 2025 ha portato un'ondata di nuove funzionalità e partnership focalizzate su AI, integrazione dei dati e produttività degli sviluppatori. Ecco una rapida panoramica dei principali annunci.

Data Foundation: integrazione e connettività

Costruire prodotti AI parte da una base dati solida e pulita.

Openflow Snowflake Deployment (GA)

Un servizio di integrazione dati aperto, estensibile, gestito e multimodale, che supporta dati strutturati e non strutturati, in batch e in streaming. Ora in GA sia su AWS sia su Azure per il deployment gestito da Snowflake, rende la movimentazione dei dati immediata. In precedenza era disponibile solo in modalità "Bring your own Cloud", con openflow installato su AWS e poi collegato a Snowflake. Il deployment su Snowflake rende creazione e gestione immediate. L'ho provato lo scorso fine settimana: la configurazione è stata davvero semplice, ma l'utilizzo del prodotto richiede una certa curva di apprendimento.

Snowflake AI Data Cloud incontra SAP Business Data Cloud

Snowflake ha annunciato un'integrazione bidirezionale zero-copy tra SAP Business Data Cloud e Snowflake AI Data Cloud. La funzionalità offre un accesso semplificato a dati SAP curati e pronti all'uso, con il contesto di business preservato per accelerare AI e analytics. SAP BDC armonizza i dati tra le applicazioni SAP. I clienti SAP che non sono ancora clienti Snowflake potranno accedere a SAP Snowflake, il prodotto Snowflake integrato in SAP BDC.

Snowflake dispone ora di integrazioni zero-copy con Workday (in sviluppo), Salesforce, Oracle (a breve in Public Preview) e SAP.

Gli annunci AI di Snowflake

Snowflake Intelligence (GA)

Snowflake Intelligence viene definita "il futuro del lavoro": è l'interfaccia in stile ChatGPT di Snowflake dedicata agli utenti business non tecnici. Ne abbiamo parlato a lungo in SELECT; la funzionalità è ora in GA su tutti i cloud Snowflake.

Cortex Code (Private Preview)

Cortex Code è un assistente AI per scrivere codice e analizzare la vostra infrastruttura Snowflake, integrato direttamente in Snowsight. Supporta le attività di amministrazione, sicurezza e governance e mette a disposizione un assistente di coding AI guidato dal linguaggio naturale.

Cortex Agents API (GA)

Gli agenti AI gestiti di Snowflake recuperano e analizzano dati strutturati e non strutturati grazie a solidi modelli di reasoning. Restituiscono insight accurati tramite una comoda REST API, con sicurezza e governance unificate.

Cortex Knowledge Extensions (GA)

Le CKE di Snowflake integrano dati non strutturati di terze parti nei sistemi agentici attraverso la condivisione sicura di documenti indicizzati dal Cortex Search Service. Consentono di accedere a contenuti su licenza, come news e ricerca, in tempo quasi reale, mantenendo i prompt all'interno del proprio account. La funzionalità è passata da Public Preview a GA.

Snowflake Managed MCP Server (GA)

Il Snowflake managed MCP permette di gestire tutti i vostri investimenti Snowflake con lo strumento AI che preferite, tramite il Model Context Protocol. In questo modo strumenti AI come Claude, ChatGPT o altre applicazioni basate su LLM possono accedere ai vostri dati e alla vostra infrastruttura Snowflake e interagirvi in modo sicuro. Adottando lo standard aperto MCP, Snowflake consente al vostro assistente AI di interrogare i dati, comprendere lo schema, eseguire SQL e sfruttare appieno i vostri investimenti Snowflake senza sviluppare integrazioni personalizzate.

Per maggiori informazioni sulla creazione del Server MCP all'interno del vostro account Snowflake, fate riferimento a questa pagina.

Online Feature Store for ML (Public Preview)

Serving a bassa latenza (<50ms P90) delle feature ML per casi d'uso di inferenza online, come il rilevamento delle frodi e le raccomandazioni in tempo reale. Garantisce coerenza automatica con le pipeline di feature offline e alta disponibilità, senza dover gestire l'infrastruttura.

Cost Governance Controls for AISQL (a breve in GA)

Un framework di tagging personalizzato che consente agli admin di tracciare, gestire e applicare automaticamente i budget di spesa AI. È possibile configurare notifiche o azioni personalizzate, attivate quando la spesa supera soglie specifiche.

Partnership tra Snowflake e Vercel

Snowflake ha annunciato un'integrazione con v0, lo strumento di sviluppo basato su AI di Vercel. Consente di creare e distribuire applicazioni Next.js data-driven su Snowpark Container Services usando il linguaggio naturale. L'architettura separata mantiene compute e dati all'interno di Snowflake, mentre Vercel gestisce i livelli applicativo e di autenticazione, ereditando automaticamente le policy di sicurezza Snowflake esistenti. Gli utenti possono dialogare con v0 per interrogare i dati e generare applicazioni complete, con route API distribuibili con un solo clic. L'integrazione è attualmente in fase di waitlist.

Da quanto ho potuto vedere, semplificherà notevolmente la creazione di applicazioni AI moderne e curate nel design, distribuite su Snowflake.

Data Platform e infrastruttura

Storage Lifecycle Policies

Una nuova funzionalità che ogni data engineer dovrebbe conoscere: le Storage Lifecycle Policies permettono di spostare automaticamente i dati su storage COOL o COLD, oppure di eliminare una riga, in base alla policy impostata e all'età del record. Sostituiscono il ricorso alle stored procedure per implementare le policy di retention e offrono in più il vantaggio di tier di storage a costo ridotto. Un'immagine vale più di mille parole, quindi vi invito a consultare le immagini riportate nella documentazione Snowflake:

Vediamo tutte le voci di costo delle Snowflake Storage Lifecycle Policies:

Storage:

  • Lo storage Cool costa 4$ per TB/mese su AWS e i dati restano subito disponibili per le query. Una volta spostati qui, i dati vanno mantenuti per 90 giorni, altrimenti verrà addebitata una fee minima di durata storage.
  • Lo storage Cold costa 1$ per TB/mese. Il recupero dei dati dal tier Cold può richiedere fino a 48 ore. La durata minima di archiviazione è di 180 giorni, con una fee in caso di eliminazione anticipata.

Costo di esecuzione della policy / costo di archiviazione:

  • Le policy vengono eseguite una volta ogni 24 ore utilizzando il Serverless Compute gestito da Snowflake per spostare i dati. Questo serverless compute ha un moltiplicatore di credito del 50%, ovvero costa la metà di un warehouse tradizionale. È Snowflake a stabilire la dimensione di compute necessaria.
  • Vengono inoltre addebitati 0,05 crediti ogni 1.000 file archiviati.

Costo di recupero dati:

  • Vengono addebitati 0,05 crediti ogni 1.000 file recuperati.

Snowflake Postgres (a breve in Public Preview, in regioni limitate)

Un servizio PostgreSQL completamente gestito su Snowflake AI Data Cloud, pensato per workloads transazionali (OLTP) rapidi e ad alto volume. Permette di essere operativi in pochi minuti, con un overhead di gestione e amministrazione ridotto al minimo. Include nativamente le estensioni Postgres più diffuse, come PG Vector e PGIS.

pg_lake (GA)

"pg_lake" è un insieme di estensioni open source per PostgreSQL che gli consentono di gestire il vostro catalogo Iceberg. Ducklake è stato il primo a farlo, e ha senso poter usare un database relazionale per gestire il catalogo Iceberg. Questo dovrebbe semplificare l'esplorazione delle versioni e il time travel, oltre a offrire un boost di performance al livello dei metadati Iceberg. Per maggiori dettagli, consultate il repository GitHub.

Image credit

Hybrid Tables su Azure (GA)

Le Hybrid Tables, che uniscono capacità transazionali e analitiche, sono ora generalmente disponibili su Azure.

Horizon Catalog: scritture su qualsiasi Iceberg (GA)

Apache Polaris è ora integrato in Horizon Catalog, abilitando le scritture su qualsiasi tabella Iceberg con le stesse capacità di tagging, governance e lineage.

Business Continuity e Disaster Recovery per le tabelle Iceberg gestite da Snowflake (GA)

BDCR è ora disponibile per le tabelle Iceberg gestite da Snowflake.

Interactive Tables e Warehouses (a breve in GA)

Le Interactive Tables sono ottimizzate per ingestion e querying in streaming in tempo reale. Sfruttano gli Interactive Warehouses, sempre attivi e con cache pre-riscaldate. Sono pensate per analytics sub-secondo che richiedono bassa latenza ed elevata concorrenza.

Developer experience

Workspaces (GA)

I Workspaces sono ora in GA! Se non ne avete ancora sentito parlare, i workspaces sono un ambiente di sviluppo centralizzato e basato su file all'interno di Snowsight, pensato per l'editing del codice e il version control in modo unificato. I Workspaces si integrano con Git per il version control e la collaborazione e possono anche eseguire dbt. Snowflake ha inoltre annunciato gli Shared Workspaces: è ora possibile condividere il proprio workspace con un intero team.

Enhanced Git Integration (GA)

Snowsight supporta ora i repository self-hosted, con importanti miglioramenti all'integrazione Git. Sul Marketplace è disponibile un'app GitHub Actions per semplificare l'integrazione CI/CD.

dbt Projects on Snowflake (GA)

Sviluppate, testate, distribuite e monitorate i progetti di trasformazione dati dbt direttamente in Snowflake, senza dover gestire l'infrastruttura di dbt Core. È possibile importare progetti esistenti o crearne di nuovi negli Snowsight Workspaces. La funzionalità era in Public Preview dallo Snowflake Summit di giugno ed è ora in GA.

Snowpark Connect for Apache Spark™ (GA)

Eseguite codice Apache Spark esistente (DataFrame, SQL) direttamente su Snowflake, con una migrazione minima. Snowpark Connect elimina la gestione del cluster Spark e le fee di egress, offrendo in media performance 5,6 volte più rapide e un risparmio TCO del 41%. La funzionalità era in Preview dal nostro ultimo recap "What's New in Snowflake", ma Snowflake l'ha ora portata in GA.

Snowflake Optima (GA)

Un motore di ottimizzazione dei workloads che apprende automaticamente e in modo continuo dai vostri pattern di utilizzo. Gestisce l'indicizzazione e la raccolta dei metadati, eliminando la necessità di tuning manuale per migliorare le performance delle query.

Data sharing e collaborazione

Condivisione delle Semantic Views (GA)

I data provider possono ora condividere le semantic views insieme ai dati strutturati, abilitando le query in linguaggio naturale. Gli sviluppatori possono integrare facilmente i dati condivisi in app AI e sistemi agentici, senza preprocessing aggiuntivo.

Open Table Format Sharing (GA)

Condividete dati archiviati in open table format come Iceberg su tutta la piattaforma Snowflake.

In sintesi

Questo articolo raccoglie i punti salienti di Snowflake Build 2025. Un ringraziamento a Vino Duraisamy per aver pubblicato su LinkedIn questa slide riassuntiva, che tocca anche altri annunci.

Jeff è un consulente Data & Analytics con oltre 15 anni di esperienza nell'automazione degli insight e nell'uso dei dati per governare i processi di business. Sul fronte tecnologico è specializzato in Snowflake + dbt + Tableau. Sul fronte dei settori, ha esperienza in Public Utility, Clinical Trials, editoria, CPG e manifatturiero. Per qualsiasi esigenza, potete contattarlo a [email protected].