Play
Le slide del webinar qui sopra sono disponibili a questo link.
---
Snowflake offre una gamma davvero notevole di funzionalità AI. Si possono eseguire modelli linguistici direttamente in SQL, integrare la ricerca semantica nelle proprie applicazioni, estrarre dati dai documenti e permettere agli utenti business di interrogare i dati in linguaggio naturale. Il problema è che ciascuno di questi servizi ha un proprio modello di pricing, proprie viste di monitoraggio e modalità tutte sue per far lievitare i costi senza che ce ne si accorga.
Ho passato le ultime settimane immerso nell'offerta AI di Snowflake e ho scritto questa serie per aiutarvi a evitare le sorprese che ho visto capitare ai nostri clienti. La gestione tradizionale dei costi su Snowflake ruota attorno al dimensionamento dei warehouse e all'ottimizzazione delle query. I servizi AI richiedono invece un approccio mentale del tutto diverso: conteggio dei token, pricing a messaggi, compute di serving, costi di embedding e diverse combinazioni di questi elementi.
Questa serie passa in rassegna ogni servizio AI principale di Snowflake con query SQL pratiche, esempi di pricing reali e raccomandazioni senza giri di parole. Qui sotto trovate un riepilogo dell'intera serie; ogni sezione contiene un link all'articolo completo sull'argomento. Potete usare questo articolo come indice per approfondire.
Snowflake Cortex Search: panoramica e monitoraggio dei costi
Cortex Search è un servizio di ricerca ibrida completamente gestito che combina ricerca vettoriale, per parole chiave e semantica per le applicazioni RAG. La struttura dei costi è la più complessa fra tutti i servizi AI di Snowflake: si paga per il compute di serving (costo continuativo per GB di dati indicizzati), i token di embedding durante l'indicizzazione, il compute del warehouse per i refresh, lo storage degli indici e l'overhead dei cloud services. Questa guida analizza ogni componente con query SQL specifiche per tracciare il consumo giornaliero e orario, oltre a consigli sull'uso delle primary key per gli aggiornamenti incrementali e sul right-sizing dei servizi di ricerca prima che i costi sfuggano di mano.
Maggiori dettagli su utilizzo, comprensione e monitoraggio dei costi sono disponibili nel nostro articolo completo dedicato.
Costi di Snowflake Cortex Analyst: panoramica e monitoraggio
Cortex Analyst trasforma le domande in linguaggio naturale in query SQL e adotta un pricing a messaggi anziché basato sui token. Ogni query andata a buon fine (risposta HTTP 200) costa un messaggio, indipendentemente dalla complessità, ma occorre anche considerare i costi del warehouse necessario per eseguire l'SQL generato. L'articolo completo spiega come usare la vista CORTEX_ANALYST_USAGE_HISTORY per tracciare il consumo di messaggi per utente e periodo e propone strategie per attribuire i costi del warehouse quando Cortex Analyst condivide le risorse di compute con altri workloads.
Consultate il nostro articolo completo per approfondire l'utilizzo di Cortex Analyst, le modalità di fatturazione e il monitoraggio dei costi.
Come monitorare i costi delle funzioni Cortex AISQL in Snowflake
Le funzioni AISQL come AI_COMPLETE, AI_EXTRACT, AI_CLASSIFY e AI_SUMMARIZE permettono di eseguire modelli AI direttamente all'interno delle query SQL. Queste funzioni usano un pricing basato sui token: per le funzioni generative contano sia i token in input sia quelli in output e i costi variano enormemente in base al modello scelto (i modelli premium possono costare fino a 10 volte più delle alternative più piccole). Questo articolo fornisce esempi di pricing reali da cui emerge che analizzare 10.000 recensioni di prodotto costa 0,96 $ con GPT-4o-mini ma 9,00 $ con Llama 3.1 405B, corredati di query SQL per monitorare i costi per modello, utente e warehouse nella vista METERING_HISTORY.
Consultate il nostro articolo completo per approfondire le sfumature dei token, la scelta del modello e il monitoraggio dei costi.
Document AI: panoramica tecnica e monitoraggio dei costi
Document AI di Snowflake estrae dati strutturati da PDF, immagini e documenti scansionati tramite la funzione SNOWFLAKE.CORTEX.PARSE_DOCUMENT. Il servizio viene fatturato in base al tempo di compute degli AI Services (8 crediti per compute-hour) e i costi crescono con il numero di pagine, la densità dei documenti e la quantità di valori estratti. Una tipica pipeline di elaborazione fatture costa circa 0,05 $ a documento, ma documenti legali densi o moduli complessi possono costare molto di più. La guida include query SQL per tracciare i costi di elaborazione dei documenti e fornisce raccomandazioni su soglie di confidenza, strategie di elaborazione in batch e su quando inoltrare le estrazioni a bassa confidenza alla revisione manuale.
Consultate il nostro articolo completo su Document AI per approfondire.
Snowflake Intelligence: panoramica tecnica e monitoraggio dei costi
Forse la funzionalità più interessante nell'universo Cortex per l'utente medio, Snowflake Intelligence è una nuova app disponibile su ai.snowflake.com: un'interfaccia ad agente AI che consente agli utenti business di porre domande in inglese corrente e ottenere risposte con grafici e insight, senza scrivere una riga di SQL. L'agente orchestra dati strutturati (tramite Cortex Analyst), dati non strutturati (tramite Cortex Search) e strumenti personalizzati per fornire risposte complete. Il modello di costo è in realtà più semplice rispetto agli altri servizi: non ci sono addebiti specifici per l'agente, si pagano soltanto le richieste sottostanti a Cortex Analyst e l'utilizzo di Cortex Search. La difficoltà è che i costi di Intelligence sono distribuiti su più tipi di servizio nelle viste di utilizzo dell'account: l'articolo fornisce quindi query che aggregano tutti i costi correlati e spiega le strategie per ricondurre i costi di esecuzione del warehouse alle query generate dall'agente.
Per approfondire l'utilizzo di Snowflake Intelligence, la sua configurazione e le modalità di fatturazione, consultate il nostro articolo completo dedicato.
Da dove iniziare
Se state già utilizzando uno di questi servizi, partite dall'articolo dedicato al servizio che vi interessa. Se invece state valutando quali funzionalità AI adottare, consiglio di iniziare da Snowflake Intelligence o dalle funzioni AISQL, perché sono le più trasversali.
Mi farebbe piacere ricevere le vostre domande su uno qualsiasi di questi articoli. Fateci sapere quali funzionalità AI state utilizzando e come tenete i costi sotto controllo.
Jeff è un Data and Analytics Consultant con oltre 15 anni di esperienza nell'automazione degli insight e nell'uso dei dati per governare i processi di business. Sul piano tecnologico è specializzato in Snowflake + dbt + Tableau. Sul piano dei settori, vanta esperienza in Public Utility, Clinical Trials, editoria, CPG e manifatturiero. Scrivetegli quando volete: [email protected].