Play
Les slides du webinaire ci-dessus sont disponibles ici.
---
Snowflake propose une gamme impressionnante de fonctionnalités d'IA. Vous pouvez exécuter des modèles de langage directement en SQL, intégrer une recherche sémantique dans vos applications, extraire des données de documents ou encore permettre aux utilisateurs métier d'interroger les données en langage naturel. Le problème : chacun de ces services a son propre modèle tarifaire, ses propres vues de monitoring et ses propres façons de faire grimper la facture sans crier gare.
J'ai passé les dernières semaines à explorer en profondeur les services d'IA de Snowflake et j'ai rédigé cette série pour vous éviter les mauvaises surprises rencontrées par nos clients. La gestion classique des coûts Snowflake repose sur le dimensionnement des warehouses et l'optimisation des requêtes. Les services d'IA imposent une tout autre logique : décompte des tokens, tarification au message, compute de serving, coûts d'embedding et combinaisons variées.
Cette série couvre tous les principaux services Snowflake AI, avec des requêtes SQL concrètes, des exemples tarifaires réels et des recommandations sans détour. Vous trouverez ci-dessous un résumé rapide de la série ; chaque section renvoie vers l'article complet sur le sujet. Cet article vous servira de table des matières pour aller plus loin.
Snowflake Cortex Search : présentation et suivi des coûts
Cortex Search est un service de recherche hybride entièrement managé qui prend en charge la recherche vectorielle, par mots-clés et sémantique pour les applications RAG. Sa structure de coûts est la plus complexe de tous les services Snowflake AI : vous payez le compute de serving (coût récurrent par Go de données indexées), les tokens d'embedding lors de l'indexation, le compute warehouse pour les rafraîchissements, le stockage des index ainsi que les frais associés aux cloud services. Ce guide détaille chaque composant avec des requêtes SQL spécifiques pour suivre la consommation quotidienne et horaire, ainsi que des recommandations sur l'utilisation des clés primaires pour les mises à jour incrémentales et le dimensionnement de vos services de recherche avant que les coûts ne s'emballent.
Davantage de détails sur l'usage, la compréhension et le suivi des coûts dans notre article complet sur le sujet.
Coûts de Snowflake Cortex Analyst : présentation et suivi
Cortex Analyst transforme des questions en langage naturel en requêtes SQL, avec une tarification au message plutôt qu'au token. Chaque requête réussie (réponse HTTP 200) compte pour un message, quelle que soit sa complexité, mais il faut aussi intégrer les coûts du warehouse qui exécute le SQL généré. L'article complet explique comment utiliser la vue CORTEX_ANALYST_USAGE_HISTORY pour suivre la consommation de messages par utilisateur et par période, et propose des stratégies pour répartir les coûts de warehouse lorsque Cortex Analyst partage ses ressources de calcul avec d'autres workloads.
Consultez notre article complet sur le sujet pour en savoir plus sur l'utilisation de Cortex Analyst, sa facturation et le suivi des coûts.
Suivre les coûts des fonctions Cortex AISQL dans Snowflake
Les fonctions AISQL telles que AI_COMPLETE, AI_EXTRACT, AI_CLASSIFY et AI_SUMMARIZE permettent d'exécuter des modèles d'IA directement dans vos requêtes SQL. Elles reposent sur une tarification au token, où les tokens d'entrée et de sortie sont tous deux comptabilisés pour les fonctions génératives, et les coûts varient fortement selon le modèle retenu (les modèles premium peuvent coûter 10 fois plus cher que des alternatives plus légères). Cet article fournit des exemples tarifaires réels montrant que l'analyse de 10 000 avis produits revient à 0,96 $ avec GPT-4o-mini contre 9,00 $ avec Llama 3.1 405B, avec à l'appui des requêtes SQL pour suivre les coûts par modèle, utilisateur et warehouse dans la vue METERING_HISTORY.
Consultez notre article complet sur le sujet pour explorer en détail les subtilités des tokens, du choix du modèle et du suivi des coûts.
Document AI : présentation technique et suivi des coûts
Document AI de Snowflake extrait des données structurées depuis des PDF, des images et des documents scannés via la fonction SNOWFLAKE.CORTEX.PARSE_DOCUMENT. Le service est facturé sur la base du temps de calcul des AI Services (8 crédits par heure de compute), et les coûts évoluent selon le nombre de pages, la densité du document et le nombre de valeurs extraites. Un pipeline classique de traitement de factures revient à environ 0,05 $ par document, mais des documents juridiques denses ou des formulaires complexes peuvent coûter bien davantage. Le guide inclut des requêtes SQL pour suivre les coûts de traitement et formule des recommandations sur les seuils de confiance, les stratégies de traitement par lot et les cas où il vaut mieux router les extractions à faible confiance vers une revue manuelle.
Consultez notre article complet sur Document AI pour approfondir.
Snowflake Intelligence : présentation technique et suivi des coûts
Sans doute la fonctionnalité la plus prometteuse pour l'utilisateur lambda dans l'écosystème Cortex, Snowflake Intelligence est une nouvelle application accessible sur ai.snowflake.com ; il s'agit d'une interface d'agent IA qui permet aux utilisateurs métier de poser des questions en langage naturel et d'obtenir des réponses sous forme de graphiques et d'analyses, sans la moindre ligne de SQL. Elle orchestre les données structurées (via Cortex Analyst), non structurées (via Cortex Search) et des outils personnalisés pour fournir des réponses complètes. Le modèle de coût est en réalité plus simple que celui des autres services : aucun frais spécifique à l'agent, vous payez uniquement les requêtes Cortex Analyst et l'usage de Cortex Search sous-jacents. La difficulté, c'est que les coûts d'Intelligence se répartissent sur plusieurs types de services dans vos vues d'usage du compte ; l'article propose donc des requêtes qui agrègent l'ensemble des coûts associés et explique comment rattacher les coûts d'exécution warehouse aux requêtes générées par l'agent.
Pour en savoir plus sur l'utilisation de Snowflake Intelligence, sa configuration et sa facturation, consultez notre article complet sur le sujet.
Par où commencer
Si vous utilisez déjà l'un de ces services, commencez par l'article qui le couvre. Si vous évaluez les fonctionnalités d'IA à adopter, je vous recommande de commencer par Snowflake Intelligence ou les fonctions AISQL, car ce sont les plus largement applicables.
N'hésitez pas à me transmettre vos questions sur l'un de ces articles. Dites-nous quelles fonctionnalités d'IA vous utilisez et comment vous gardez la maîtrise de vos coûts.
Jeff est consultant Data & Analytics avec plus de 15 ans d'expérience dans l'automatisation des analyses et l'exploitation des données pour piloter les processus métier. Côté technologie, il est spécialisé dans Snowflake + dbt + Tableau. Côté métier, il a travaillé dans les services publics, les essais cliniques, l'édition, les biens de grande consommation et l'industrie manufacturière. N'hésitez pas à le contacter à tout moment : [email protected].