SELECTSELECT

SELECT

Controla los costos de IA en Snowflake: la serie completa

By Jeff SkoldbergOct 19, 20255 min read

Esta página también está disponible en English, Deutsch, Français, Italiano, 日本語 y Português.

Play

Las diapositivas del webinar están disponibles aquí.

---

Snowflake tiene un conjunto impresionante de funciones de IA. Puedes ejecutar modelos de lenguaje directamente en SQL, sumar búsqueda semántica a tus aplicaciones, extraer datos de documentos y dejar que los usuarios de negocio consulten datos en lenguaje natural. El problema es que cada uno de estos servicios tiene su propio modelo de precios, sus propias vistas de monitoreo y sus propias formas de inflar la factura sin que te des cuenta.

Llevo varias semanas metido a fondo en las funciones de IA de Snowflake y escribí esta serie para ayudarte a evitar las sorpresas que les hemos visto a nuestros clientes. La gestión tradicional de costos en Snowflake gira en torno al dimensionamiento del warehouse y a la optimización de consultas. Los servicios de IA exigen un modelo mental completamente distinto: conteo de tokens, precios por mensaje, serving compute, costos de embeddings y todas sus combinaciones.

Esta serie cubre cada uno de los grandes servicios de IA de Snowflake, con consultas SQL prácticas, ejemplos reales de Precios y recomendaciones con criterio. Abajo encontrarás un resumen rápido de toda la serie; cada sección incluye un enlace al artículo completo. Usa este artículo como tabla de contenidos para ir más a fondo.

Snowflake Cortex Search: descripción general y monitoreo de costos

Cortex Search es un servicio de búsqueda híbrida totalmente gestionado que cubre búsqueda vectorial, por palabras clave y semántica para aplicaciones RAG. Su estructura de costos es la más compleja de todos los servicios de IA de Snowflake: pagas por serving compute (costo continuo por GB de datos indexados), por los tokens de embeddings durante la indexación, por el compute del warehouse para las actualizaciones, por el almacenamiento de los índices y por la sobrecarga de servicios en la nube. Esta guía desglosa cada componente con consultas SQL específicas para hacer seguimiento del consumo diario y por hora, además de recomendaciones para usar claves primarias en actualizaciones incrementales y aplicar right-sizing a tus servicios de búsqueda antes de que los costos se disparen.

Encontrarás más detalles sobre el uso y el monitoreo de costos en nuestro artículo completo sobre el tema.

Costos de Snowflake Cortex Analyst: descripción general y monitoreo

Cortex Analyst convierte preguntas en lenguaje natural en consultas SQL y utiliza precios por mensaje, no por token. Cada consulta exitosa (respuesta HTTP 200) cuesta un mensaje, sin importar su complejidad, pero también tienes que considerar los costos del warehouse al ejecutar el SQL generado. El artículo completo explica cómo usar la vista CORTEX_ANALYST_USAGE_HISTORY para hacer seguimiento del consumo de mensajes por usuario y período, y propone estrategias para atribuir los costos del warehouse cuando Cortex Analyst comparte recursos de compute con otros workloads.

Consulta nuestro artículo completo sobre el tema para profundizar en el uso de Cortex Analyst, cómo se factura y cómo monitorear sus costos.

Cómo monitorear los costos de las funciones Cortex AISQL en Snowflake

Las funciones AISQL como AI_COMPLETE, AI_EXTRACT, AI_CLASSIFY y AI_SUMMARIZE te permiten ejecutar modelos de IA directamente desde consultas SQL. Estas funciones usan precios por token: en las funciones generativas cuentan tanto los tokens de entrada como los de salida, y los costos varían enormemente según el modelo elegido (los modelos premium pueden costar 10 veces más que las alternativas más pequeñas). Este artículo incluye ejemplos reales de precios que muestran que analizar 10,000 reseñas de productos cuesta $0.96 con GPT-4o-mini, pero $9.00 con Llama 3.1 405B, junto con consultas SQL para monitorear costos por modelo, usuario y warehouse en la vista METERING_HISTORY.

Revisa nuestro artículo completo sobre el tema para conocer más sobre los matices de los tokens, la elección de modelos y el monitoreo de costos.

Document AI: descripción técnica y monitoreo de costos

Document AI de Snowflake extrae datos estructurados de PDFs, imágenes y documentos escaneados mediante la función SNOWFLAKE.CORTEX.PARSE_DOCUMENT. El servicio se factura según el tiempo de compute de AI Services (8 créditos por hora de compute), y los costos escalan con la cantidad de páginas, la densidad del documento y el número de valores que extraigas. Un pipeline típico de procesamiento de facturas cuesta alrededor de $0.05 por documento, pero los documentos legales densos o los formularios complejos pueden costar bastante más. La guía incluye consultas SQL para hacer seguimiento de los costos de procesamiento de documentos y entrega recomendaciones sobre umbrales de confianza, estrategias de procesamiento por lotes y cuándo conviene enviar a revisión manual las extracciones con baja confianza.

Revisa nuestro artículo completo sobre Document AI para profundizar.

Snowflake Intelligence: descripción técnica y monitoreo de costos

Quizás la función más interesante para el usuario promedio dentro del ecosistema Cortex: Snowflake Intelligence es una nueva aplicación disponible en ai.snowflake.com. Se trata de una interfaz de agente de IA que permite a los usuarios de negocio hacer preguntas en lenguaje natural y obtener respuestas con gráficos e insights, sin necesidad de SQL. Orquesta datos estructurados (vía Cortex Analyst), datos no estructurados (vía Cortex Search) y herramientas personalizadas para entregar respuestas completas. El modelo de costos es, de hecho, más simple que el de otros servicios: no hay cargos propios del agente, solo pagas por las solicitudes subyacentes de Cortex Analyst y por el uso de Cortex Search. El reto es que los costos de Intelligence se reparten entre varios tipos de servicio dentro de las vistas de uso de tu cuenta, así que el artículo incluye consultas que agregan todos los costos relacionados y explica estrategias para atribuir los costos de ejecución del warehouse a las consultas generadas por el agente.

Para conocer más sobre cómo usar Snowflake Intelligence, cómo configurarlo y cómo se factura, revisa nuestro artículo completo sobre el tema.

Por dónde empezar

Si ya estás usando alguno de estos servicios, empieza por el artículo que lo cubre. Si todavía estás evaluando qué funciones de IA adoptar, te recomiendo partir con Snowflake Intelligence o las AISQL Functions, que son las de aplicación más amplia.

Me encantaría que me cuentes si tienes dudas sobre alguno de estos artículos. Cuéntanos qué funciones de IA estás usando y cómo mantienes los costos bajo control.

Jeff es Consultor de Data y Analytics con más de 15 años de experiencia automatizando insights y usando datos para controlar procesos de negocio. En lo tecnológico, se especializa en Snowflake + dbt + Tableau. En lo sectorial, tiene experiencia en Servicios Públicos, Ensayos Clínicos, Publishing, CPG y Manufactura. Escríbele cuando quieras a [email protected].