SELECTSELECT

SELECT

Snowflake BUILD 2025: Resumen

By Jeff SkoldbergNov 20, 20257 min read

Esta página también está disponible en English, Deutsch, Français, Italiano, 日本語 y Português.

Snowflake BUILD 2025 trajo una oleada de nuevas funcionalidades y alianzas centradas en IA, integración de datos y productividad para desarrolladores. Aquí te dejamos un resumen rápido de los anuncios más relevantes.

Base de datos: integración y conectividad

Crear productos de IA empieza por tener una base de datos limpia.

Openflow Snowflake Deployment (GA)

Un servicio de integración de datos abierto, extensible, gestionado y multimodal, compatible con datos estructurados y no estructurados, tanto por lotes como en streaming. Ya está disponible en GA tanto en AWS como en Azure para el despliegue gestionado por Snowflake, lo que hace que mover datos sea prácticamente sin esfuerzo. Antes solo se podía usar como "Bring your own Cloud", donde Openflow se desplegaba en AWS y luego se conectaba a Snowflake. Con el despliegue de Snowflake, la creación y la gestión se simplifican muchísimo. Lo probé el fin de semana: la configuración fue muy sencilla, aunque usar el producto tiene cierta curva de aprendizaje.

Snowflake AI Data Cloud se conecta con SAP Business Data Cloud

Snowflake anunció una integración bidireccional zero-copy entre SAP Business Data Cloud y Snowflake AI Data Cloud. Esta funcionalidad da acceso simplificado a datos de SAP curados y listos para el negocio, preservando el contexto empresarial para acelerar la IA y la analítica. SAP BDC armoniza los datos entre las apps de SAP. Los clientes de SAP que aún no son clientes de Snowflake tendrán acceso a SAP Snowflake, un producto de Snowflake embebido en SAP BDC.

Snowflake ya cuenta con integraciones zero copy con Workday (en desarrollo), Salesforce, Oracle (Public Preview próximamente) y SAP.

Anuncios de Snowflake AI

Snowflake Intelligence (GA)

A Snowflake Intelligence le están llamando "el futuro del trabajo", ya que es la interfaz tipo chatGPT de Snowflake para usuarios de negocio sin perfil técnico. En SELECT hemos hablado bastante de esto; la funcionalidad ya está en GA en todas las nubes de Snowflake.

Cortex Code (Private Preview)

Cortex Code es un asistente de IA para programar e investigar tu infraestructura de Snowflake, integrado directamente en Snowsight. Apoya en tareas administrativas, seguridad y gobierno, y ofrece un asistente de programación con IA mediante lenguaje natural.

Cortex Agents API (GA)

Los agentes de IA gestionados por Snowflake recuperan y analizan datos estructurados y no estructurados con modelos de razonamiento robustos. Entregan insights precisos a través de una práctica REST API, con seguridad y gobierno unificados.

Cortex Knowledge Extensions (GA)

Las CKEs de Snowflake integran datos no estructurados de terceros en sistemas agénticos mediante el intercambio seguro de documentos indexados a través de Cortex Search Service. Accede a fuentes de contenido licenciadas como noticias e investigaciones casi en tiempo real, manteniendo los prompts dentro de tu cuenta. Esta funcionalidad pasó de Public Preview a GA.

Snowflake Managed MCP Server (GA)

El MCP gestionado por Snowflake hace que toda tu inversión en Snowflake pueda administrarse desde la herramienta de IA que elijas, mediante el Model Context Protocol. Así, herramientas como Claude, ChatGPT u otras aplicaciones basadas en LLM pueden acceder e interactuar de forma segura con tus datos e infraestructura de Snowflake. Al implementar el estándar abierto MCP, Snowflake permite que tu asistente de IA preferido consulte datos, entienda tu esquema, ejecute SQL y aproveche toda tu inversión en Snowflake sin tener que crear integraciones a medida.

Puedes encontrar más información sobre cómo crear el MCP Server dentro de tu cuenta de Snowflake aquí.

Online Feature Store para ML (Public Preview)

Servicio de baja latencia (<50ms P90) de features de ML para casos de inferencia online como detección de fraude y recomendaciones en tiempo real. Incluye consistencia automatizada con los pipelines de features offline y alta disponibilidad sin necesidad de gestionar infraestructura.

Controles de gobierno de costos para AISQL (GA próximamente)

Un framework de etiquetado personalizado que permite a los administradores hacer seguimiento, gestionar y aplicar automáticamente presupuestos de gasto en IA. Configura notificaciones o acciones personalizadas que se disparan cuando el gasto supera ciertos umbrales.

Alianza entre Snowflake y Vercel

Snowflake anunció una integración con la herramienta de desarrollo con IA de Vercel llamada v0. Esto permite a los usuarios crear y desplegar aplicaciones Next.js basadas en datos sobre Snowpark Container Services usando lenguaje natural. La arquitectura dividida mantiene el cómputo y los datos dentro de Snowflake, mientras que Vercel administra las capas de aplicación y autenticación, heredando automáticamente las políticas de seguridad existentes de Snowflake. Los usuarios pueden conversar con v0 para consultar datos y generar aplicaciones completas con rutas de API que se despliegan con un solo clic. La integración está actualmente en fase de waitlist.

Por lo que entiendo, esto va a facilitar muchísimo crear aplicaciones de IA modernas y atractivas desplegadas en Snowflake.

Plataforma de datos e infraestructura

Storage Lifecycle Policies

Una nueva funcionalidad con la que todo data engineer debería familiarizarse: las Storage Lifecycle Policies te permiten mover datos automáticamente a almacenamiento COOL o COLD, o eliminar una fila, según la política que definas y la antigüedad del registro. Esto sustituye a los procedimientos almacenados para implementar políticas de retención de datos y suma el beneficio de niveles de almacenamiento más económicos. Una imagen vale más que mil palabras, así que te recomiendo revisar estas imágenes que aparecen en la documentación de Snowflake:

Repasemos todos los elementos de costo de las Storage Lifecycle Policies de Snowflake:

Almacenamiento:

  • El almacenamiento Cool cuesta $4 por TB/mes en AWS y los datos están disponibles para consultar al instante. Una vez que mueves datos aquí, debes mantenerlos durante 90 días o se aplicará un cargo mínimo por duración de almacenamiento.
  • El almacenamiento Cold cuesta $1 por TB/mes. La recuperación de datos del nivel Cold puede tardar hasta 48 horas. La duración mínima de archivado es de 180 días, con un cargo por eliminar datos antes de tiempo.

Costo de ejecución de la política / costo de archivado:

  • Las políticas se ejecutan una vez cada 24 horas usando Serverless Compute gestionado por Snowflake para mover tus datos. Este cómputo serverless tiene un multiplicador de créditos del 50%, lo que significa que cuesta la mitad de un warehouse tradicional. Snowflake determina el tamaño de cómputo necesario.
  • También se cobran 0.05 créditos por cada 1000 archivos archivados.

Costo de recuperación de datos:

  • Se cobran 0.05 créditos por cada 1000 archivos recuperados.

Snowflake Postgres (Public Preview próximamente, regiones limitadas)

Un servicio de PostgreSQL totalmente gestionado sobre Snowflake AI Data Cloud, diseñado para workloads transaccionales rápidos y de alto volumen (OLTP). Con este servicio puedes ponerlo en marcha en minutos y con muy poca carga de gestión / administración. Incluye extensiones populares de Postgres listas para usar, como PG Vector y PGIS.

pg_lake (GA)

"pg_lake" es un conjunto de extensiones open source de PostgreSQL que permite a PostgreSQL gestionar tu catálogo de Iceberg. Ducklake fue el primero en hacerlo y tiene todo el sentido contar con una base de datos relacional para administrar el catálogo de Iceberg. Esto debería facilitar la exploración de versiones y time travel, además de mejorar el rendimiento de la capa de metadata de Iceberg. Para más información, revisa el repositorio en GitHub.

Crédito de la imagen

Hybrid Tables en Azure (GA)

Las Hybrid Tables, que combinan capacidades transaccionales y analíticas, ya están disponibles de forma general en Azure.

Horizon Catalog: escrituras en cualquier Iceberg (GA)

Apache Polaris ya viene embebido en Horizon Catalog, lo que permite escribir en cualquier tabla Iceberg con las mismas capacidades de etiquetado, gobierno y linaje.

Continuidad de negocio y recuperación ante desastres para Snowflake Managed Iceberg Tables (GA)

BDCR ya está disponible para las tablas Iceberg gestionadas por Snowflake.

Interactive Tables y Warehouses (GA próximamente)

Las Interactive Tables están optimizadas para ingesta y consulta en streaming en tiempo real. Se apoyan en los Interactive Warehouses, que están siempre activos con cachés precalentadas. Están pensadas para analítica de subsegundo que exige baja latencia y alta concurrencia.

Experiencia de desarrollo

Workspaces (GA)

¡Los Workspaces ya están en GA! Por si no te enteraste, los workspaces son un entorno de desarrollo centralizado y basado en archivos dentro de Snowsight para edición de código y control de versiones unificados. Los workspaces se conectan con Git para control de versiones y colaboración, y también pueden ejecutar dbt. Snowflake también anunció los Shared Workspaces: ya puedes compartir tu workspace con un equipo.

Integración mejorada con Git (GA)

Snowsight ya admite repositorios self-hosted, con mejoras importantes en la integración con Git. Además, hay una app de GitHub Actions disponible en el Marketplace para simplificar la integración CI/CD.

dbt Projects en Snowflake (GA)

Crea, prueba, despliega y monitorea proyectos de transformación de datos con dbt directamente en Snowflake. Sin necesidad de gestionar la infraestructura de dbt Core. Ya puedes importar proyectos existentes o crear nuevos en Snowsight Workspaces. Esta funcionalidad estuvo en Public Preview desde Snowflake Summit en junio y ya está en GA.

Snowpark Connect para Apache Spark™ (GA)

Ejecuta tu código existente de Apache Spark (DataFrame, SQL) directamente en Snowflake con una migración mínima. Snowpark Connect elimina la gestión de clústeres de Spark y los cargos de egress, ofreciendo un rendimiento 5.6 veces más rápido y un ahorro promedio del 41% en TCO. Esto estuvo en Preview desde nuestro último resumen de "What's New in Snowflake", y ahora Snowflake lo movió a GA.

Snowflake Optima (GA)

Un motor de optimización de workloads que aprende de manera automática y continua a partir de tus patrones de uso. Se encarga de la indexación y la recolección de metadata, eliminando la necesidad de ajustes manuales para mejorar el rendimiento de las consultas.

Intercambio y colaboración de datos

Intercambio de Semantic Views (GA)

Los proveedores de datos ya pueden compartir vistas semánticas junto con datos estructurados, habilitando consultas en lenguaje natural. Los desarrolladores pueden integrar fácilmente datos compartidos en apps de IA y sistemas agénticos sin preprocesamiento adicional.

Intercambio en formatos de tabla abiertos (GA)

Comparte datos almacenados en formatos de tabla abiertos como Iceberg a lo largo de toda la plataforma de Snowflake.

Cierre

Este artículo cubre lo más destacado de Snowflake Build 2025. Quiero agradecer a Vino Duraisamy por publicar en LinkedIn esa excelente diapositiva resumen que recoge algunos anuncios adicionales.

Jeff es Consultor de Data y Analítica con más de 15 años de experiencia automatizando insights y usando datos para controlar procesos de negocio. Desde el lado tecnológico, se especializa en Snowflake + dbt + Tableau. Desde el lado de negocio, tiene experiencia en Servicios Públicos, Ensayos Clínicos, Publishing, CPG y Manufactura. Escríbele cuando quieras a [email protected].