SELECTSELECT

SELECT

Snowflake BUILD 2025: o resumo

By Jeff SkoldbergNov 20, 20257 min read

Esta página também está disponível em English, Deutsch, Español, Français, Italiano e 日本語.

O Snowflake BUILD 2025 trouxe uma leva de novos recursos e parcerias com foco em IA, integração de dados e produtividade para quem desenvolve. Veja um resumo rápido dos principais anúncios.

Base de dados — integração e conectividade

Para construir produtos de IA, o primeiro passo é ter uma base de dados limpa.

Openflow Snowflake Deployment (GA)

Um serviço de integração de dados aberto, extensível, gerenciado e multimodal, com suporte a dados estruturados e não estruturados, em batch e em streaming. Agora em GA tanto na AWS quanto no Azure para deployment gerenciado pelo Snowflake, o que torna a movimentação de dados muito mais simples. Antes, esse recurso só estava disponível no modelo "Bring your own Cloud", em que o Openflow era implantado na AWS e depois conectado ao Snowflake. Com o deployment pelo Snowflake, a criação e o gerenciamento ficam muito mais fáceis. Testei no fim de semana: a configuração foi tranquila, mas usar o produto tem uma certa curva de aprendizado.

Snowflake AI Data Cloud encontra o SAP Business Data Cloud

A Snowflake anunciou uma integração bidirecional zero-copy entre o SAP Business Data Cloud e o Snowflake AI Data Cloud. O recurso oferece acesso simplificado a dados SAP curados e prontos para o negócio, preservando o contexto de negócio para acelerar IA e analytics. O SAP BDC harmoniza dados entre aplicações SAP. Clientes SAP que ainda não usam o Snowflake passam a ter acesso ao SAP Snowflake, um produto Snowflake embarcado no SAP BDC.

O Snowflake hoje conta com integrações zero-copy com Workday (em desenvolvimento), Salesforce, Oracle (Public Preview em breve) e SAP.

Anúncios de IA do Snowflake

Snowflake Intelligence (GA)

O Snowflake Intelligence está sendo chamado de "o futuro do trabalho", já que é a interface do Snowflake no estilo ChatGPT para usuários de negócio não técnicos. Temos falado bastante sobre isso aqui no SELECT; o recurso agora está em GA em todas as clouds do Snowflake.

Cortex Code (Private Preview)

O Cortex Code é um assistente de IA para programar e investigar sua infraestrutura Snowflake, integrado diretamente ao Snowsight. Ele ajuda em tarefas administrativas, de segurança e governança, além de funcionar como assistente de código por linguagem natural.

Cortex Agents API (GA)

Os agentes de IA gerenciados do Snowflake recuperam e analisam dados estruturados e não estruturados usando modelos de raciocínio robustos. Eles entregam insights precisos por meio de uma API REST prática, com segurança e governança unificadas.

Cortex Knowledge Extensions (GA)

As CKEs do Snowflake integram dados não estruturados de terceiros a sistemas agênticos por meio do compartilhamento seguro de documentos indexados pelo Cortex Search Service. Você acessa fontes de conteúdo licenciado, como notícias e pesquisas, em tempo quase real, mantendo os prompts dentro da sua conta. O recurso passou de Public Preview para GA.

Snowflake Managed MCP Server (GA)

O MCP gerenciado pelo Snowflake permite que todos os seus investimentos no Snowflake sejam orquestrados pela ferramenta de IA que você preferir, via Model Context Protocol. Com isso, ferramentas como Claude, ChatGPT ou outras aplicações baseadas em LLM conseguem acessar e interagir com seus dados e infraestrutura no Snowflake de forma segura. Ao adotar o padrão aberto MCP, o Snowflake possibilita que o seu assistente de IA preferido consulte dados, entenda seu schema, execute SQL e aproveite tudo o que você já tem no Snowflake, sem precisar de integrações personalizadas.

Mais informações sobre como criar o MCP Server dentro da sua conta Snowflake estão aqui.

Online Feature Store for ML (Public Preview)

Entrega de baixa latência (<50ms P90) de features de ML para casos de uso de inferência online, como detecção de fraudes e recomendações em tempo real. Tem consistência automatizada com os pipelines de features offline e alta disponibilidade, sem precisar gerenciar infraestrutura.

Cost Governance Controls for AISQL (GA em breve)

Um framework de tagueamento personalizado que permite aos administradores acompanhar, gerenciar e aplicar automaticamente orçamentos de gastos com IA. Configure notificações ou ações personalizadas para quando os gastos ultrapassarem determinados limites.

Parceria Snowflake e Vercel

A Snowflake anunciou uma integração com a ferramenta de desenvolvimento baseada em IA da Vercel, o v0. Com ela, dá para construir e implantar aplicações Next.js orientadas a dados no Snowpark Container Services usando linguagem natural. A arquitetura dividida mantém compute e dados dentro do Snowflake, enquanto a Vercel cuida das camadas de aplicação e autenticação, herdando automaticamente as políticas de segurança do Snowflake. Os usuários conversam com o v0 para consultar dados e gerar aplicações completas, com rotas de API que são implantadas em um clique. A integração está em fase de lista de espera.

Pelo que entendi, isso vai facilitar muito a criação de aplicações de IA bonitas e modernas rodando no Snowflake.

Plataforma de dados e infraestrutura

Storage Lifecycle Policies

Um novo recurso que todo engenheiro de dados precisa conhecer: as Storage Lifecycle Policies permitem mover dados automaticamente para armazenamento COOL ou COLD, ou ainda excluir uma linha, com base na política definida e na idade do registro. Isso elimina a necessidade de stored procedures para implementar políticas de retenção de dados e ainda traz o benefício de camadas de armazenamento mais baratas. Uma imagem vale mais que mil palavras, então vale a pena conferir as imagens da documentação do Snowflake:

Vamos passar por todos os elementos de custo das Storage Lifecycle Policies do Snowflake:

Armazenamento:

  • O armazenamento Cool custa US$ 4 por TB/mês na AWS e os dados continuam prontamente disponíveis para consulta. Ao mover dados para essa camada, é preciso mantê-los por 90 dias; caso contrário, é cobrada uma taxa mínima de duração de armazenamento.
  • O armazenamento Cold custa US$ 1 por TB/mês. A recuperação de dados da camada Cold pode levar até 48 horas. A duração mínima de arquivamento é de 180 dias, com taxa para remoção antecipada.

Custo de execução de políticas / custo de arquivamento:

  • As políticas são executadas uma vez a cada 24 horas usando Serverless Compute gerenciado pelo Snowflake para movimentar seus dados. Esse compute serverless tem um multiplicador de créditos de 50%, ou seja, custa metade de um warehouse tradicional. O Snowflake determina o tamanho de compute necessário.
  • Você também paga 0,05 créditos a cada 1.000 arquivos arquivados.

Custo de recuperação de dados:

  • São cobrados 0,05 créditos a cada 1.000 arquivos recuperados.

Snowflake Postgres (Public Preview em breve, em regiões limitadas)

Um serviço PostgreSQL totalmente gerenciado no Snowflake AI Data Cloud, pensado para workloads transacionais rápidos e de alto volume (OLTP). Com ele, você sobe tudo em minutos e tem baixíssima sobrecarga de gerenciamento e administração. Já vem com extensões populares do Postgres, como PG Vector e PGIS.

pg_lake (GA)

O "pg_lake" é um conjunto de extensões open source do PostgreSQL que permite ao PostgreSQL gerenciar seu catálogo Iceberg. O Ducklake foi o primeiro a fazer isso e faz todo sentido contar com um banco relacional para gerenciar o catálogo Iceberg. Isso deve facilitar a exploração de versões e o time travel, além de melhorar o desempenho da camada de metadados do Iceberg. Para saber mais, confira o repositório no GitHub.

Crédito da imagem

Hybrid Tables no Azure (GA)

As Hybrid Tables, que combinam capacidades transacionais e analíticas, agora estão em general availability no Azure.

Horizon Catalog: escrita em qualquer Iceberg (GA)

O Apache Polaris agora está embarcado no Horizon Catalog, permitindo a escrita em qualquer tabela Iceberg com os mesmos recursos de tagueamento, governança e lineage.

Continuidade de negócios e disaster recovery para Snowflake Managed Iceberg Tables (GA)

O BDCR agora está disponível para tabelas Iceberg gerenciadas pelo Snowflake.

Interactive Tables & Warehouses (GA em breve)

As Interactive Tables são otimizadas para ingestão e consulta em streaming em tempo real. Elas se apoiam nos Interactive Warehouses, que estão sempre ativos e com caches pré-aquecidos. Foram pensadas para analytics em sub-segundos, com baixa latência e alta concorrência.

Experiência de desenvolvimento

Workspaces (GA)

Os Workspaces agora estão em GA! Para quem ainda não conhece, os workspaces são um ambiente de desenvolvimento centralizado e baseado em arquivos dentro do Snowsight, com edição unificada de código e controle de versão. Os Workspaces se conectam ao Git para controle de versão e colaboração, e também podem rodar dbt. O Snowflake também anunciou os Shared Workspaces: agora dá para compartilhar seu workspace com o time.

Integração com Git aprimorada (GA)

O Snowsight agora suporta repositórios self-hosted, com melhorias importantes na integração com Git. Um app do GitHub Actions está disponível no Marketplace para simplificar a integração com CI/CD.

dbt Projects on Snowflake (GA)

Crie, teste, implante e monitore projetos de transformação de dados dbt direto no Snowflake. Sem precisar gerenciar a infraestrutura do dbt Core. Agora você pode importar projetos existentes ou criar novos nos Snowsight Workspaces. O recurso estava em Public Preview desde o Snowflake Summit em junho e agora chegou ao GA.

Snowpark Connect for Apache Spark™ (GA)

Execute código existente do Apache Spark (DataFrame, SQL) direto no Snowflake, com migração mínima. O Snowpark Connect elimina o gerenciamento de clusters Spark e taxas de egress, com desempenho 5,6x mais rápido e economia média de 41% no TCO. O recurso estava em Preview desde o nosso último resumo "What's New in Snowflake", mas agora o Snowflake o levou para GA.

Snowflake Optima (GA)

Um motor de otimização de workloads que aprende de forma automática e contínua a partir dos seus padrões de uso. Cuida da indexação e da coleta de metadados, dispensando ajustes manuais para melhorar o desempenho das consultas.

Compartilhamento de dados e colaboração

Compartilhamento de Semantic Views (GA)

Os provedores de dados agora podem compartilhar semantic views junto com dados estruturados, permitindo consultas em linguagem natural. Desenvolvedores conseguem integrar facilmente os dados compartilhados em aplicações de IA e sistemas agênticos, sem precisar de pré-processamento adicional.

Compartilhamento de Open Table Format (GA)

Compartilhe dados armazenados em formatos de tabela abertos, como Iceberg, em toda a plataforma Snowflake.

Para fechar

Este artigo cobre os destaques do Snowflake Build 2025. Quero agradecer à Vino Duraisamy por publicar esse ótimo slide-resumo no LinkedIn, que traz ainda mais alguns anúncios.

Jeff é Consultor de Dados e Analytics com mais de 15 anos de experiência em automatizar insights e usar dados para conduzir processos de negócio. No lado da tecnologia, é especialista em Snowflake + dbt + Tableau. Em termos de áreas de atuação, tem experiência em Utilidades Públicas, Ensaios Clínicos, Publicações, Bens de Consumo e Manufatura. Fale com ele quando quiser: [email protected].