SELECTSELECT

SELECT

Novidades no Snowflake: junho de 2025

By Jeff SkoldbergJul 13, 20257 min read

Esta página também está disponível em English, Deutsch, Español, Français, Italiano e 日本語.

Boas-vindas à edição de junho de 2025 do Last Month in Snowflake, em que cobrimos os anúncios mais marcantes do mês. Junho veio carregado de novidades por conta do Snowflake Summit. Neste post, não vamos repetir os mais de 30 anúncios já catalogados no nosso recap do Summit 2025. Em vez disso, vamos destacar os anúncios de junho de 2025 mais relevantes para o usuário comum do Snowflake (com alguma sobreposição com o Summit). Bora lá!

Novidades no Snowsight

Estas são as atualizações do Snowsight que mais nos animaram!

Workspaces — Public Preview

Um dos anúncios mais empolgantes do Summit foi um recurso novo chamado Workspaces: uma IDE moderna, baseada em arquivos, dentro do Snowsight, com integração ao Git (GitHub, GitLab etc.). Ele traz para a interface do Snowflake funcionalidades típicas de IDE, como pastas, integração com Git, sugestões de código com IA e suporte nativo a dbt. Com os Workspaces, dá para organizar código em projetos, colaborar com mais facilidade, fazer push e pull no GitHub (ou em outros provedores Git) e agilizar o fluxo de desenvolvimento sem sair da plataforma Snowflake.

Os Workspaces ficam ainda mais poderosos quando você conecta um repositório Git. Para adicionar um repo, o único pré-requisito é uma API Integration (e um Secret, caso o repo não seja público); o resto é feito pela GUI.

Os Workspaces têm uma integração com Git bem amigável, que permite selecionar uma branch, fazer push, pull e comparar diffs direto na interface:

Impressões gerais sobre os Workspaces

Pessoalmente, deixei as Worksheets de lado e hoje só uso Workspaces, simplesmente pelo fato de conseguir organizar arquivos em pastas e navegar pela árvore de arquivos com muito mais facilidade do que na interface das Worksheets. Mesmo sem estar conectado a um repo Git, ainda prefiro os Workspaces pelo layout melhor, pelo acesso ao histórico de queries e pelo copilot inline.

Há recursos demais nos Workspaces para cobrir aqui; futuramente, vamos publicar um post dedicado a dicas e truques sobre Workspaces (incluindo projetos dbt).

Projetos dbt no Snowflake — Public Preview

Nos Workspaces, dá para rodar projetos dbt direto na interface do Snowsight. O caminho mais fácil é começar conectando um repo existente, como mostrado acima. Quando você tiver um Workspace com um repo dbt conectado, o Snowflake vai pedir para criar um profiles.yml. Feito isso, é só rodar os comandos dbt pela GUI!

No painel inferior, você alterna entre Query History, DAG View e Output.

A visualização do histórico de queries leva direto ao query profile. Observação: esse recurso não é exclusivo dos projetos dbt; todos os Workspaces exibem o histórico de queries. Mas acho particularmente útil ter o histórico de queries do dbt dentro da IDE.

Em qualquer model, você pode clicar no botão "Compile SQL" para ver o SQL compilado ao lado do SQL com template. Já o botão "Show in DAG" destaca aquele model no painel DAG abaixo.

Quando estiver pronto para fazer o deploy, clique em "Connect" no canto superior direito e, em seguida, em "Deploy dbt".

Depois do deploy, dá para ver o projeto dbt em Data → Database / Schema → dbt projects, e o histórico de execuções de todos os projetos dbt em Monitoring → dbt.

Observações e impressões:

  • Prós: adoro a ideia de criar, agendar e monitorar projetos dbt direto no Snowsight.
  • Contras: comandos como dbt deps e dbt build parecem ter um cold start bem demorado.
  • Contras: os logs só aparecem depois que a execução termina. Isso dificulta entender em que etapa o tempo está sendo gasto.
  • Contras: o fato de cada comando de build ter que ser feito pela GUI é meio travado. Sinto falta de rodar slices da DAG pela linha de comando. (A interface para passar argumentos ao comando build é bem desajeitada e precisa melhorar.)

Há muita coisa sobre rodar projetos dbt que não cobrimos aqui. Fique ligado: em breve teremos um post dedicado ao tema!

Task Overview e Graph no nível da conta — GA

Já fazia algum tempo que era possível ver um Task Graph no nível do banco de dados. Agora, dá para visualizar uma visão geral de todas as tasks de uma conta, respeitando as permissões de Task Monitoring.

Na barra lateral esquerda, clique em Monitoring e depois em Task History. Ali, você vê uma lista filtrável de todas as tasks da conta, com um status visual das execuções anteriores.

Na aba Task Runs, dá para ver a lista de cada execução de task da conta.

Aqui você visualiza o DAG de uma execução concluída junto com o "Total Duration Breakdown".

No geral, essa UI ficou muito boa! Gostei especialmente do tooltip Previous Runs. Acho um recurso de observabilidade bastante útil.

Gerenciando Integrations no Snowsight — GA

No Snowflake, uma Integration serve para conectar a recursos externos, como contas de Storage, repositórios Git, criar Network Rules, acesso via API etc. Até agora, as Integrations só podiam ser gerenciadas e observadas via SQL. O Snowflake adicionou a possibilidade de criar, gerenciar e observar Integrations pela interface do Snowsight. É um avanço e tanto na frente de observabilidade.

Vá em Data → Integrations para ter uma visão de todas as Integrations da conta. Use os 3 pontinhos para gerenciar uma integração existente.

A tela Create permite criar novas integrações com facilidade:

A GUI de "create integration" acaba te levando para uma página SQL parecida com uma Worksheet, mas mais efêmera, a não ser que você clique em "Open in Worksheets".

Eu gostaria que o Snowflake oferecesse um fluxo 100% GUI para criar Integrations, mas entendo o desafio, já que há muitas propriedades possíveis em uma integração.

Para mais informações, veja a documentação.

Novidades em SQL

Durante o Summit, o Snowflake anunciou várias expansões do dialeto SQL voltadas para IA. Não vamos revisitar isso aqui. Em vez disso, vamos focar em uma das expansões mais úteis do dialeto SQL: UNION BY NAME.

Operador Union [all] by Name — GA

Em SQL, union e union all normalmente exigem que cada parte da união tenha o mesmo número de colunas e que elas estejam na ordem certa. A nova sintaxe Union by Name alinha as colunas automaticamente com base nos nomes. Se um nome de coluna não existir ou houver diferença na quantidade de colunas, o Snowflake resolve isso retornando automaticamente valores null para a coluna ausente naquela parte da união. Veja um exemplo.

with data1 as
(
    select
        'jeff' as first_name,
        'engineering' as department,
),
data2 as
(
    select
        'skoldberg' as last_name,
        'engineering' as department,
)
select * from data1
union all by name
select * from data2;

Como alguém que já usou a macro dbt_utils.union_relations mais vezes do que consigo contar, recebo esse recurso nativo do Snowflake de braços abertos, até porque ele funciona em CTEs, além de Views e Tables. Esse recurso é uma baita vitória!

Novidades em Data Engineering

Em junho, o Snowflake trouxe uma mudança significativa na frente de Data Engineering (fora os anúncios do Summit).

Artifact Repository — GA

O Artifact Repository se refere à possibilidade de usar pacotes Python do Python Package Index (PyPI) dentro de user-defined functions (UDFs) e stored procedures do Snowpark Python. Infelizmente, esse recurso não está disponível para Notebooks nem para Python Worksheets, embora os pacotes mais populares sempre tenham estado disponíveis nesses ambientes.

Para usar o recurso, é preciso conceder a role nativa pypi_repository_user a uma role de usuário.

1GRANT DATABASE ROLE SNOWFLAKE.PYPI_REPOSITORY_USER TO ROLE data_engineering;

Depois, você pode especificar qualquer pacote do PyPi na assinatura da procedure, informando o argumento ARTIFACT_REPOSITORY. Por exemplo:

CREATE OR REPLACE FUNCTION sklearn_udf()
  RETURNS FLOAT
  LANGUAGE PYTHON
  RUNTIME_VERSION = 3.9
  ARTIFACT_REPOSITORY = snowflake.snowpark.pypi_shared_repository
  PACKAGES = ('scikit-learn')
  HANDLER = 'udf'
  AS
$$

É uma melhoria enorme em relação ao processo anterior, que envolvia copiar wheels Python para Snowflake Stages. O Snowflake está deixando o uso das bibliotecas mais populares muito mais simples!

Para mais informações, veja a visão geral do Artifact Repository.

Outras novidades (fora do Summit):

Para fechar

Vale reforçar que muitos anúncios de junho de 2025 não foram cobertos neste artigo porque já estavam no Summit Recap. As próximas edições de "Last Month in Snowflake" serão praticamente completas. Vamos continuar mantendo você por dentro das mudanças mais importantes do Snowflake!

Jeff é Consultor de Dados e Analytics, com mais de 15 anos de experiência em automação de insights e no uso de dados para orientar processos de negócio. No lado técnico, é especialista em Snowflake + dbt + Tableau. No lado de negócio, tem experiência em Public Utility, Clinical Trials, Publishing, CPG e Manufacturing. Fale com ele quando quiser: [email protected].