Play
Os slides do webinar acima estão disponíveis aqui.
---
O Snowflake tem um conjunto impressionante de recursos de IA. Dá para rodar modelos de linguagem direto no SQL, embutir busca semântica nas suas aplicações, extrair dados de documentos e deixar que usuários de negócio consultem dados em linguagem natural. O problema é que cada um desses serviços tem o próprio modelo de preço, as próprias views de monitoramento e formas próprias de gerar custos sem você perceber.
Passei as últimas semanas mergulhado nos recursos de IA do Snowflake e escrevi esta série para ajudar você a evitar as surpresas que já vimos acontecer com nossos clientes. A gestão tradicional de custos no Snowflake foca em dimensionamento de warehouse e otimização de queries. Já os serviços de IA pedem um modelo mental totalmente diferente: contagem de tokens, cobrança por mensagem, serving compute, custos de embedding e várias combinações entre eles.
Esta série cobre todos os principais serviços de IA do Snowflake, com queries SQL práticas, exemplos reais de preço e recomendações com ponto de vista. Abaixo, um resumo rápido de toda a série; cada seção traz um link para o artigo completo sobre o tema. Use este artigo como índice para se aprofundar em cada assunto.
Snowflake Cortex Search: visão geral e monitoramento de custos
O Cortex Search é um serviço de busca híbrida totalmente gerenciado que cobre busca vetorial, por palavra-chave e semântica para aplicações RAG. A estrutura de custos é a mais complexa entre todos os serviços de IA do Snowflake: você paga por serving compute (custo contínuo por GB de dados indexados), tokens de embedding durante a indexação, compute de warehouse para refreshes, armazenamento dos índices e overhead de cloud services. Este guia detalha cada componente com queries SQL específicas para acompanhar o consumo diário e por hora, além de recomendações sobre o uso de chaves primárias para atualizações incrementais e right-sizing dos seus serviços de busca antes que os custos saiam do controle.
Mais detalhes sobre uso, entendimento e monitoramento de custos estão no nosso post completo sobre o tema.
Custos do Snowflake Cortex Analyst: visão geral e monitoramento
O Cortex Analyst converte perguntas em linguagem natural em queries SQL, e usa cobrança por mensagem em vez de por token. Toda query bem-sucedida (resposta HTTP 200) custa uma mensagem, independentemente da complexidade, mas também é preciso considerar os custos de warehouse para executar o SQL gerado. O artigo completo explica como usar a view CORTEX_ANALYST_USAGE_HISTORY para acompanhar o consumo de mensagens por usuário e período, e traz estratégias para atribuir custos de warehouse quando o Cortex Analyst divide recursos de compute com outros workloads.
Confira nosso post completo sobre o tema para saber mais sobre como usar o Cortex Analyst, como ele é cobrado e como monitorar custos.
Como monitorar custos das funções Cortex AISQL no Snowflake
Funções AISQL como AI_COMPLETE, AI_EXTRACT, AI_CLASSIFY e AI_SUMMARIZE permitem rodar modelos de IA direto em queries SQL. Essas funções usam cobrança baseada em tokens, em que tanto tokens de entrada quanto de saída contam nas funções generativas, e os custos variam muito conforme o modelo escolhido (modelos premium podem custar 10x mais do que alternativas menores). Este artigo traz exemplos reais de preço, mostrando que analisar 10.000 avaliações de produtos custa US$ 0,96 com GPT-4o-mini, mas US$ 9,00 com Llama 3.1 405B, junto com queries SQL para monitorar custos por modelo, usuário e warehouse na view METERING_HISTORY.
Confira nosso post completo sobre o tema para saber mais sobre as nuances de tokens, escolha de modelos e monitoramento de custos.
Document AI: visão técnica geral e monitoramento de custos
O Document AI do Snowflake extrai dados estruturados de PDFs, imagens e documentos digitalizados usando a função SNOWFLAKE.CORTEX.PARSE_DOCUMENT. O serviço é cobrado com base no tempo de compute dos AI Services (8 créditos por compute-hour), e os custos escalam com a quantidade de páginas, a densidade do documento e o número de valores extraídos. Um pipeline típico de processamento de notas fiscais custa cerca de US$ 0,05 por documento, mas documentos jurídicos densos ou formulários complexos podem sair bem mais caro. O guia inclui queries SQL para acompanhar os custos de processamento de documentos e traz recomendações sobre limiares de confiança, estratégias de processamento em lote e quando encaminhar extrações de baixa confiança para revisão manual.
Confira nosso post completo sobre o Document AI para se aprofundar no assunto.
Snowflake Intelligence: visão técnica geral e monitoramento de custos
Talvez o recurso mais empolgante para o usuário comum no universo Cortex, o Snowflake Intelligence é uma nova aplicação disponível em ai.snowflake.com; é uma interface de agente de IA que permite a usuários de negócio fazer perguntas em linguagem natural e obter respostas com gráficos e insights, sem precisar de SQL. Ele orquestra dados estruturados (via Cortex Analyst), dados não estruturados (via Cortex Search) e ferramentas customizadas para entregar respostas completas. O modelo de custo é, na verdade, mais simples do que o de outros serviços: não há cobranças específicas de agente, você só paga pelas requisições do Cortex Analyst e pelo uso do Cortex Search por trás. O desafio é que os custos do Intelligence ficam espalhados por vários tipos de serviço nas views de uso da conta, então o artigo traz queries que agregam todos os custos relacionados e explica estratégias para atribuir os custos de execução do warehouse de volta às queries geradas pelo agente.
Para saber mais sobre como usar o Snowflake Intelligence, como configurá-lo e como ele é cobrado, confira nosso post completo sobre o tema.
Por onde começar
Se você já usa algum desses serviços, comece pelo artigo que cobre o que você está utilizando. Se ainda está avaliando quais recursos de IA adotar, recomendo começar pelo Snowflake Intelligence ou pelas funções AISQL, já que são os mais amplamente aplicáveis.
Vou adorar saber se você tem alguma dúvida sobre qualquer um desses artigos. Conta pra gente quais recursos de IA você está usando e como está mantendo os custos sob controle.
Jeff é consultor de dados e analytics com mais de 15 anos de experiência em automação de insights e uso de dados para controlar processos de negócio. Do ponto de vista tecnológico, é especialista em Snowflake + dbt + Tableau. Do ponto de vista de negócio, tem experiência em Utilities, Ensaios Clínicos, Publishing, CPG e Manufatura. Fale com ele a qualquer momento: [email protected].