O que é o Cortex AI SQL?
As funções Cortex AISQL do Snowflake trazem a IA direto para dentro das suas queries SQL. Em vez de exportar dados para rodar em um modelo, você só adiciona uma coluna a qualquer instrução select e invoca a IA bem ali onde os dados estão. Dá para analisar texto, imagens e áudio ao lado dos seus dados estruturados usando funções como AI_COMPLETE, AI_EXTRACT, AI_CLASSIFY, AI_SUMMARIZE, entre outras — tudo rodando em modelos da OpenAI, Anthropic, Meta, Mistral e mais.
Mas o que os clientes do Snowflake nem sempre percebem é que o modelo de preços por token é totalmente diferente do modelo baseado em warehouse a que você está acostumado. E esses custos podem disparar rápido se você não se cuidar.
Já vi times rodarem um "teste rápido" com o Claude Opus e torrarem um bocado de créditos numa tarde só. Não sabiam que os tokens de saída também contam, escolheram um modelo caro quando um mais barato resolveria numa boa e não tinham nenhum monitoramento para perceber a tempo.
Neste post, vamos ver como o Cortex AISQL é cobrado e mostrar exatamente como monitorar os custos do Cortex AISQL usando as views account_usage do Snowflake.
Como o Cortex AI SQL funciona?
Usar as funções Cortex AISQL é direto ao ponto — basta chamá-las nas suas instruções SQL, como qualquer outra função. Veja um exemplo simples que classifica feedbacks de clientes como positivos, negativos ou neutros:
SELECT
customer_id,
feedback_text,
SNOWFLAKE.CORTEX.AI_CLASSIFY(
feedback_text,
['positive', 'negative', 'neutral']
) as sentiment
FROM customer_feedback
LIMIT 10;
O único pré-requisito é que sua role tenha a database role SNOWFLAKE.CORTEX_USER. Por padrão, ela já é concedida à role PUBLIC, então a maioria dos usuários já tem acesso.
É isso. Sem chaves de API externas, sem mover dados, sem montar infraestrutura. Os modelos de IA rodam direto no ambiente do Snowflake.
Sempre consulte a Snowflake Credit Consumption Table
Antes de nos aprofundarmos nos custos do Cortex AISQL, vale lembrar que os detalhes de preços de tudo no Snowflake estão na Credit Consumption Table, que é atualizada continuamente. Na captura de tela abaixo dá para ver que o preço dos diversos modelos de IA varia drasticamente. O Claude-4-opus custa 12 créditos por milhão de tokens, enquanto alguns dos modelos menores saem por uma fração de crédito por milhão de tokens.
Como funciona o preço do Cortex AI SQL?
Com as funções Cortex, você paga por token processado (tokens de entrada + saída em funções generativas, só entrada em embeddings).
Funções generativas como AI_COMPLETE, AI_CLASSIFY e AI_SUMMARIZE cobram tanto pelos tokens de entrada (o texto que você manda para o modelo) QUANTO pelos tokens de saída (a resposta gerada pelo modelo). Se você envia 100 tokens e recebe 200 de volta, está pagando por 300 tokens no total.
A principal função de embedding é a AI_EMBED, que vetoriza dados como texto ou imagens. Aqui você só é cobrado pelos tokens de entrada, já que a saída são apenas números (não texto gerado).
Entendendo os tokens
- 1 token ≈ 4 caracteres de texto
- Use a função
COUNT_TOKENSpara estimar custos antes de rodar operações caras - Tanto os tokens de entrada QUANTO os de saída contam em funções como
AI_COMPLETE,AI_CLASSIFYeAI_SUMMARIZE - Apenas os tokens de entrada contam para
AI_EMBEDe funções de extração
Exemplos de preços
Vamos trazer alguns exemplos para você pegar a ordem de grandeza, mas o Snowflake muda os preços com frequência, então sempre consulte a Credit Consumption Table. Estes exemplos usam US$ 3 por crédito a título de ilustração.
Modelos pequenos:
openai-gpt-5-mini: 0,32 créditos = US$ 0,96 por milhão de tokensmistral-7b: 0,12 créditos = US$ 0,36 por milhão de tokens- Exemplo:
- Análise de 20.000 avaliações de produtos com
openai-gpt-5-mini - Avaliação média de 100 tokens cada: 2 mi de tokens = ~US$ 1,92
- Análise de 20.000 avaliações de produtos com
Modelos médios:
llama3.1-70b: 1,21 créditos = US$ 3,63 por milhão de tokensopenai-gpt-4.1: 1,40 créditos = US$ 4,20- Exemplo: as mesmas 20.000 avaliações com
llama3.1-70b= ~US$ 7,26
Modelos grandes (3+ créditos por milhão de tokens):
llama-3.1-405b: 3 créditos = US$ 9 por milhão de tokensclaude-4-opus: 12 créditos = US$ 36 por milhão de tokens- Exemplo: as mesmas 20.000 avaliações com
claude-4-opus= ~US$ 72
Multiplicadores de custo do Snowflake Cortex AI SQL
Alguns fatores fazem os créditos evaporarem mais rápido do que o desejado. Veja em quais deles ficar de olho.
Saídas longas multiplicam os custos rapidamente, já que as funções generativas cobram pelos tokens de entrada e de saída. Um resumo prolixo de 500 palavras custa 5x mais do que um resumo enxuto de 100 palavras. Isso é controlado pela sua engenharia de prompt.
A escolha do modelo pesa mais do que a maioria das pessoas imagina: modelos premium como o Claude Opus custam 37x mais do que um modelo básico como o GPT 5 mini e, para muitas tarefas de classificação ou análise de sentimento, o modelo mais barato dá conta tranquilamente.
Como monitorar custos e uso do Cortex AI SQL
O Snowflake oferece duas views dedicadas para monitorar os custos das funções Cortex AISQL, cada uma com um propósito diferente:
CORTEX_FUNCTIONS_USAGE_HISTORY - dados de uso agregados por hora
- Agrupa o consumo de tokens e créditos por função, modelo e hora
- Não traz o query ID, então não dá para fazer join com uma query, usuário ou role específico
- Ideal para entender padrões e tendências gerais de uso
- Mostra quais funções e modelos estão gerando mais custos
- Dados agregados em incrementos de 1 hora
CORTEX_FUNCTIONS_QUERY_USAGE_HISTORY - detalhes em nível de query individual
- Mostra o consumo de tokens e créditos para cada query específica
- Essencial para identificar queries ou operações individuais caras
- Inclui query IDs para investigação mais profunda
- Ajuda a achar queries que precisam de otimização
Aqui vão alguns exemplos de queries para você começar.
Resumo de custos por hora ou por dia, por função e modelo:
-- Por hora, basta selecionar todas as colunas da view:
select
start_time,
end_time,
function_name,
model_name,
warehouse_id,
token_credits,
tokens
from
SNOWFLAKE.ACCOUNT_USAGE.CORTEX_FUNCTIONS_USAGE_HISTORY;
--diário, basta agregar
select
date_trunc('day',start_time) as date,
Expandir código
As 50 queries mais caras. Custo de cada query, incluindo o texto da query, o usuário e o warehouse:
SELECT
c.query_id,
q.query_text as query_text,
q.start_time,
q.execution_time / 1000 as execution_seconds,
c.function_name,
c.model_name,
c.tokens,
c.token_credits,
q.user_name,
q.warehouse_name,
FROM SNOWFLAKE.ACCOUNT_USAGE.CORTEX_FUNCTIONS_QUERY_USAGE_HISTORY c
JOIN SNOWFLAKE.ACCOUNT_USAGE.QUERY_HISTORY q
ON c.query_id = q.query_id
WHERE q.start_time >= DATEADD(day, -7, CURRENT_TIMESTAMP())
Expandir código
Também achei uma view chamada snowflake.account_usage.cortex_aisql_usage_history, embora eu não tenha encontrado documentação sobre ela. Essa view está no grão de query ID e oferece usage_time, user_id e warehouse_id. Talvez seja um recurso de preview não documentado.
Melhores práticas e recomendações ao usar o Cortex AI SQL
Depois de trabalhar com clientes em custos do Cortex AISQL, aqui vão algumas recomendações.
Configure alertas, e não só dashboards
Aquelas queries de monitoramento acima não valem nada se ninguém as executa. Para qualquer coisa que você queira monitorar no Snowflake, dá para envolver o SQL em uma tarefa agendada com uma Notification Integration e criar um monitor customizado que envia alertas para o Slack ou Teams. Se você quer um monitoramento extremamente fácil de usar, dê uma olhada nos monitors no SELECT.
Sempre teste a contagem de tokens primeiro
Antes de processar 100.000 linhas, rode o COUNT_TOKENS em uma amostra. A contagem de tokens quase sempre é maior do que você imagina. Um teste rápido como SELECT AVG(COUNT_TOKENS(your_column)) FROM your_table LIMIT 1000 já mostra com o que você está lidando.
Comece pelo menor modelo que resolva
Vejo isso o tempo todo: as equipes vão direto no GPT-4 ou em modelos Claude maiores porque são conhecidos e confiáveis. Mas, para a maioria das tarefas de classificação ou análise de sentimento, o gpt-5-mini dá conta numa boa e custa 10x menos. Teste com um modelo premium em 100 linhas e depois experimente o modelo mais barato. Você pode se surpreender ao ver o modelo pequeno entregar resultados parecidos.
Peça à IA para manter a saída curta
Quando você usa AI_COMPLETE ou AI_SUMMARIZE, paga tanto pelo prompt QUANTO pela resposta. Se o seu prompt pede explicações detalhadas e você está processando milhares de linhas, esses tokens de saída se acumulam rápido. Seja explícito ao pedir respostas curtas.
Faça cache dos resultados / use atualizações incrementais
Se você está classificando as mesmas descrições de produto toda vez que alguém roda um relatório, está jogando dinheiro fora. Materialize os resultados da IA em uma tabela. Sim, parece óbvio, mas nem todo mundo faz isso.
Fique de olho em quais modelos estão sendo realmente usados
Rode aquela query de "Custo por usuário e warehouse" regularmente. Volta e meia você vai descobrir alguém testando com um modelo caro em dev que nunca foi trocado por uma opção mais barata em produção. Ou pior: vai encontrar uma query desgovernada processando milhões de linhas com um dos modelos Claude mais caros.
Para fechar
O Snowflake oferece tudo o que você precisa para monitorar os custos do AISQL: account usage views com detalhes de custo, preços transparentes (embora complicados) e capacidade de alertas embutida. O desafio é mudar o modelo mental para entender a cobrança baseada em tokens. A maior parte dos usuários veteranos do Snowflake pensa por instinto em duração da query e tamanho do warehouse, mas agora você também precisa focar em contagem de tokens e escolha do modelo. Encare suas primeiras semanas com o Cortex AISQL como um período de aprendizado. Comece pequeno, monitore de perto e estabeleça padrões antes de escalar. O modelo de preços recompensa uma implementação cuidadosa e pune a abordagem do "roda em tudo e vê no que dá". Já vi equipes entrarem em pânico com custos de IA que saíram do controle, quando, na real, os modelos têm preços razoáveis se você os usar com cabeça. Se você processa datasets realmente massivos diariamente com funções de IA, vale uma conversa com o time de conta do Snowflake sobre preços por volume. Se está batendo milhões de tokens por dia, pode haver espaço para negociar tarifas melhores. Espero que agora você se sinta confiante para usar as funções Cortex AISQL sem levar susto na fatura! Adoraria saber das suas experiências com esses recursos.
Jeff é Consultor de Dados e Analytics com mais de 15 anos de experiência em automatizar insights e usar dados para controlar processos de negócio. No lado técnico, é especialista em Snowflake + dbt + Tableau. Em termos de áreas de negócio, tem experiência em Utilities, Ensaios Clínicos, Publishing, CPG e Manufatura. Entre em contato a qualquer momento: [email protected].