Como a Personio criou cultura de custos ao escalar o Snowflake para mais de 280 usuários
- 60%
- de redução no tempo de execução dos pipelines dbt
- 280+
- usuários diretos do Snowflake atendidos
A HomeChef vinha usando o Snowflake havia cinco anos com custos estáveis, principalmente para analytics em batch diários. Conforme novos workloads operacionais entraram em cena, os custos dispararam 15x. Os dashboards caseiros em Looker usados para monitorar custos davam conta da rotina, mas patinavam diante de novos problemas e exigiam um esforço considerável em análises ad-hoc.
O SELECT entregou visibilidade imediata de custos e insights de otimização que as ferramentas internas da HomeChef não ofereciam. A configuração levou apenas 30 minutos. A integração profunda do SELECT com o dbt e o detalhamento completo de custos permitiram ao time identificar rapidamente oportunidades de otimização de alto impacto entre seus mais de 1.200 modelos dbt, oferecendo a visibilidade que antes só era possível com dashboards customizados.
O SELECT é exatamente o que eu e o Paul teríamos construído se tivéssemos nos trancado numa sala por 18 meses para criar nossa solução ideal de monitoramento.
Devin McGee, Data Engineering Lead na Home Chef
A HomeChef migrou do EMR para o Snowflake cinco anos atrás, inicialmente usando-o para alimentar dashboards no Looker com atualizações diárias em batch via dbt, em uma configuração estável e econômica. Tudo mudou quando a HomeChef passou a usar o Snowflake para sustentar cada vez mais workloads operacionais. Saíram de queries executadas uma vez por dia para queries a cada 15 minutos. Quando se faz muitos upserts em tabelas de churn, o gasto com Snowflake sobe muito rápido. O aumento foi de praticamente uma ordem de magnitude, quase do dia para a noite.
Antes do SELECT, a HomeChef montou um monitoramento interno de custos com coleta incremental do histórico de queries, segregação de warehouses para acompanhar gastos por ambiente dbt e dashboards customizados em Looker. A solução caseira funcionava para o monitoramento de rotina, mas virava um problema quando surgiam novos cenários. Adicionar funcionalidades exigia abrir PRs com novas dimensões nas tabelas e métricas nos dashboards, e as análises ad-hoc eram lentas por causa da estrutura complexa de metadados do Snowflake. A inércia e o atrito eram altos. Conforme o conjunto de recursos que usavam dentro do Snowflake crescia, era como aprender um novo dataset esotérico a cada vez.
Quando os custos dispararam, a HomeChef precisava de visibilidade imediata sobre o que estava puxando o gasto. Em 30 minutos, já estavam rodando com o SELECT. O profundo conhecimento do SELECT sobre o ecossistema dbt e a visibilidade abrangente de custos tornaram a transição fluida, dispensando as soluções caseiras.
A HomeChef alcançou reduções expressivas de custo atacando primeiro as questões de armazenamento (com 20% de economia) e, em seguida, usando o SELECT para identificar oportunidades de otimização de performance que renderam outros 40%. Com mais de 1.200 modelos dbt, identificar manualmente os alvos de otimização seria inviável. O detalhamento de custos e os insights de performance do SELECT permitiram que o time concentrasse esforços onde teria o maior impacto. O SELECT funcionou tanto como ferramenta de identificação de alvos quanto como panóptico de monitoramento das otimizações de performance.
O SELECT mudou a postura da HomeChef: de apagar incêndios reativamente para um monitoramento proativo. Hoje o Devin começa todo dia de trabalho com uma olhada rápida no SELECT. Ele pega o café, confere os pipes e, em seguida, abre o SELECT. Em dois ou três minutos, ele já tem uma noção do que está acontecendo na conta Snowflake no dia. Essa rotina permite detectar cedo anomalias, novos workloads e picos de custo antes que virem problemas maiores. Ele consegue acompanhar mudanças de uso ao longo do tempo e identificar novos casos de uso não previstos, o que permite ao time de business analytics conversar diretamente com esses usuários finais.
Talvez a mudança cultural mais importante tenha sido os analytics engineers passarem a pensar em otimização durante o desenvolvimento, e não depois do deploy. Em sessões de pareamento usando insights do SELECT, o time como um todo aprendeu princípios de otimização de queries. Hoje, os analytics engineers já otimizam a performance proativamente antes de abrir pull requests. Os AEs agora avisam de cara: "olha, esse aqui vai ser caro", e dizem "reduzi o runtime disso de X para Y antes de abrir o PR porque sabia que essa window function ia me matar". Igualmente importante, o SELECT ajuda a decidir quando não otimizar, evitando esforço desperdiçado em modelos de baixo impacto.
Descubra como o SELECT ajuda os times a reduzir desperdício no warehouse, melhorar a visibilidade e agir com base em insights de custos de dados.
This is the easiest thing we've ever done to save money - 20x ROI. Does this not exist for AWS?
Skyler Chi, SVP, GTM Productivity & Excellence at Exiger
SELECT feels like exactly what Paul and I would have built if we had locked ourselves in a room for 18 months to create our ideal monitoring solution.
Devin McGee, Data Engineering Lead at Home Chef
SELECT has made important cost data readily accessible. I will often pull it up during engineering design reviews so we can quickly evaluate cost impact and projections and factor that into our design decision.
Douglas Zickuhr, Senior Data Platform Engineer at Personio
Our costs had jumped up 3X as we scaled, so we're talking about 60% savings in Snowflake spend after adopting SELECT.
Edward Mancey, GTM Lead at Synthesia
SELECT dramatically lowers the cognitive load to understanding Snowflake costs. I'm able to sit there and easily understand what's driving the cost.
Blake Baggett, Head of Data Operations at Entain
You guys have the best UI experience that I've had of any software. It's like you just read my mind where, like, oh, I wish I could click there. Oh, wait, I can!
Diana Koshy, Sr. Director of Data Engineering at Kargo
SELECT works the way my brain works. I love clicking through the query patterns and different workloads. It's a very intuitive diagnostic flow.
Ian Fahey, Senior Analytics Engineer at Loop
One of the most helpful cost rituals we've setup from SELECT is the weekly spend digest sent to Slack. I can start high level and ensure things are in check.
Michael Revelo, Manager of data and analytics engineering at ClickUp