A nuvem ficou cara? Descubra como o Data FinOps pode salvar seu Orçamento

Por Isocler Junior, Head of Architecture Solutions & Data Analytics | AI na iblue

Quem já não trabalhou em uma empresa onde o time de tecnologia, cansado de esperar meses por um servidor físico, resolveu abraçar de vez o maravilhoso mundo da Cloud Computing! Rápido, elástico, escalável e… aparentemente, mais barato. Mas como toda boa história, essa também tem seus vilões.

Conforme os times iam subindo seus clusters, pipelines e dashboards para a nuvem, algo começou a incomodar os CFOs e CTOs: a fatura no fim do mês.

O problema não era só usar a Cloud, era não ter visibilidade do que estava sendo consumido e por quem. O resultado? Custos altos, e aquela reunião desconfortável entre Tecnologia e o time do Financeiro.

E normalmente, as reuniões traziam sempre perguntas sem uma resposta assertiva…

“Por que gastamos 2x mais no ultimo trimestre?”

“Quem autorizou essa movimentação de 30TB entre regiões?”

“O que é essa linha de custos chamada Data Transfer?”

 

Os primeiros ensaios do Data FinOps: o que rolou de verdade

O conceito de FinOps começou a ganhar destaque por volta de 2019, puxado inicialmente por práticas internas de grandes empresas de tecnologia e Cloud.
Elas perceberam que o modelo pay-per-use podia virar um pay-per-burn se ninguém pilotasse.

Provedores de infra na Cloud passaram então, a oferecer recursos de monitoramento para dar visibilidade para seus clientes.

No começo, a preocupação deles era oferecer ferramenta básica, mas não impedir o consumo. Contudo, não havia uma “consultoria pioneira” estruturada neste sentido no início. Foi um movimento orgânico, liderado por times de SRE, Engenheiros de Dados, CTOs.

Foi aí que surgiu um herói improvável: Data FinOps. A união entre Finanças, Operações e Dados para colocar ordem ao cenário financeiro da nuvem.

Top 5 – vilões que mais consomem seu orçamento na nuvem

  1. Storage infinito

Já ouviram falar em Data Lake que virou um Data Ocean? Traduzindo, todo mundo escreve dados, e ninguém os apaga.
Solução: Crie políticas automáticas de “data lifecycle”, dando ênfase ao expurgo e arquivamento inteligente.

  1. Pipelines zumbis

Scripts (ETL/ELT) agendados que ninguém usa mais, embora continuem rodando todos os dias.
Solução: Monitore o uso real dos pipelines em alguma plataforma de orquestração. E se ninguém do time de engenharia de dados perceber que não há um output, desligue!

Quem conhece DAGs no Airflow sabe … que rodam todo santo dia, mas ninguém sabe mais por que estão ali rodando? Pois é, são zumbis.

O que se pode fazer com seu time de engenharia de dados: Política de “hibernação e resgate” … A gente marca DAGs suspeitas como deprecated. Pause por umas semanas e veja se alguém reclama. Se ninguém reclamar… delete sem medo.

  1. Máquinas virtuais 24/7 sem necessidade

Pode ser que você ache absurdo isto acontecer, mas tem sim, ambiente de DEV rodando sábado  domingo à noite…

Solução: Use scheduling para ligar/desligar recursos com base em horários úteis.

  1. Queries mal otimizadas

Tem usuário seu rodando um SELECT * em tabela com milhões de linhas?

Erros comuns que os usuários cometem:

  1. SELECT * FROM tabela (sem filtros, nem partição)
  2. Filtros em colunas não particionadas
  3. Join entre tabelas gigantes sem agregação ou sem usar WITH. Ou seja, só junte o que precisa, quando precisa, e com as colunas certas. O resto é conta desnecessária.
  4. Filtros baseados em funções (ex: WHERE YEAR(data) = ‘2023’ em vez de WHERE data BETWEEN ’01-01-2023′ AND ’31-12-2023′). Ou seja, evitar funções na cláusula WHERE como YEAR(), MONTH(), DATE() é uma regra de ouro em ambientes de análise de dados.
  5. Rodar a mesma query 15 vezes só mudando o nome da aba no dashboard . As vezes um simples SELECT COUNT(*) FROM transações WHERE EXTRACT(YEAR FROM data_venda) = 2023 pode comprometer seus custos de processamento de dados… porque não se atentou em usar uma CTE … Dashboard bonito não precisa ser dashboard caro. Otimize a consulta, e não a cor do gráfico ou KPI …
  6. Usar o Data Warehouse como Excel ! Ou seja, se sua query parece um Ctrl+C Ctrl+V com WHERE estado = ‘SP’, WHERE estado = ‘RJ’… respira fundo. Talvez você esteja gastando processamento na Cloud.

Solução: Promova boas práticas de modelagem e análise de dados, revise os direitos de acesso e aplique políticas de limites de uso …

“Se passou de 1TB de dados processados no dia, a conta do usuário fica suspensa até o 1º. Minuto do dia seguinte.” Isso é simples, eficaz e ensina mais que 10 treinamentos.

Uma simples planilha integrada ao Warehouse pode te mostrar o consumo por usuário/dia. Pode parecer simples, mas ter “visibilidade” muda o jogo.

 

  1. Multi-cloud sem controle central

É possível que cada time de operações adote um provedor, mas ninguém consolide uma visão destes gastos.
Outra armadilha que poucos contavam: mover dados entre zonas ou clouds diferentes pode sair caro…

E se você acha que usar o seu Cloud Cost Explorer é fazer Data FinOps, pense de novo. Ele é ótimo para a sua Cloud, especificamente. Mas quando os dados cruzam fronteiras (e clouds), a incerteza é bem maior.

 

Conclusão: FinOps + DataOps

Data FinOps não é sobre cortar tudo que consome custo na nuvem. É sobre gastar melhor, com inteligência.  Isto certamente fará você entender quais dados estão custando caro, quanto custa movimentar dados entre clouds, identificar redundâncias de processamento, entender o custo das pipelines, dashboards ou modelagem.

Empresas que adotam práticas de Data FinOps conseguem:

  • Acelerar a inovação, porque têm mais margem financeira para testar novos projetos
  • Evitar retrabalho e desperdício, porque aprendem com o próprio consumo
  • Ter conversas mais estratégicas entre TI, Dados e Financeiro — sem guerra de culpados
  • Preparar melhor seus times para lidar com ambientes multi-cloud, edge e IA Generativa, onde o custo de dados vai explodir ainda mais nos próximos anos

No fim do dia, controlar custos de dados não é ser burocrático. É empoderar a empresa a inovar de forma sustentável e responsável.

Quer transformar a forma como sua empresa enxerga e consome dados na nuvem?
Na iblue, ajudamos a colocar o Data FinOps em prática com estratégia, tecnologia e, principalmente, visão de negócio. Leia mais sobre o que nos diferencia: iblue consulting | Nossa NPS 2024: O que torna a iblue a parceira ideal, segundo nossos clientes

Se você quer identificar desperdícios, ganhar eficiência e parar de ter surpresas na fatura da Cloud, fale com a gente.
E compartilhe esse conteúdo com aquele colega que vive dizendo: “A nuvem ficou cara, mas ninguém sabe explicar por quê!”