O Projeto Atlas precisa sair do operacional tático e sustentar decisões de gestão. A diretoria pede um painel executivo com métricas compostas, análises comparativas e narrativa visual clara. O objetivo: priorizar rotas, negociar contratos e medir impacto financeiro. O caso acompanha a evolução para um conjunto de painéis avançados no Grafana, apoiados por modelos Gold, SQL otimizado e camadas de métrica padronizadas.

O kickoff define perguntas de negócio. “Qual rota consome mais manutenção por km?”, “onde a temperatura foge do alvo com maior persistência?”, “qual o custo evitado por alertas resolvidos em menos de 10 minutos?”. Juliana modela uma camada semântica de métricas no warehouse: kpi_temp_out_of_range_rate, kpi_mean_time_to_ack, kpi_cost_avoided, kpi_vibration_severity_index, kpi_on_time_rate. Cada KPI vira uma view materializada com definição única de filtros e janelas, evitando duplicação de lógica.

A equipe cria três painéis no Grafana: Executivo, Qualidade Térmica e Integridade de Rota. No Executivo, um scorecard sintetiza cinco KPIs com tendência semanal, intervalo de confiança e comparação com meta. Um story strip no topo apresenta os principais eventos, alterações de rota e variações climáticas. No Térmico, séries por rota exibem bandas de controle e decomposição por tipo de carga. Na Integridade, mapas de calor por quilômetro e perfil de vibração p95 com drilldown até o veículo.

O primeiro teste revela gargalo: o painel Executivo leva 7–9 s para carregar. Marina otimiza as consultas aplicando três ajustes: 1) substitui subqueries por CTEs reutilizáveis; 2) implementa materialização incremental diária em Gold; 3) habilita cache de consultas no Grafana com TTL de 120 s. O tempo cai para 2,3 s p95. Pedro adiciona índices compostos (route_id, event_time) e Z-order nas partições grandes do warehouse.

Renata solicita confiabilidade perceptível. Cada card exibe o selo “Fonte: Gold | Última atualização hh:mm:ss | Cobertura: 99,2% dos devices”. Cards ficam acinzentados quando a cobertura cai. Tooltips mostram a definição do KPI e link para a view semântica correspondente. Essa transparência elimina discussões sobre divergência de números.

Durante a operação, surge um incidente de dupla contagem. Uma janela reaberta por late data era somada duas vezes. A equipe corrige com chave natural (route_id + window_start) e merge upsert. Testes automatizados garantem que a soma diária da série avançada difere da Silver em no máximo ±0,1%. Os painéis recebem selo de consistência sempre que passam nessa verificação.

Carlos pede priorização automática. O painel Executivo ganha um ranking de risco por rota, calculado por escore composto: tempo acima do limite térmico, vibração p95 anômala, taxa de atraso e severidade de alertas não resolvidos. O ranking aciona ações operacionais: abrir ordem de manutenção, sugerir desvio de rota ou notificar o motorista. No Grafana, webhooks integram essas ações a sistemas externos de tickets e manutenção.

A diretoria exige análises comparativas. Juliana adiciona cohort semanal e AB de rotas: pares controle e tratamento conforme nova programação. As visualizações exibem diferença média e p-valor indicativo de impacto. Filtros salvos (“picos de verão”, “chuvas no Sul”) permitem revisitas rápidas a contextos sazonais.

A segurança e a governança são consolidadas: RBAC por papel, mascaramento de colunas sensíveis no warehouse e auditoria de visualizações via logs do Grafana. Métricas recebem versionamento (v1, v2) e changelog documentado. Uma rotina diária gera relatório de saúde do BI com latência média, taxa de cache, discrepância Gold vs Silver, cobertura de dispositivos e painéis com falha.

Na revisão, três ganhos se destacam. Tempo de decisão: o lead time para agir em desvios térmicos reduz 37%. Custo evitado: o KPI consolidado estima economia mensal com base em incidentes prevenidos. Foco de manutenção: duas rotas lideram o ranking de vibração anômala e, após intervenção, reduzem tickets em 22% semana a semana.

Henrique conclui: “Isso não é só visualizar. É dirigir a operação em tempo real.” O time define critérios finais de aceite: p95 ≤ 3 s no Executivo, coerência Gold vs Silver ≥ 99,5%, cobertura ≥ 99% dos devices ativos e nenhuma lógica duplicada fora da camada semântica. A próxima etapa fecha o arco: Integração Completa e Aplicação Prática, com demonstração ponta a ponta e lições financeiras e operacionais.