Case — Pulse (Conformidade de Postos de Combustível com Visão Computacional)
Tipo: AutoU (cliente: Rede São Roque — rede de postos de combustível) Papel: Desenvolvedor Full Stack / IA — pipeline de visão computacional, backend, deploy e observabilidade Status: Em produção (edge agent 24/7 nos postos) Stack: Python, YOLO (detecção), FastAPI, React, PostgreSQL, LangGraph + Gemini (pipeline agêntico), RAG, AWS (S3, Lambda, DynamoDB), Google Cloud (2 VMs), RTSP stream-worker, Prometheus + Grafana, Caddy, Docker Compose, Roboflow + Google Colab (retraining)
Nota de confidencialidade: projeto de cliente da AutoU — validar o que pode ser público antes de expor nome/detalhes.
Contexto e problema
Rede de postos precisava fiscalizar conformidade visual das unidades (manchas de óleo, lixo, cabos expostos, EPIs) — hoje dependente de visitas presenciais e fotos esporádicas. Sem detecção contínua, problemas ficavam dias sem tratativa e a gerência não tinha visão consolidada.
Solução
Sistema de monitoramento contínuo com ciclo completo de melhoria do modelo:
- Edge Agent (PC no posto): consome câmeras via RTSP, roda YOLO 24/7, valida detecções e faz upload dos eventos
- Backend cloud: armazena eventos e fotos (S3, retenção 1 ano; DynamoDB para eventos/feedback), API REST com fluxos de
resolve,false-positivee dashboard - Pipeline agêntico (LangGraph + Gemini + RAG): análise das ocorrências, geração de insights e tratativas, integração com fluxo de e-mail/WhatsApp para notificação
- Dashboard React: gerência aprova/resolve ocorrências e marca falsos positivos
- Loop de retraining: feedback dos usuários vira dataset (script de coleta), re-treino em Colab com Roboflow, novo modelo volta ao edge — o sistema melhora com o uso
Arquitetura e decisões técnicas
- Edge + cloud híbrido: inferência YOLO no posto (largura de banda e latência mínimas — sobe evento, não vídeo), consolidação e IA generativa na nuvem
- Multi-cloud pragmático: AWS para armazenamento/eventos (S3/Lambda/DynamoDB), GCP para aplicação (deploy em 2 VMs com papéis separados — app e stateful/observabilidade)
- Stream-worker dedicado para captura RTSP desacoplada do backend
- Observabilidade de verdade (implementada por mim): Prometheus + Grafana em VM stateful própria — monitoramento de custo, uso e infraestrutura — com snapshots e plano de deploy versionado
- Otimização do pipeline agêntico documentada e executada (
PLANO_OTIMIZACAO_PIPELINE_AGENTICO.md) — custo e latência de LLM controlados - Cache global planejado/implementado para reduzir reprocessamento (
plano-cache-global.md) - Migração single-shot documentada, seeds de RAG versionadas, scripts de sync local→GCP/EC2
Desafios e soluções
- Falsos positivos corroendo confiança: botão de false-positive no dashboard alimenta diretamente o dataset de re-treino — feedback do usuário virou ativo de ML
- Infra 24/7 com custo controlado: separação app/stateful em VMs distintas, retenção definida (fotos 1 ano) e edge fazendo o trabalho pesado de inferência
- Operação real (posto de gasolina): setup reproduzível por scripts PowerShell/bash para instalar estações novas (
push-stations.ps1)
Resultados e impacto
- Detecção contínua 24/7 em produção substituindo fiscalização presencial esporádica [nº de postos/câmeras A CONFIRMAR]
- Ciclo de melhoria contínua do modelo com dados reais da operação
- Gerência com dashboard consolidado de ocorrências, tratativas e falsos positivos