online
Status dos Serviços
KR

Sprint Atual

Sprint 14 – Plataforma & Infra
17 fev → 28 fev · 4 dias restantes
62%

Minhas Tasks

5
atribuídas

Em Progresso

2
trabalhando

Concluídas

8
na sprint

Disponíveis

6
sem dono
Minhas Tarefas
5
CP-4923
Implementar collector OpenTelemetry no API Gateway
Em progresso Sistemas Internos ● Alta
CLOUD-3512
Configurar dashboards Grafana para métricas de latência
Em progresso Cloud ● Média
PN-5301
Adicionar tracing no fluxo de criação de domínio
Code Review Canais ● Média
INT-435
Instrumentar chamadas ao serviço de billing
To Do Integrações ● Baixa
CP-4930
Deploy do agent APM nos workers de email
Bloqueada Sistemas Internos ● Alta
Disponíveis na Sprint
6
CLOUD-3518
Configurar alertas de error rate no Prometheus
To Do Cloud ● Alta
Contexto & Abordagem
Criar alerting rules no Prometheus para monitorar http_server_errors_total por serviço. Definir thresholds de error rate > 5% em janela de 5min. Configurar notificação via Alertmanager → Slack.
Serviços relacionados
Delicatta
Admin API
PN-5310
Adicionar health check endpoint nos microsserviços de painel
To Do Canais ● Alta
Contexto & Abordagem
Adicionar rota /health nos serviços ACL, Log Search e Notification. Retornar status de DB, Redis e dependências externas. Seguir padrão já implementado no Billing Service.
Serviços relacionados
Admin API
Brechó Solidário
SMEDIA-1560
Implementar span customizado para processamento de mídia
To Do GRS ● Média
Contexto & Abordagem
Instrumentar o pipeline de upload/resize de imagens com spans do OpenTelemetry. Medir tempo de cada etapa: upload S3, resize via Imagick, geração de thumbnail. Já existe o SDK configurado, só adicionar os spans manuais.
Serviços relacionados
Brechó Solidário
INT-440
Criar exporter de métricas para serviço de DNS
To Do Integrações ● Média
Contexto & Abordagem
Criar um Prometheus exporter custom que exponha métricas do serviço de DNS: queries/sec, latência de resolução, cache hit rate. Usar lib promphp/prometheus_client_php e expor em /metrics.
Serviços relacionados
Delicatta
Admin API
CP-4945
Documentar runbook de troubleshooting do APM
To Do Sistemas Internos ● Baixa
Contexto & Abordagem
Escrever runbook no Confluence com fluxo de troubleshooting: como verificar se o collector está ativo, validar traces no Jaeger, e diagnosticar gaps de métricas. Incluir comandos kubectl e queries PromQL úteis.
Serviços relacionados
Admin API
Delicatta
Brechó Solidário
CLOUD-3520
Testar auto-scaling baseado em métricas do collector
To Do Cloud ● Baixa
Contexto & Abordagem
Validar o HPA (Horizontal Pod Autoscaler) usando métricas custom do collector via prometheus-adapter. Testar com carga simulada usando k6 e verificar se os pods escalam conforme o throughput de spans aumenta.
Serviços relacionados
Delicatta
Admin API