🎭 Exercício 1 — Simulação de incidente em equipe

Formato: Grupos de 5 a 6 | ~30 minutos | Sem internet


🚨 Situação: são 15h de uma quarta-feira. O sistema da Chapecoense caiu. O jogo é às 20h e a bilheteria física precisa do sistema para validar ingressos na entrada. Faltam 5 horas.

Distribuição de papéis:

Papel Responsabilidade durante o exercício
👔 Gestor Coordena a equipe, comunica o clube, toma decisões de prioridade
🧑‍💻 Técnico N1 Primeiro contato com o problema, coleta informações iniciais
👨‍💻 Técnico N2 Analisa logs, tenta identificar a causa
🔬 Especialista N3 É acionado se N2 não resolver — tem acesso ao servidor de produção
👤 Usuário-chave Representa o clube — cobra atualizações, valida quando o sistema voltar
📝 Documentador Registra tudo em tempo real: o que foi feito, quando, por quem

Roteiro do incidente (o professor controla o tempo):

T+0: Sistema fora do ar. N1 recebe o chamado. T+5: N1 tenta reiniciar o serviço web — não resolve. T+10: N2 analisa os logs. Encontra erros de conexão com o banco de dados. T+15: N2 tenta corrigir a string de conexão — não era isso. T+20: N3 é acionado. Descobre que o servidor de banco de dados está sem espaço em disco — logs cresceram demais. T+25: N3 limpa os logs antigos e reinicia o banco. Sistema volta. T+30: Usuário-chave confirma que está funcionando. Documentador lê o registro em voz alta.

Ao final, discutam:


🗣️ Exercício 2 — Passagem de plantão

Formato: Duplas | ~15 minutos | Sem internet


Situação: você está encerrando seu turno às 18h. Tem três chamados em andamento e seu colega que chega agora nunca viu esses casos. Você tem 5 minutos para passá-los.

Os chamados em andamento:

Chamado #47 — Cláudia (Financeiro) não consegue fechar o caixa de maio. Já identifiquei que é um erro de timeout na query de consolidação — provavelmente índice faltando. Ainda não apliquei a correção. Ela precisa fechar até amanhã às 9h.

Chamado #51 — Servidor com 87% de uso de disco. Monitorei por 2 horas e está crescendo 1% por hora. Se não limpar os logs até às 22h, pode lotar. Já identifiquei quais logs podem ser arquivados.

Chamado #53 — Pedido de nova funcionalidade (filtro de sócios por bairro). Já confirmei com o gestor que é para a próxima sprint. Nenhuma urgência.

O que fazer:

  1. Escreva a passagem de plantão completa para o seu colega — como se fosse uma mensagem real no sistema de chamados ou num canal de comunicação da equipe
  2. Troque com seu par e avalie: com essas informações, você conseguiria assumir os três chamados sem precisar ligar para quem passou?
  3. O que estava faltando ou poderia ser mais claro?