Este loop implementa uma mudança e depois entrega o diff a um revisor de outro modelo, que ataca o código de propósito.
O ciclo é: construir, revisar com um modelo diferente, corrigir cada achado bloqueante e revisar de novo, até que builder e revisor externo concordem ou o limite de rodadas seja atingido.
A ideia é simples: um agente não deve corrigir a própria prova.
Com dois modelos diferentes no jogo, nenhum carimba o próprio trabalho, e o código só entra quando os dois aprovam de fato.
Quando usar
- Em mudanças sensíveis de segurança, autenticação ou dados.
- Quando você quer mais rigor do que uma revisão única consegue dar.
- Para evitar que o agente aprove a si mesmo.
Como usar
Rode o loop pedindo para construir, revisar de forma adversarial com outro modelo, corrigir os achados e só liberar quando ambos os lados não tiverem objeções bloqueantes.