---
title: "O Limiar do Sapo: Por Que Agentes de IA Precisam Parar de Apenas Imitar e Começar a Criticar"
author: "Ricardo Pupo Larguesa"
date: "2026-03-12 12:00:00-03"
category: "Opinião"
url: "http://aintuicao.scale.press/portal/aintuicao/post/2026/03/12/o-limiar-do-sapo-por-que-agentes-de-ia-precisam-parar-de-apenas-imitar-e-comecar-a-criticar/md"
---

# O Limiar do Sapo: Por Que Agentes de IA Precisam Parar de Apenas Imitar e Começar a Criticar

O paper 'The Boiling Frog Threshold', vindo da Universidade Nacional de Singapura, tocou em uma ferida que muitos de nós, que estamos no chão de fábrica do Machine Learning, preferimos ignorar. A pesquisa mostra que modelos de mundo são bizarramente cegos a desvios graduais de dados. Se uma câmera embaça aos poucos ou um sensor perde a calibração de forma incremental, o agente simplesmente aceita a corrupção como o novo normal até que o sistema colapse totalmente. É o tal efeito do sapo fervido, mas em escala de parâmetros neurais, e o pior: o colapso físico do agente muitas vezes acontece antes mesmo de qualquer detector interno disparar o alerta. Você pode conferir os detalhes desse estudo assustador no [artigo original](https://arxiv.org/html/2603.08455v1).

## A armadilha do mimetismo e o surgimento da crítica

Boa parte do que chamamos de agentes hoje nada mais é do que um excelente imitador de trajetórias de especialistas. O problema é que o aprendizado por imitação ensina o modelo a repetir o acerto, mas nunca o prepara para o diagnóstico do erro. Quando o cenário sai do script, o agente entra em loop porque nunca aprendeu o porquê de uma ação ser melhor que a outra. Eu vejo isso acontecer direto em projetos na [T2S](http://t2s.com.br): o desenvolvedor injeta um monte de logs e exemplos, mas o modelo não tem 'crítica' interna para entender a subotimalidade. O paper [ACT (Agentic Critical Training)](https://arxiv.org/html/2603.08706v1) tenta resolver isso trocando a imitação cega por um treinamento via RL onde o modelo deve identificar qual ação é melhor entre candidatos. Isso força o surgimento de uma autorreflexão genuína, e não apenas a repetição de um texto de reflexão pré-gerado. É a diferença entre o aluno que decora a resolução e o que entende a lógica da prova.

## Evoluir em vez de apenas resolver

Outro avanço que merece atenção é o [RetroAgent](https://arxiv.org/html/2603.08561v1). Ele propõe um feedback intrínseco dual. O agente não olha apenas para o sucesso final da tarefa, mas monitora o progresso da sua capacidade de completar subtarefas e destila lições reutilizáveis em um buffer de memória. Isso é fundamental para evitar que a IA se torne um papagaio estocástico que repete erros do passado. No meu livro [Engenharia de Prompt para Devs](https://www.casadocodigo.com.br/products/livro-engenharia-de-prompt), eu bato muito na tecla de que o prompt precisa dar contexto de contorno para a falha, e o RetroAgent tenta automatizar essa experiência acumulada via sistema. A gente ainda tenta consertar esses buracos com frameworks como o [HECG (Hierarchical Error-Corrective Graph)](https://arxiv.org/html/2603.08388v1), que organiza as ações em grafos de correção de erro multinível. É uma abordagem de engenharia clássica aplicada a modelos de linguagem, o que eu pessoalmente adoro, mas ainda é uma camada externa tentando domar a incerteza intrínseca do LLM.

## A realidade por trás dos pesos

O futuro dos agentes não está em modelos maiores, mas em arquiteturas que saibam quando estão errando antes que o robô caia no chão. A luta entre o que o modelo acha que é verdade e o que o ambiente real impõe continuará sendo o maior gargalo para automações de alto nível. Eu tenho minhas dúvidas se a gente vai conseguir eliminar totalmente a cegueira sinusoidal descrita na pesquisa do sapo fervente, mas o caminho certamente passa por agentes que desenvolvam autonomia crítica. O melhor é aceitar que a imitação chegou ao seu limite. Vamos ajustar os pesos juntos. Para acompanhar como aplico esse pensamento analítico nos meus projetos e startups, [conecte-se comigo aqui](https://linktr.ee/ricardo.pupo).