---
title: "Do Prompt Único à Memória Evolutiva: O Fim da Amnésia nos Agentes de IA"
author: "Ricardo Pupo Larguesa"
date: "2026-03-13 09:00:00-03"
category: "Papers & Pesquisa"
url: "http://aintuicao.scale.press/portal/aintuicao/post/2026/03/13/do-prompt-unico-a-memoria-evolutiva-o-fim-da-amnesia-nos-agentes-de-ia/md"
---

A ideia de que o desenvolvimento de IA se resume a escrever o prompt perfeito está morrendo. Eu já avisava isso no meu livro, mas o que vimos nos últimos dias no arXiv confirma: estamos saindo da era do 'prompt-first' para o que os pesquisadores agora chamam de 'nurture-first'.

O paper [Development of Agents with Nurture-First Approach](https://arxiv.org/html/2603.10808v1) formaliza o que aplicamos nos squads de IA da [T2S](http://t2s.com.br). A expertise de domínio é tácita e evolutiva; não dá para codificar tudo num system prompt estático. O agente precisa de um ciclo de cristalização do conhecimento, onde o diálogo operacional vira memória estruturada.

Mas não é só sobre salvar logs. O grande salto vem de como interpretamos o raciocínio. O trabalho sobre o framework [TRACED](https://arxiv.org/html/2603.10384v1) é fascinante porque foge da armadilha das probabilidades escalares. Eles propõem olhar para a cinemática geométrica do pensamento.

Raciocínio correto manifesta trajetórias estáveis e de alto progresso, enquanto alucinações exibem 'loops de hesitação' com alta curvatura geométrica nos estados ocultos. É uma lente física para decodificar a dinâmica interna do modelo. Se a curvatura aumenta e o deslocamento estagna, o modelo está patinando na lógica. Isso é muito valioso para quem constrói sistemas de monitoramento de confiança em tempo real.

Outro ponto que me chamou a atenção foi o [HyMEM](https://arxiv.org/html/2603.10291v1) (sigla que soa muito mal em português... rs), uma memória estruturada híbrida que imita o cérebro humano. Ela acopla nós simbólicos discretos para estratégia com embeddings contínuos para detalhes multimodais. Para agentes de GUI, isso resolve o problema da amnésia em fluxos de trabalho longos.

Sobre o alinhamento moral, o estudo sobre [RLVR](https://arxiv.org/html/2603.10588v1) traz uma descoberta contraintuitiva: o alinhamento não exige diversidade de respostas. Na verdade, as regiões de alta recompensa no raciocínio moral são mais concentradas do que na matemática. Eu tenho minhas dúvidas se isso não é apenas o RLHF injetando preconceitos do treinador, tornando a IA mais 'teimosa' do que ética. O viés no RLHF é inevitável e precisaremos de novas formas de treinamento para superar isso.

Para quem desenvolve, pare de focar apenas no input e comece a arquitetar fluxos agênticos com gerenciamento dinâmico de memória e RAG. É o que trato em detalhes no meu livro [Engenharia de Prompt para Devs](https://www.casadocodigo.com.br/products/livro-engenharia-de-prompt). A IA agora é um processo, não um snapshot.

A pergunta que fica para sua próxima implementação na T2S ou na sua startup é: você está construindo um oráculo que esquece tudo em 5 minutos ou um sistema que aprende com cada erro de execução? Acho que vou torrar uns tokens aqui para testar essa métrica de curvatura no meu próximo projeto... rs.

Conecte-se comigo para discutirmos mais sobre engenharia de ML e estratégia: [https://linktr.ee/ricardo.pupo](https://linktr.ee/ricardo.pupo).