---
title: "O Gargalo da Incerteza: Por que Agentes de Pesquisa Profunda Falham na Reprodutibilidade?"
author: "Ricardo Pupo Larguesa"
date: "2026-03-04 09:30:00-03"
category: "Papers & Pesquisa"
url: "http://aintuicao.scale.press/portal/aintuicao/post/2026/03/04/o-gargalo-da-incerteza-por-que-agentes-de-pesquisa-profunda-falham-na-reprodutibilidade/md"
---

Se você já rodou o mesmo prompt de pesquisa complexa três vezes e obteve três relatórios com conclusões divergentes, você sentiu na pele o que o paper **Avaliando a Estocasticidade em Agentes de Pesquisa Profunda** acaba de quantificar de forma científica. O estudo, conduzido por pesquisadores como Haotian Zhai e Elias Stengel-Eskin, ataca um dos maiores elefantes na sala do desenvolvimento de sistemas agênticos: a falta de determinismo. Quando usamos IAs para síntese de evidências em áreas críticas como medicina ou finanças, a inconsistência não é um detalhe estético, é uma falha de segurança.

## A Anatomia do Caos Agêntico

Os autores modelam a execução de um Agente de Pesquisa Profunda (DRA) como um Processo de Decisão de Markov (MDP) de aquisição de informações. Eles dividem o problema em três frentes: aquisição, compressão e inferência. O achado mais incômodo é que a estocasticidade de estágio inicial domina a variância final. Se o agente erra o tom na primeira query de busca, o erro cascateia por todo o processo. É o efeito borboleta aplicado aos tokens. Além disso, o módulo de inferência, onde o modelo decide o que os fatos significam, provou ser o maior responsável pela instabilidade geral. Eu sempre bati na tecla de que a IA não pode ser deixada solta quando o objetivo é precisão, e este artigo dá números a essa intuição.

## Controle Intencional vs. Criatividade Estocástica

O senso comum diz que reduzir a aleatoriedade empobrece o agente. O estudo prova o contrário. Estratégias como o uso de temperaturas baixas e, principalmente, a imposição de estruturas rígidas em JSON e Markdown reduzem a variância sem degradar a qualidade. Na verdade, ao combinar essas técnicas com ensembles de queries (buscar a interseção de múltiplas consultas), os pesquisadores reduziram a estocasticidade em 22% e ainda ganharam precisão. Isso reforça o que tenho implementado nos meus apps de pesquisa profunda que uso no [Relpz](http://relpz.com): a inteligência do agente não está no caos da geração livre, mas no controle intencional da aleatoriedade. Eu costumo usar temperaturas médias para gerar os prompts de pesquisa e baixas para a coleta e estruturação de dados recuperados, deixando o fôlego criativo apenas para o aprimoramento final do texto.

## O Futuro é Estruturado

Para quem constrói tecnologia, fica a lição. O futuro dos agentes confiáveis não passa por esperar que os modelos fiquem magicamente mais coerentes, mas por uma engenharia de software mais disciplinada. Precisamos de squads que entendam de [Engenharia de Prompt](https://www.casadocodigo.com.br/products/livro-engenharia-de-prompt) e arquitetura de sistemas para criar cercas de contenção em torno dos LLMs. Na [T2S](http://t2s.com.br), por exemplo, vemos que a integração de buscas em múltiplos idiomas e a validação cruzada de fontes são passos que o artigo não explorou a fundo, mas que elevam ainda mais o patamar de confiabilidade. O melhor é aceitar que a IA é inerentemente ruidosa e construir sistemas que saibam filtrar esse ruído.

Acesse o paper completo no arXiv: [Avaliando a Estocasticidade em Agentes de Pesquisa Profunda](https://arxiv.org/html/2602.23271v1).

Para mais análises sem hype, conecte-se comigo: [https://linktr.ee/ricardo.pupo](https://linktr.ee/ricardo.pupo).