---
title: "O Bug de Schrödinger: LLMs Conseguem Curar a Incerteza do Software Quântico?"
author: "Ricardo Pupo Larguesa"
date: "2026-03-16 10:00:00-03"
category: "Papers & Pesquisa"
url: "http://aintuicao.scale.press/portal/aintuicao/post/2026/03/16/o-bug-de-schrodinger-llms-conseguem-curar-a-incerteza-do-software-quantico/md"
---

# O Bug de Schrödinger: LLMs e a Incerteza do Software Quântico

Este paper no arXiv sobre testes flaky em software quântico nos faz pensar no quanto ainda estamos tateando no escuro quando o determinismo sai da jogada. Para quem desenvolve no mundo clássico, um teste intermitente é um incômodo técnico causado por concorrência ou rede; no mundo quântico, a aleatoriedade é o alicerce do sistema. [Este estudo](https://arxiv.org/html/2603.09029v1) recente de Sivaloganathan e sua equipe aborda exatamente como automatizar a detecção dessa instabilidade usando modelos de linguagem, e os resultados trazem algumas surpresas amargas para quem aposta tudo em um único player.

## O Fantasma na Máquina Probabilística

O grande desafio aqui é que um bit quântico não se comporta como o booleano que aprendemos no curso técnico ou na faculdade. O ruído de hardware e a decoerência transformam a execução em algo intrinsecamente ruidoso. Segundo o artigo Automação da Detecção e Análise de Causa Raiz de Testes Flaky em Software Quântico, a causa-raiz mais comum é a aleatoriedade pura, resolvida em boa parte dos casos com o simples ato de fixar sementes de PRNG (Geração de Números PseudoAleatórios). Mas não se engane, o problema real mora na variabilidade induzida pelo hardware, onde distinguir uma regressão de código de uma flutuação de porta quântica custa caro e exige uma expertise que poucos times possuem.

O que me chamou a atenção foi a performance dos modelos relatada no estudo. O Gemini 1.5 Flash superou o GPT-4 em tarefas de detecção de intermitência, atingindo um F1-score impressionante de 0,94. É curioso notar que, embora o estudo utilize versões que já considero defasadas no ritmo alucinado de hoje, com o GPT e o Gemini já em iterações muito mais maduras, o raciocínio técnico exigido para entender o dialeto de frameworks como Qiskit e NetKet parece favorecer a arquitetura da Google neste contexto. Eu tenho minhas dúvidas se essa vantagem se sustenta em benchmarks de última geração, mas o fato é que a IA está deixando de ser apenas um assistente de escrita para se tornar o auditor de sistemas que humanos mal conseguem debugar.

Na minha experiência na [T2S](http://t2s.com.br), vejo que a gestão de dívida técnica em sistemas complexos é o que separa um projeto de sucesso de um desastre financeiro. Aplicar LLMs para filtrar o que é ruído e o que é falha de lógica economiza tempo de engenharia, que no caso quântico, custa quase cem dólares por minuto em hardware real. Se você está construindo algo nessa linha, entender a fundo a estrutura dessas chamadas é vital. Para quem quer dominar essa camada de interação com os modelos e evitar desperdício de tokens, meu livro [Engenharia de Prompt para Devs](https://www.casadocodigo.com.br/products/livro-engenharia-de-prompt) detalha como estruturar contextos para obter precisão técnica onde a margem de erro é quase zero.

No fim do dia, o bug de Schrödinger continua lá: o teste está passando e falhando ao mesmo tempo até que a IA ou um engenheiro muito paciente decida observar o log de forma correta. O melhor é aceitar as mudanças e se adaptar o mais rápido possível. Vamos ajustar os pesos juntos? Conecte-se comigo para discutirmos mais sobre o futuro dessa engenharia: [https://linktr.ee/ricardo.pupo](https://linktr.ee/ricardo.pupo).