---
title: "Adeus, GPUs? A Computação Quântica já Bate na Porta da Otimização em IA"
author: "Ricardo Pupo Larguesa"
date: "2026-02-21 08:56:00-03"
category: "Papers & Pesquisa"
url: "http://aintuicao.scale.press/portal/aintuicao/post/2026/02/21/adeus-gpus-a-computacao-quantica-ja-bate-na-porta-da-otimizacao-em-ia/md"
---

Eu sempre comento com meus alunos e clientes que a GPU não foi feita para IA. A IA que se adaptou a ela. É um hardware de propósito geral que, por acaso, era muito bom em fazer contas com matrizes, a base das redes neurais. O primeiro passo para um hardware realmente especializado veio com os TPUs do Google, e vimos o resultado: o Ironwood deu uma vantagem competitiva significativa para o Gemini no mercado dos LLMs. Mas isso é apenas o começo.

Três papers que li recentemente no arXiv reforçam minha convicção de que estamos prestes a ver uma nova fragmentação no hardware de IA, especialmente para tarefas de otimização. Não estou falando de treinamento de LLMs, mas de uma classe de problemas combinatórios que são o pesadelo de qualquer arquitetura clássica.

## O gargalo não é o processamento, é a natureza do problema

Muitos desafios em machine learning, como a verificação de robustez de um modelo ou a seleção de características, são, no fundo, problemas de otimização combinatória NP-difíceis. Jogar mais força bruta de GPU nem sempre resolve. É como tentar abrir uma fechadura com um martelo; pode até funcionar, mas uma chave é mais eficiente.

É aqui que entram as máquinas de Ising e a computação inspirada em quântica. Um estudo ([2602.15985v1](https://arxiv.org/abs/2602.15985)) apresentou um sistema híbrido de FPGA com um chip de Ising que resolve problemas de otimização em escala com uma eficiência energética e velocidade ordens de magnitude superior a uma CPU moderna. Eles atacaram o problema da escalabilidade, que sempre foi o calcanhar de Aquiles dessas máquinas, mostrando que é possível quebrar um problema gigante em pedaços menores e resolvê-los de forma iterativa sem o gargalo da comunicação via PCIe.

Isso, por si só, já é um avanço. Mas onde isso se aplica na prática?

## Da teoria à prática: verificação e otimização no mundo real

Outro paper ([2602.13536v1](https://arxiv.org/abs/2602.13536)) deu um exemplo concreto: verificação de robustez de Redes Neurais Binárias (BNNs). Garantir que um modelo não vai classificar um sinal de "Pare" como "Siga" por causa de alguns pixels alterados é computacionalmente caro. Os pesquisadores formularam esse problema como uma instância QUBO (Quadratic Unconstrained Binary Optimization), o formato nativo para recozedores quânticos e máquinas de Ising.

Eles rodaram a tarefa em plataformas como o D-Wave e o Digital Annealer da Fujitsu. O resultado? O recozedor digital foi 168 vezes mais rápido que um otimizador padrão de mercado rodando num servidor parrudo. Isso tira a verificação de robustez do campo teórico e a torna uma ferramenta viável para IA de borda, onde BNNs são comuns.

Um terceiro trabalho ([2602.15049v1](https://www.arxiv.org/abs/2602.15049)) usou uma abordagem semelhante para um problema fora do ML, mas que ilustra o poder da técnica: selecionar o subconjunto ideal de pontos de acesso WiFi para localização interna em um prédio de cinco andares com mais de 500 APs. A abordagem quântica reduziu o número de APs necessários em 96%, foi 61 vezes mais rápida e ainda diminuiu o erro de localização em 10% comparado ao método clássico. É a eficiência em sua forma mais pura.

## O futuro é híbrido

Ninguém está dizendo que você vai aposentar sua RTX 4090 amanhã. O treinamento de modelos de base ainda será o domínio das GPUs por um bom tempo. O que esses estudos indicam é a ascensão da computação heterogênea.

O futuro stack de IA não terá um único tipo de processador. Teremos GPUs para o treinamento pesado, e co-processadores especializados — quânticos, de Ising, analógicos — para tarefas específicas de otimização, inferência e verificação. É um cenário onde a carga de trabalho certa vai para o hardware certo.

Isso tem implicações diretas em negócios que dependem de otimização em larga escala. Em uma plataforma como a [HRelper](http://hrelper.com), por exemplo, nossa solução de processos seletivos assistido por IA, fazer o match ideal entre milhares de candidatos e vagas é um problema combinatório gigantesco. Hoje, usamos heurísticas e buscas vetorial semântica. Amanhã, o que já traz resultados incríveis, poderemos usar um co-processador de recozimento para encontrar a solução ótima em segundos.

A era da força bruta está chegando ao fim. A próxima vantagem competitiva em IA não virá de ter mais GPUs, mas de ter a combinação de hardware mais inteligente. A questão não é se seu stack vai incluir um desses novos processadores, mas quando.

Vamos continuar essa conversa. Me encontre nas minhas redes sociais para trocarmos mais ideias sobre o futuro do hardware para IA e outros tópicos. Será um prazer conectar com você por lá: [https://linktr.ee/ricardo.pupo](https://linktr.ee/ricardo.pupo).