---
title: "O Veto Simbólico na UTI: Como Garantir que Modelos de Caixa Preta Tomem Decisões Críticas com Segurança"
author: "Ricardo Pupo Larguesa"
date: "2026-03-12 11:00:00-03"
category: "Papers & Pesquisa"
url: "http://aintuicao.scale.press/portal/aintuicao/post/2026/03/12/o-veto-simbolico-na-uti-como-garantir-que-modelos-de-caixa-preta-tomem-decisoes-criticas-com-seguranca/md"
---

Garantir que um agente de IA não execute uma ação destrutiva por mera alucinação é um problema assustador e, infelizmente, cada vez mais comum. Quando falamos de suporte à decisão clínica em cenários de vida ou morte, a convicção linguística de um LLM não vale absolutamente nada se não houver um lastro de segurança rígido. Dois papers recentes do arXiv trazem luz a essa discussão: o CORE-Acu e o TA-RNN-Medical-Hybrid.

## A falácia da probabilidade pura

O grande erro de muitos engenheiros é tratar modelos de linguagem como se fossem oráculos lógicos. O CORE-Acu ([Xu et al., 2026](https://arxiv.org/html/2603.08321v1)) expõe essa fragilidade ao lidar com a acupuntura, uma intervenção física invasiva. O modelo nota que LLMs padrão são otimizados para prever o próximo token, o que é ótimo para chat, mas péssimo para seguir linhas vermelhas clínicas. Se o modelo sugere o ponto IG4 para uma gestante por uma falha probabilística, as consequências são desastrosas.

A solução proposta pelos autores é o que chamam de CORE-Acu, uma estrutura neuro-simbólica. O diferencial aqui não é apenas o fine-tuning, mas um mecanismo de veto simbólico baseado em grafos de conhecimento (KG). Eu tenho minhas dúvidas se deveríamos permitir que qualquer IA sugira intervenções sem esse tipo de filtro determinístico por trás. O sistema funciona em um loop de gerar, verificar e revisar, onde o KG atua como um supervisor que intercepta violações em tempo real.

## Tempo e contexto na UTI

No outro extremo do cuidado crítico, o TA-RNN-Medical-Hybrid ([Jafari et al., 2026](https://arxiv.org/html/2603.08278v1)) foca na previsão de mortalidade em UTIs. O desafio aqui é a irregularidade temporal dos dados. Eles integraram embeddings baseados no SNOMED CT e um mecanismo de atenção de nível duplo. O objetivo é o mesmo: tirar o modelo da caixa preta e forçar uma interpretabilidade que faça sentido para o médico na ponta.

Eu já abordava a importância de estruturar entradas e saídas no meu livro [Engenharia de Prompt para Devs](https://www.casadocodigo.com.br/products/livro-engenharia-de-prompt), mas esses papers elevam o jogo ao nível da arquitetura do sistema. Não se trata apenas de um prompt bem escrito, mas de injetar priors de domínio diretamente na função de perda, como o mecanismo LMERL proposto no CORE-Acu, que dá mais peso para entidades clínicas raras e críticas do que para a sintaxe geral do português ou chinês.

## Implementando a segurança na prática

Para quem está construindo sistemas hoje, você precisa prever barreiras. Na [T2S](http://t2s.com.br), quando montamos squads de IA e Machine Learning, batemos muito na tecla da validação programática. Antes da saída do agente chegar ao usuário ou ao sistema operacional, ela deve passar por filtros de Regex, YARA ou modelos de classificação específicos como o Llama Guard ou o Microsoft Presidio.

O CORE-Acu conseguiu reduzir as violações de segurança para zero em seus testes, enquanto o GPT-4o, operando sem essas amarras, teve uma taxa de erro de 8,5%. Para um chatbot de marketing, 8% é aceitável; para uma UTI ou uma agulha de acupuntura, é um desastre. O futuro do ML aplicado não está em modelos maiores, mas em sistemas que saibam quando se calar e pedir intervenção humana. Vamos ajustar os pesos juntos.

Conecte-se comigo para discutir mais sobre engenharia de ML e IA: [https://linktr.ee/ricardo.pupo](https://linktr.ee/ricardo.pupo).