---
title: "Além das Tools: O Framework de Agent Skills e o Fim da Engenharia de Prompt como a Conhecemos"
author: "Ricardo Pupo Larguesa"
date: "2026-02-28 11:00:00-03"
category: "Papers & Pesquisa"
url: "http://aintuicao.scale.press/portal/aintuicao/post/2026/02/28/alem-das-tools-o-framework-de-agent-skills-e-o-fim-da-engenharia-de-prompt-como-a-conhecemos/md"
---

O [paper](https://arxiv.org/html/2602.20867v1) **SoK: Agentic Skills — Beyond Tool Use in LLM Agents**, recém-chegado ao arXiv, é o tipo de leitura que separa quem está brincando de chatbot de quem está construindo sistemas sérios. Escrevi hoje sobre ele em [outro artigo](https://aintuicao.scale.press/post/2026/02/28/a-guerra-dos-sistemas-operacionais-para-agentes-comecou-e-voce-ainda-esta-discutindo-modelos), contextualizando-o com AgentOS, mas acho que merecia um exclusivo. O trabalho é assinado por pesquisadores que decidiram colocar ordem na casa, formalizando o que chamamos de habilidades de agentes. Para quem, como eu, vive o dia a dia da [T2S](http://t2s.com.br) montando agentes de IA, essa sistematização tem sido incrível.

## A morte da chamada de função atômica

Até agora, a indústria se contentou com o *tool use* básico: o modelo decide chamar uma API, recebe um JSON e segue a vida. É algo atômico, sem estado e, honestamente, limitado. O que esse paper propõe é elevar o nível para o que chamam de tupla. Isso significa que uma skill não é só um endpoint, mas um módulo que carrega sua própria condição de aplicabilidade, sua política de execução (o prompt ou código em si), seu critério de parada e sua interface de retorno.

Eu venho avisando há algum tempo: a engenharia de prompt está se adatando para dar lugar à engenharia de contexto e de habilidades. Muita gente se empolgou com o MCP (Model Context Protocol) da Anthropic, achando que padronizar chamadas de função era a salvação. Eu acho que é um protocolo inútil. Por que diabos vamos tentar engessar a comunicação em estruturas rígidas se as LLMs são nativas em linguagem natural? O caminho real é o [PBTP (Prompt Base Tool Protocol)](https://www.linkedin.com/pulse/nem-mcp-function-call-pbtp-ricardo-pupo-larguesa-y03ye/), e as skills descritas no paper são a melhor forma de aplicar isso na prática.

## Mais umorquestrador, o de habilidades

Se as skills são os programas, precisamos de um lugar para rodá-los. E como o volume de habilidades tende ao infinito, não dá simplemsente para incorporar todos no contexto de cada chamada à API. Comentei neste blog sobre o **AgentOS**, que redefine o LLM como um Kernel de Raciocínio. Mas há outras alternativas para identifcar qual habilidade deve ser usada numa chamada. RAG tem funcionado muito bem para mim, mas certamente surgirão outras formas de orquestrar as habilidades.

Estamos testemunhando o nascimento de uma nova camada de software. No futuro próximo, não vamos mais importar bibliotecas de funções puras no Python; vamos plugar marketplaces de skills que o agente aprende a usar, refina e até descarta se o desempenho cair. Um outro [paper](https://arxiv.org/abs/2602.12670), que apresenta uma comparação do desempenho das habilidades dos agentes em diversas tarefas, traz um dado que adorei: habilidades curadas aumentam a taxa de sucesso em 16 pontos percentuais, enquanto habilidades geradas automaticamente pelo próprio agente muitas vezes pioram o resultado. Ou seja, a curadoria humana ainda é o que separa o sinal do ruído.

## A nova cadeia de suprimentos de software

Isso muda completamente o papel do desenvolvedor. Se você hoje gasta horas ajustando parâmetros de temperatura, ledo engano achar que isso terá valor em dois anos. O desafio agora é arquitetar esses módulos procedurais reutilizáveis. Precisamos de governança, pois o caso ClawHavoc mostrou que injetar skills maliciosas em marketplaces de agentes é a nova fronteira do malware, exfiltrando chaves de API com a mesma facilidade que um cavalo de troia dos anos 90 roubava senhas.

Para quem quer se aprofundar nessa transição técnica de como estruturar esses novos fluxos, eu detalho muito dessa mecânica no meu livro [Engenharia de Prompt para Devs](https://www.casadocodigo.com.br/products/livro-engenharia-de-prompt). O segredo não é o comando que você dá, mas a habilidade que você encapsula para que o sistema seja autônomo e confiável. O melhor é aceitar que as tools foram apenas o começo e que a verdadeira engenharia começa agora com a gestão dessas capacidades procedurais. Vamos ajustar os pesos juntos.

Conecte-se comigo em: [https://linktr.ee/ricardo.pupo](https://linktr.ee/ricardo.pupo)