Anthropic lança Claude Opus 4.5 com melhorias no raciocínio complexo


Anthropic lança Claude Opus 4.5 com melhorias no raciocínio complexoAnthropic lança Claude Opus 4.5 com melhorias no raciocínio complexo

A Anthropic lançou a última versão de seu maior modelo Claude, Opus. Claude Opus 4.5 é melhor no tratamento de raciocínio complexo do que os modelos Claude anteriores e faz melhorias no uso de ferramentas de agente, uso de computador, resolução de novos problemas e muito mais.

A empresa afirma que os primeiros testadores do novo modelo afirmam que ele lida melhor com a ambiguidade e raciocina sobre as compensações sem a necessidade de intervenção humana. “Eles nos disseram que, quando apontado para um bug complexo de vários sistemas, o Opus 4.5 descobre a solução. Eles disseram que tarefas que eram quase impossíveis para o Sonnet 4.5 há apenas algumas semanas estão agora ao nosso alcance. No geral, nossos testadores nos disseram que o Opus 4.5 simplesmente ‘entende'”, escreveu a Anthropic em um publicar.

Este lançamento também coincide com um novo parâmetro de esforço introduzido na API Claude, permitindo que os desenvolvedores decidam quanto esforço Claude deve gastar em um problema. De acordo com a Anthropic, o Opus 4.5 usa significativamente menos tokens do que seus antecessores para resolver problemas, mesmo em seu nível de esforço mais alto. Por exemplo, em um nível de esforço médio, o Opus 4.5 corresponde à pontuação do Sonnet 4.5 no SWE-bench Verified, usando 76% menos tokens de saída, enquanto no nível de esforço mais alto ele usa 48% menos tokens, excedendo o desempenho do Sonnet 4.5 em 4,3%.

Em termos de segurançaA Anthropic afirma que o Opus 4.5 Pondering é menos suscetível a ataques de injeção imediata do que modelos como Sonnet 4.5 Pondering, GPT-5.1 Pondering ou Gemini 3 Professional Pondering.

A Anthropic também anunciou atualizações no Claude Code que coincidem com o lançamento do novo modelo. Primeiro, o Modo Plano pode criar planos mais precisos e executá-los de forma mais completa, com Claude fazendo perguntas esclarecedoras antecipadamente e incorporando-as no plano antes de executá-lo. Em segundo lugar, o Claude Code agora está disponível no aplicativo de desktop da Anthropic, que permite que múltiplas sessões locais e remotas sejam executadas lado a lado.

Além disso, o aplicativo Claude agora resumirá automaticamente as partes anteriores de uma longa conversa, e o Claude for Excel beta está se expandindo para usuários Max, Staff e Enterprise.

Opus 4.5 já está disponível em todos os aplicativos e API da Anthropic e custa US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída.

“O Opus 4.5 é um avanço naquilo que os sistemas de IA podem fazer e uma prévia de mudanças maiores na forma como o trabalho é realizado”, escreveu a empresa.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *