

Claude Opus 4 e Claude Sonnet 4 são capazes de realizar tarefas de longa duração e podem trabalhar continuamente por várias horas. Claude Opus 4 se destaca na codificação e na solução complexa de problemas, enquanto o claude Sonnet 4 melhora o soneto 3.7 e equilibra o desempenho e a eficiência.
Além de liberar esses novos modelos, a empresa também revelou uma versão beta para pensar prolongado com o uso da ferramenta, a capacidade de usar ferramentas em paralelo e a disponibilidade geral de código Claude.
A API antrópica também adicionou quatro novos recursos: a ferramenta de execução de código, o conector MCP, a API de arquivos e a capacidade de armazenar em cache solicitações por até uma hora.
OpenAI adiciona novas ferramentas e recursos à API de respostas
Novo adições Inclua suporte remoto ao servidor MCP, suporte para o mais recente modelo de geração de imagens, a capacidade de usar a ferramenta de intérprete de código e a capacidade de usar a ferramenta de pesquisa de arquivos nos modelos de raciocínio do OpenAI.
A empresa também adicionou modo de fundo, o que permite ao modelo executar tarefas complexas de raciocínio de forma assíncrona; resumos de raciocínio; e a capacidade de reutilizar itens de raciocínio em diferentes solicitações de API.
Mistral lança LLM para agentes de codificação
DevStral é um modelo de código aberto leve projetado especificamente para tarefas de codificação agêntica. De acordo com a referência verificada do SWE-banch, o DevStral supera o GPT-4.1-mini e Claude 3.5 Haiku. Seu tamanho pequeno permite que ele seja executado em um único RTX 4090 ou um MAC com RAM de 32 GB, permitindo que ele seja utilizado para uso native e no dispositivo.
“Embora os LLMs típicos sejam excelentes em tarefas de codificação atômica, como escrever funções independentes ou conclusão de código, eles atualmente lutam para resolver problemas de engenharia de software program do mundo actual. O desenvolvimento do mundo actual requer contextualizar código em uma base de código de código, identificando problemas entre os componentes e a identificação de problemas sutis em funções que se destacam. Mistral escreveu em seu anúncio.
Atualizações de IA do Google I/S
Google E/S. estava cheio de atualizações sobre a IA, incluindo novos modelos, como o novo modelo de texto Gemini Diffusion e Gemma 3N, um modelo multimodal projetado para executar em telefones, laptops e tablets, capaz de lidar com áudio, texto, imagem e vídeo.
O Google também revelou duas novas variantes do modelo Gemma: Medgemma para aplicações de saúde e sinalização para traduzir a linguagem de sinais em texto de linguagem falada.
O Código de Gêmeos Assista para Indivíduos e Código Gêmeos para o Github agora também estão geralmente disponíveis e são alimentados por Gemini 2.5. Essa ferramenta foi introduzida pela primeira vez como uma visualização em fevereiro e o lançamento do GA de hoje inclui várias novas atualizações, incluindo histórico de bate -papo e threads, a capacidade de especificar regras para aplicar a todas as gerações de IA no bate -papo, comandos personalizados e a capacidade de revisar e aceitar sugestões de código em peças, através de arquivos ou todos juntos.
A empresa também anunciou uma versão reimaginada do Colab, uma nova ferramenta que gera componentes da interface do usuário a partir de wireframes ou avisos de texto chamados Sew e novos recursos nos estúdios do Firebase, como a capacidade de traduzir projetos de figma em aplicações.
Atualizações de IA da Microsoft Construct
Um novo agente de codificação foi adicionado Para o GitHub Copilot, que é ativado quando um desenvolvedor atribui um problema no GitHub ou o chama por meio de um immediate no vs código. Ele pode ajudar com várias tarefas, incluindo adicionar recursos, corrigir bugs, estender testes, refatorar o código e melhorar a documentação. Todas as solicitações de tração do agente exigem aprovação humana antes de correr, confirmou o Github.
A Microsoft também anunciou o Home windows AI Foundry, uma plataforma que suporta o ciclo de vida do desenvolvedor da IA durante o treinamento e a inferência. Os desenvolvedores poderão gerenciar e executar LLMs de código aberto através de fundos locais ou trazer modelos proprietários e converter, ajustá-los e implantá-los em clientes e nuvem.
O suporte ao Mannequin Context Protocol (MCP) também foi adicionado nas plataformas e serviços da Microsoft, incluindo Github, Copilot Studio, Dynamics 365, Azure AI Foundry, Semântico Kernel e Home windows 11.
A Microsoft também anunciou um novo projeto de código aberto chamado NLWeb para ajudar os desenvolvedores a criar interfaces de IA conversacionais para seus websites usando qualquer modelo ou fonte de dados que desejarem. Os pontos de extremidade da NLWeb também atuam como servidores MCP, para que os desenvolvedores possam facilmente tornar seu conteúdo descoberta para os agentes da IA, se quiserem.
Shopify libera novas ferramentas de desenvolvedor
Isso é lançamento Uma nova plataforma de desenvolvedor unificada que integra o painel dev e a CLI e oferece geração de código movida a IA. Agora, os desenvolvedores também podem criar “lojas de desenvolvimento”, onde podem visualizar aplicativos em ambientes de teste, um recurso que anteriormente estava disponível apenas para planos Plus e agora está disponível para todos os desenvolvedores.
Outros novos recursos anunciados hoje incluem definições declarativas de dados personalizados, um package de ferramentas unificado da Polaris UI e MCP da loja, que permite que os desenvolvedores construam agentes de IA que atuem como assistentes de compras para lojas.
Heymarvin lança o entrevistador moderado da AI
O Entrevistador moderado da IA Realiza entrevistas moderadas de usuários com potencialmente milhares de participantes sem um facilitador humano. Também pode analisar as respostas da entrevista aos insights e tendências da superfície.
“O que o torna tão poderoso é que ele permite conversas de fluxo livre, qualitativo e envolvente-mas sob demanda e em escala”, disse Prayag Narula, CEO e co-fundador da Heymarvin. “Estamos conversando centenas, até milhares de pessoas, algo que anteriormente só period visto em larga escala usando um pequeno exército de voluntários em momentos como eleições presidenciais. Agora, mesmo uma pequena equipe pode ter o mesmo diálogo aprofundado com seus clientes. Não é apenas uma pesquisa melhor e não está substituindo as entrevistas tradicionais de usuários.
Zencoder anuncia agentes zen autônomos para CI/CD
Esses agentes Execute diretamente nos pipelines CI/CD e pode ser acionado por webhooks de rastreadores de problemas ou eventos de código. Eles podem resolver problemas, implementar correções, melhorar a qualidade do código, gerar e executar testes e criar documentação.
“A próxima evolução no desenvolvimento de IA não é apenas codificar mais rápido-trata-se de acelerar todo o ciclo de vida do desenvolvimento de software program, onde a codificação é apenas uma etapa”, disse Andrew FileV, CEO e fundador da ZENCODER. “Ao trazer agentes autônomos para os pipelines de CI/CD, estamos permitindo que as equipes eliminem o trabalho de rotina e acelerem as transferências, mantendo o momento 24 horas por dia, 7 dias por semana, mantendo os seres humanos no controle do que finalmente envia”.
Leia as atualizações da IA da semana passada aqui: Openai Codex, AWS se transformam para .NET e mais – 16 de maio de 2025