Esta semana em AI Dev Ferramentas: Janela de contexto maior do Soneto 4 de Claude 4, atualizações de chatgpt e muito mais (15 de agosto de 2025)


Esta semana em AI Dev Ferramentas: Janela de contexto maior do Soneto 4 de Claude 4, atualizações de chatgpt e muito mais (15 de agosto de 2025)Esta semana em AI Dev Ferramentas: Janela de contexto maior do Soneto 4 de Claude 4, atualizações de chatgpt e muito mais (15 de agosto de 2025)

A janela de contexto do Soneto 4 Antrópico expande o Claude 4 para os tokens de 1M

Com esta janela de contexto maior, Claude pode processar Bases de código com mais de 75.000 linhas de código em uma única solicitação. Isso permite entender melhor a arquitetura do projeto, as dependências cruzadas e fazer sugestões que se encaixem no design completo do sistema.

As janelas de contexto mais longas estão agora na versão beta na API antrópica e na Amazon Bedrock, e em breve estarão disponíveis no vértice AI do Google Cloud.

Para avisos de mais de 200 mil tokens, os preços aumentarão para US $ 6 / milhão de tokens (MTOK) para entrada e US $ 22,50 / mtok para produção. Os preços para solicitações abaixo de 200 mil tokens serão de US $ 3 / mtok para entrada e US $ 15 / mtok para saída.

A empresa também estendeu seu modo de aprendizado projetado para os alunos para o Claude.ai e Claude Code. O Modo de Aprendizagem faz perguntas aos usuários para orientar e depois através de conceitos, em vez de fornecer respostas imediatas, para promover o pensamento crítico dos problemas.

OpenAI adiciona GPT-4O como um modelo legado no chatgpt

Com isso atualizaros usuários pagos agora poderão selecionar o GPT-4O ao usar o ChatGPT, juntamente com outros modelos como O3, GPT-4.1 e GPT-5 Considering Mini.

O seletor de modelos do GPT-5 também inclui agora o modo automático, rápido e de pensamento. Prioriza rápida dando as respostas mais rápidas, o pensamento prioriza dando respostas mais profundas que levam mais tempo para pensar e o automóvel escolhe entre os dois.

A empresa também aumentou o limite de mensagens para usuários mais e de equipe para 3.000 por semana no pensamento do GPT-5.

Google libera Gemma 3 270M

Este novo modelo foi “projetado desde o início para ajustes finos específicos da tarefa, com recursos de seguidores de instrução e texto de texto já treinados”. De acordo com o Google.

É supreme em situações em que há uma tarefa de alto quantity e bem definida; Velocidade e custo importantes; A privacidade do usuário precisa ser protegida; Ou há um desejo de uma frota de modelos de tarefas especializados.

As versões pré -treinadas e as versões sintonizadas do modelo estão disponíveis para obtain da Hugging Face, Ollama, Kaggle, LM Studio e Docker. Como alternativa, os modelos podem ser testados no vértice AI.

A NVIDIA lança os mais recentes modelos na família Nemotron Llama

O Nemotron de Lhama é uma família de modelos de raciocínio, e as atualizações mais recentes incluem uma nova arquitetura de modelos híbridos, modelos quantizados compactos e um orçamento de pensamento configurável para oferecer aos desenvolvedores mais controle sobre a geração de token.

Essa combinação permite que os modelos rachem mais profundamente e respondam mais rapidamente, sem precisar de mais tempo ou poder de computação. Isso significa melhores resultados a um custo menor ”, escreveu a empresa em um anúncio.

O agente de codificação do Google Jules recebe funcionalidade de crítica

Google é melhorando Seu agente de codificação de IA, Jules, com uma nova funcionalidade que revisa e critica o código enquanto Jules ainda está trabalhando nele.

“Em um mundo de iteração rápida, o crítico transfer a revisão no início do processo e para o ato da própria geração. Isso significa que o código que você revisa já foi interrogado, refinado e testado pelo estresse … Grandes desenvolvedores não apenas escrevem código, eles o questionam. E agora, Jules”, escreveu o Google em um put up no weblog.

Segundo a empresa, o crítico de codificação é como um revisor de pares familiarizado com os princípios da qualidade do código e “não tem medo de apontar quando você reinventou uma roda arriscada”.

Github para ser dobrado na Org Coreai da Microsoft

O CEO do Github, Thomas Dohmke, tem anunciado Seus planos de deixar a empresa no last do ano.

Em um memorando Para os funcionários, ele disse que a Microsoft não planeja substituí -lo; Em vez disso, o Github e sua equipe de liderança agora operarão sob a organização CoreAi da Microsoft, um grupo da empresa focado no desenvolvimento de ferramentas movidas a IA, incluindo o GitHub Copilot.

“Hoje, o Github Copilot é o líder do mercado mais bem -sucedido e próspero na period da IA, com mais de 20 milhões de usuários e contando”, escreveu ele. “Fizemos isso inovando à frente da curva e mostrando grão e determinação quando desafiado pelos disruptores em nosso espaço. No último ano, o GitHub Copilot se tornou a primeira solução multi-model na Microsoft, em parceria com o Anthropic, o Google e o OpenAI. Coden como Tens of millions e Inchorous O Incronous Agent Agente em agente agente em agente agente em agente agente em agente agente em vs em vs.

Sentry lança ferramenta de monitoramento MCP

A Sentry da empresa de monitoramento de aplicativos está facilitando a obtenção de visibilidade nos servidores MCP com o lançar de uma nova ferramenta de monitoramento.

Com o MCP Monitoring, os desenvolvedores podem entender coisas como quais clientes estão enfrentando erros, quais ferramentas são mais usadas ou quais ferramentas estão funcionando lentamente. Eles também podem correlacionar erros com eventos como picos de trânsito ou novas implantações de liberação ou descobrir se os erros estão acontecendo apenas em um tipo de transporte.

De acordo com Cody de Arkland, chefe de experiência do desenvolvedor da Sentry, quando a Sentry lançou seu próprio servidor MCP, estava recebendo mais de 30 milhões de solicitações por mês. Ele disse que nessa escala é inevitável que os erros ocorram, e as ferramentas de monitoramento existentes estavam lutando com os servidores MCP.

Bithuman lança SDK para criar AI Avatars

A empresa de IA Bithuman tem anunciado Um SDK visible para criar avatares para uso como agentes de bate -papo, instrutores, treinadores virtuais, companheiros e especialistas em diferentes campos.

Segundo a empresa, o SDK permite que os avatares sejam criados em sistemas baseados em ARM e X86 sem GPU. Os avatares têm uma pegada pequena e podem ser executados on -line ou offline em dispositivos como Chromebooks, Mac Minis e Raspberry Pis.

Devido à sua pequena pegada, esses personagens podem ser trazidos para uma ampla gama de ambientes, incluindo salas de aula, quiosques, aplicativos móveis ou dispositivos de borda.


Leia as atualizações da semana passada aqui: Esta semana em AI Dev Ferramentas: GPT-5, Claude Opus 4.1 e muito mais (8 de agosto de 2025)

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *