Esta semana em AI Dev Ferramentas: GPT-5, Claude Opus 4.1 e muito mais (8 de agosto de 2025)


Esta semana em AI Dev Ferramentas: GPT-5, Claude Opus 4.1 e muito mais (8 de agosto de 2025)Esta semana em AI Dev Ferramentas: GPT-5, Claude Opus 4.1 e muito mais (8 de agosto de 2025)

O Openai lança GPT-5

Openai anunciado A disponibilidade do GPT-5, que, segundo ele, é “mais inteligente em geral” em comparação com os modelos anteriores.

Especificamente para codificação, o GPT-5 alcançou uma melhora significativa na geração complexa do front-end e na depuração de repositórios maiores. Os primeiros testadores disseram que fez melhores escolhas de design em termos de espaçamento, tipografia e espaço em branco, de acordo com a empresa.

“Achamos que você vai adorar usar o GPT-5 muito mais do que qualquer IA anterior”, disse o CEO Sam Altman durante a transmissão ao vivo. “É útil. É inteligente. É rápido. É intuitivo.”

Liberações antrópicas Claude Opus 4.1

Este último atualizar Melhora as habilidades de pesquisa e análise de dados do modelo e alcança 74,5% na verificada do banco de SWE (em comparação com 72,5% na Opus 4).

Ele está disponível para usuários Claude pagos, em Claude Code, e na API da API, na Amazon Bedrock e na Amapic e no Google Cloud AI.

A empresa planeja lançar melhorias maiores em seus modelos nas próximas semanas.

A AWS apresenta cheques de raciocínio automatizados para reduzir as alucinações de IA

Raciocínio automatizado Os cheques fazem parte do Amazon Bedrock Guardrails e validam a precisão do conteúdo gerado pela IA contra o conhecimento do domínio. Segundo a AWS, esse recurso fornece precisão de verificação de 99%.

Isso foi introduzido pela primeira vez como uma visualização na AWS Re: Invent e, com este lançamento geral de disponibilidade, vários novos recursos estão sendo adicionados, incluindo suporte para documentos grandes em uma única compilação, validação de política simplificada, geração de cenário automatizado, suggestions aprimorado da política e configurações de validação personalizáveis.

Google adiciona geminia cli às ações do github

Esse nova oferta foi projetado para atuar como um agente para tarefas de codificação de rotina. No lançamento, inclui três fluxos de trabalho: Triagem Inteligente de Problema, Revisões de Solicitação de Pull e a capacidade de mencionar @Gemini-Cli em qualquer problema ou solicitar a solicitação para delegar tarefas.

Está disponível na versão beta e o Google está oferecendo cotas gratuitas para o Google AI Studio. Também é suportado no Vertex AI e no Commonplace and Enterprise Tiers of Gemini Code Help.

OpenAI anuncia dois modelos de raciocínio de peso aberto

Openai é juntando -se O jogo de modelo de peso aberto com o lançamento do GPT-OSS-120B e GPT-20B.

O GPT-OSS-120B é otimizado para produção, casos de uso de alto raciocínio e GPT-OSS-20B foi projetado para casos de menor latência ou uso native.

Segundo a empresa, esses modelos abertos são comparáveis aos seus modelos fechados em termos de desempenho e capacidade, mas a um custo muito menor. Por exemplo, o GPT-OSS-120B em execução em uma GPU de 80 GB alcançou desempenho semelhante ao O4-mini nos benchmarks principais de raciocínio, enquanto o GPT-OSS-20B em execução em um dispositivo de borda com 16 GB de memória foi comparável ao O3-mini em vários benchmarks comuns.

Google DeepMind lança Genie 3

Genie 3 é um modelo de fronteira para gerar ambientes do mundo actual. Pode modelar propriedades físicas do mundo, como água, iluminação e ações ambientais.

Os usuários também podem usar os prompts para alterar o mundo gerado para adicionar novos objetos e caracteres ou alterar as condições climáticas, por exemplo.

Segundo o DeepMind, esta pesquisa é importante porque pode permitir que os agentes da IA sejam treinados em uma variedade de ambientes simulados.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *