Tendências de radar para assistir: maio de 2025 – O’Reilly


O Protocolo de Contexto do Modelo do Anthropic (MCP) recebeu muita atenção para padronizar a maneira como os modelos se comunicam com as ferramentas, facilitando muito a construção de agentes inteligentes. O Agent2AGent (A2A) do Google agora adiciona recursos que foram deixados de fora da especificação MCP authentic: segurança, cartões de agente para descrever os recursos do agente e muito mais. O A2A é competitivo ou complementar? É outra camada em uma pilha de protocolo em desenvolvimento para aplicações de agênticos? Da mesma forma, o código Claude tem sido o carro-chefe da codificação Agentic, a próxima etapa além dos modelos de corte e cola e conclusão de comentários (GitHub). Agora, com o Codex baseado em terminais da Openai e o IDE do Studio do Google, ele tem concorrência. A vantagem para antropia? Essas ferramentas reconhecem implicitamente que o Antrópico é o fornecedor da IA ​​a vencer.

Inteligência synthetic

  • O mais recente modelo de geração de vídeo do OpenAI (GPT-Picture-1) é agora disponível através da API da empresa.
  • A Agência Espacial Europeia e a IBM criaram Terramindum modelo generativo de IA da Terra. Entre outras coisas, o modelo foi treinado para a previsão climática. Está disponível em Abraçando o rosto.
  • WHALESPOTTER é uma câmera térmica habilitada para AI que os navios podem usar para detectar baleias a tempo de mudar de curso e evitar colisões. O sistema detecta o calor do bico de uma baleia.
  • O mais recente modelo de raciocínio do Google, Gêmeos 2.5 Flashagora está disponível na visualização. O Flash é um “modelo de raciocínio híbrido” que permite que os usuários especifiquem um “orçamento de pensamento” para que possam controlar quanto dinheiro (tempo, tokens) são gastos em raciocínio.
  • MCP Run Python é um servidor MCP da Pydantic para executar o código Python gerado por LLM em uma caixa de areia. Simon Willison tem alguns demos fascinantes.
  • Openai tem lançado Seus modelos O3 e O4-mini. O3 é o seu modelo de raciocínio mais avançado, e o O4-mini é um modelo de raciocínio menor projetado para ser mais rápido e mais econômico. Esses novos modelos substituem O1 e O3-mini.
  • Um modelo para a navegação marítima demonstrou que Explicar o motivo das decisões de navegação aumenta a confiança e reduz o erro humano.
  • Openai tem lançado GPT-4.1, incluindo mini e nano versões. O OpenAI afirma que o GPT-4.1 melhora significativamente na geração de código e nas instruções seguintes. Todos os modelos têm uma janela de entrada de 1M de token. Os modelos 4.1 da série estão atualmente disponíveis apenas pela API. GPT-4 está programado para ser aposentadocomo é o GPT-4.5 Preview.
  • Um novo artigo de DeepMind descreve alguns estratégias para defendendo contra injeção imediata ataques. Como Simon Willison escreveinjeção imediata existe há dois anos e meio; Este pode ser o primeiro progresso significativo para derrotá -lo.
  • Chatgpt pode agora Faça referência a todo o seu histórico de bate -papo. Esta é uma extensão significativa de seu recurso de memória mais antigo, que só conseguiu se lembrar de algumas informações.
  • MCP pode ser a base para a próxima geração de tecnologia orientada a IA, mas É importante lembrar a segurança. As vulnerabilidades do protocolo são tão perigosas quanto a injeção de SQL – e o MCP tem muitos deles. (Sem dúvida, A2A também faz; vai com o território.)
  • Antrópico anunciou um novo Plano máximo Para os usuários de Claude mitigar as reclamações de que os usuários estão esbarrando em seus limites de uso com muita frequência. Max custa US $ 100 ou US $ 200 por mês, por 5x ou 20x a mais de uso que o Professional. Não é barato, mas esbarrar nos limites é frustrante.
  • Para aqueles de nós que gostam de manter nossa IA perto de casa, há agora Deepcoderum modelo 14B especializado em codificação e que reivindica desempenho semelhante ao O3-mini do Openai. DataSet, código, registros de treinamento e otimizações do sistema estão todas abertas.
  • Dois importante papéis Do Antrópico, dê algumas pistas sobre como os agentes pensam. E um artigo Por Blaise Agüera Y Arcas, do Google, desafia nossas noções de como pensamos.
  • Google tem anunciado isso é Agente2agent protocolo (A2A), para facilitar as comunicações entre agentes inteligentes. Ele fornece comunicações entre agentes, descoberta de agentes e gerenciamento de tarefas assíncronas. A empresa enfatiza que a A2A é complementar ao MCP.
  • O Mannequin Context Protocol (MCP) está conquistando o mundo da IA. Existem vários projetos listando servidores MCP, incluindo McPServers.orgo Superior-MCP-Servers Repo Github, Lista de Glamae Cline’s MCP Market (acessível através de seu plug-in).
  • Openai está sendo lançado marcas d’água Para seu modelo de geração de imagens, possivelmente em resposta a reações ao seu filtro “Studio Ghibli”. Aparentemente, usuários com uma conta paga podem salvar imagens sem marcas d’água.
  • Meta tem lançado O LLAMA 4 “rebanho” de modelos abertos. São todos modelos de mistura de especialistas com grandes janelas de contexto. Scout e Maverick têm 17b parâmetros ativos, com 16 e 128 “especialistas”, respectivamente; Eles estão disponíveis llama.com e Abraçando o rosto. Behemoth é um modelo de “Professor” de 228b (2T) “Professor” usado para treinar outros modelos.
  • Openai é realmente planejando lançar um modelo aberto? Surpresa, surpresa. Escusado será dizer que ainda não foi lançado. Mas eles já querem suggestions.
  • Gemini 2.5 é agora disponível para usuários livres; Selecione Gemini 2.5 Professional (Experimental) no aplicativo Gemini. Alguns de seus recursos são restritos (por exemplo, usuários gratuitos não podem fazer add de documentos).
  • Um ai pode ser um Terceiros confiáveis? Pode fazer um julgamento com base em informações de duas fontes sem revelar as informações nas quais o julgamento foi baseado? A resposta pode ser “sim. ” Ajuda que os modelos possam ser excluídos.
  • O Google está aberto Gemma 3 Os modelos deram vários passos adiante. Eles agora apóiam Chamada de função e janelas de contexto maiores (128k). Treinamento com reconhecimento de quantização Otimiza seu desempenho para tornar os modelos acessíveis para {hardware} menos poderoso: uma única GPU ou mesmo um laptop computer sem GPU.

Programação

  • Revisões de código. Devemos também fazer Revisões de dados? À medida que nos tornamos mais dependentes da IA ​​e dos enormes dutos de dados, precisamos saber que nossos dados são confiáveis.
  • Ao usar o código Claude, o O orçamento de pensamento é evidentemente controlado Ao usar as palavras “Suppose”, “Suppose Laborious”, “Pense mais” e “Ultrathink” em prompts.
  • Kelsey Hightower vê o Projeto nix como um possível complemento ao Docker. O uso do NIX dentro dos arquivos do Docker leva a compilações mais eficientes e reproduzíveis.
  • Openai também lançou Códiceum agente de codificação que é executado no terminal. Parece ser semelhante ao código Claude, mas possui uma licença de código aberto.
  • O Projeto KRO (Kubernetes Orchestrator de recursos) permite que os desenvolvedores criem grupos de recursos Kubernetes que podem ser usados ​​para simplificar as configurações de cluster de Kubernetes de maneira independente do fornecedor.
  • Python agora tem um tarifa Pacote para imitar importações! 50% em Numpy, 200% em pandas. Como no mundo actual, você só se taia.
  • Google’s Firebase Studio é um IDE AI-nativo generativo para criar aplicativos da Internet de pilha completa. Está recebendo boas críticas on-line. Além da integração com o Git e o Github, ele é integrado ao Google Cloud, para que possa implantar aplicativos automaticamente.
  • Openai exigirá a verificação da organização Para que os desenvolvedores obtenham acesso à API a modelos futuros. Apesar do nome, esse standing se aplica a desenvolvedores individuais e exigirá uma identificação válida emitida pelo governo; IDs de mais de 200 países são aceitáveis.
  • Alexa da Amazon perdeu o brilho, mas o novo Alexa+ é baseado em IA generativa. A empresa está procurando desenvolvedores para Teste seus SDKs nativos de AI.
  • Embora o código de ferrugem ainda seja uma pequena parte do kernel Linux, sua presença é crescente– E a segurança da memória da Rust está valendo a pena.
  • Nvidia é Adicionando suporte nativo ao Python ao CUDAseu package de ferramentas para programar GPUs.
  • Nvidia também tem anunciado que uma versão futura do CUDA permitirá que os desenvolvedores tratem grandes aglomerados de GPUs como uma única GPU digital. Não há estimativa para quando esses novos recursos serão lançados.
  • Microsoft tem publicado um papel sobre fornecer um acesso LLM de geração de código a um depurador Python. Depuração da vibração Agentic, aqui vamos nós!
  • Execute um servidor no navegador? Com Wasm, por que não? Não é um bom ambiente de produção, mas pode ser very best para desenvolvimento e depuração.
  • Rust finalmente tem um Especificação de linguagem formal! A especificação foi desenvolvida e doada à Rust Basis by Ferrous Programs, uma empresa que desenvolve compiladores de ferrugem. Estou chocado que um ainda não existisse – mas aparentemente um não.

Segurança

  • Puples de política é uma nova técnica de ataque de injeção imediata que funciona contra todos os principais LLMs. O ataque funciona escrevendo o aviso malicioso de uma forma que pode ser interpretada como um arquivo de política que o LLM seria obrigado a obedecer.
  • O recall do Home windows está de volta. Está no canal de visualização. Muitos dos problemas parecem ter sido corrigidos. Por padrão, não está ligado, pode ser desinstalado e pode ser usado sem uma conexão de rede. Mas ainda é assustador, e a reputação da Microsoft é um problema que permanece.
  • O programa CVE de Mitre (vulnerabilidades e exposições comuns) foi quase dividido. Financiamento expirado sobre 15 de abril e period apenas estendido por 11 meses em 17 de abril. Cve foi essencial na disseminação de informações sobre as fraquezas de segurança nos sistemas de computadores.
  • Google tem anunciado Criptografia de ponta a ponta (E2E) para Gmail. Enquanto isso reduz o ônus de implementar a criptografia E2E para os departamentos de TI, é discutível Se isso é realmente E2E. Os destinatários que não usam o Gmail podem usar um subconjunto especial do Gmail para ler o correio criptografado.
  • OpenPubkey SSH Simplifica o uso do SSH com um único sinal. Adiciona teclas públicas ssh aos tokens de identificação usados ​​por OpenId Join. Os teclados SSH de curta duração são criados automaticamente quando os usuários fazem login e não precisam ser gerenciados pelos usuários.

Infraestrutura

Internet

  • O OpenAI poderia ser o novo Twitter? Aparentemente os primeiros estágios de Criando uma rede social que se integra ao ChatGPT.
  • XKCD’s Anual piada tardia de abril bobs Notificações push é uma obra -prima.
  • Mozilla está olhando além de seu cliente de e -mail Thunderbird para o Thundermail Professional, um serviço de e -mail completo projetado para competir com o Gmail. Ele incluirá um serviço de calendário e uma ferramenta de IA para ajudar a escrever mensagens.

Computação quântica

  • Mensagens quânticas foram enviadas sobre Infraestrutura de comunicações comerciais. A distância (254 km) quase não importa; O mais importante é que o experimento tenha usado fibra óptica comercial sem resfriamento ou outro suporte específico para o quântico.
  • Uma empresa australiana tem desenvolvido Uma alternativa ao GPS que usa sensores quânticos para identificar os locais baseados nos campo magnético. O dispositivo não emite sinais, pode filtrar o ruído e, diferentemente dos sistemas GPS atuais, não é vulnerável a interrupções ou ataques.
  • Phasecraft tem desenvolvido Um algoritmo que torna as simulações quânticas mais eficientes. Esse avanço pode ajudar os computadores quânticos a modelar reações químicas e criar novos materiais.

Robótica

  • Abraçar o rosto tem adquirido Robótica de pólen e planeja vender robôs. Sua primeira oferta, Reachy 2é um robô humanóide que pode ser programado usando o rosto de abraço LEROBOT modelos.
  • Robobee é um pequeno robô voador (aproximadamente uma polegada de comprimento) que pode pousar em segurança em uma folha.

Aprenda mais rápido. Cavar mais fundo. Veja mais longe.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *