Tendências de radar para assistir: junho de 2025 – O’Reilly



Tendências de radar para assistir: junho de 2025 – O’Reilly

Os vendedores de IA passaram a maior parte dos anúncios de maio – e entrando em quase todas as categorias aqui. Mas não é a única história que vale a pena assistir. Os médicos usaram o CRISPR para corrigir o DNA de um bebê com uma condição rara e anteriormente intratável. Não saberemos se o tratamento funcionou por anos, mas o bebê parece estar prosperando. E uma startup agora está vendendo o máximo em redes neurais. É feito de neurônios de viver (cultivados) e inclui um sistema de apoio à vida que manterá os neurônios por algumas semanas. Não estou totalmente convencido de que isso é actual, mas ainda quero saber quando será capaz de vencer o Alphago.

Inteligência synthetic

  • Antrópico lançou os dois primeiros modelos no Claude 4 série: Soneto e Opus. Estes são modelos de raciocínio híbrido que dão aos usuários controle sobre a quantidade de tempo gasto “pensando”. Eles podem usar as ferramentas em paralelo e (se obterem acesso ao arquivo native) Lembre -se de informações por meio de uma série de solicitações.
  • Os novos modelos Claude 4 têm uma propriedade surpreendente “Agentic”: eles podem Entre em contato com a aplicação da lei Se eles acham que você está fazendo algo ilegal. Quem precisa de uma porta dos fundos? Até onde sabemos, esse comportamento só foi visto na pesquisa do Antrópico sobre Alinhamento. Mas podemos imaginar que o treinamento de um modelo para eliminar esse comportamento pode ter suas próprias consequências legais.
  • Ponto é um experimento no uso do LLMS para ajudar a projetar e gerar interfaces de usuário. Você pode descrever as idéias da interface do usuário em linguagem pure, gerar e iterar em wireframes e, eventualmente, gerar código ou colar seu design no figma.
  • O DeepMind do Google é experimentando com modelos de difusão, que normalmente são usados ​​para geração de imagens, em Gêmeos. Eles afirmam que os modelos de difusão podem ser mais rápidos e dar aos usuários mais controle. O modelo não está disponível ao público, mas há uma lista de espera.
  • Mistral anunciou DevstralUm novo modelo de idioma otimizado para tarefas de codificação agêntica. É de código aberto e pequeno o suficiente (24b) para executar em um laptop computer bem equipado. Ele tenta cruzar a lacuna entre simplesmente gerar código e desenvolvimento de software program do mundo actual.
  • Meta anunciou seu Programa de inicialização de lhamaque dará às startups de até US $ 6.000/mês para pagar pelo uso de serviços de llama hospedados, além de fornecer assistência técnica da equipe de llama.
  • Langchain anunciou Plataforma de agente aberto (OAP), uma plataforma sem código para a construção de agentes inteligentes com IA. OAP é de código aberto e está disponível no GitHub. Você também pode experimentar com isso on-line.
  • Google tem anunciado Gemma 3N, um novo modelo multimodal em sua série Gemma. A GEMMA 3N foi projetada especificamente para dispositivos móveis. Ele usa uma técnica chamada incorporação por camada para reduzir seus requisitos de memória para 3 GB para um modelo com parâmetros 8B.
  • Os Emirados Árabes Unidos usarão a IA para ajudar a redigir suas leis. Bruce Schneier tem um excelente discussão. Usar a IA para escrever leis não é novo nem necessariamente anti -humano; A IA pode ser (e foi) projetada para capacitar as pessoas, em vez de concentrar o poder.
  • Deepmind construiu Alfa evolveum novo modelo de uso geral que usa uma abordagem evolutiva para criar novos algoritmos e melhorar os antigos. Não somos os únicos perguntando: “É um modelo? Ou é um agente?” O AlphaEvolve não está disponível para o público.
  • Por algum tempo, o Grok Llm de Xai estava transformando quase todas as conversas em um conversa sobre genocídio branco. Esta não é a primeira vez que a GROK fornece uma saída estranha e indesejada. Em vez de ser “imparcial”, parece estar refletindo as obsessões de Elon Musk.
  • Coisas que são fáceis para os seres humanos, mas difíceis para a IA: LEGOGPT pode projetar uma estrutura LEGO com base em um immediate de texto. A estrutura será construída com peças de lego actual e capaz de se levantar quando montada. Agora precisamos apenas de um robô para montá -lo.
  • Microsoft tem anunciado Versões de raciocínio de seus modelos PHI-4. Existem três versões: raciocínio, mini-rendimento e raciocínio. Todos esses modelos são relativamente pequenos; O raciocínio é de 14b parâmetros e o mini-rendimento é de apenas 3,8b.
  • Google tem lançado Gemini 2.5 Professional Visualizar (edição de E/S). Ele promete melhor desempenho ao gerar código e possui um recurso de vídeo a código que pode gerar aplicativos a partir de vídeos do YouTube.
  • Se você está confuso com as convenções de nomeação do OpenAi (ou falta dela), a empresa Postado Um resumo útil de todos os seus modelos e recomendações sobre quando cada modelo é apropriado.
  • Um novo Sistema de tradução automatizada pode rastrear vários alto -falantes e traduzir vários idiomas simultaneamente. Um modelo rastreia a localização e as características de voz de falantes individuais; outro faz a tradução.
  • Mistral tem anunciado Le Chat Enterprise, uma solução corporativa para a IA baseada em bate-papo. O bate-papo pode ser executado no native e pode se conectar aos documentos, fontes de dados de uma empresa e outras ferramentas.
  • Cache semântico é uma maneira de melhorar o desempenho e reduzir o custo da IA. É essencialmente as instruções e respostas do cache e retornando uma resposta do cache sempre que o immediate é semelhante.
  • Antrópico anunciou Integrações de Claude. As integrações usam o MCP para conectar o Claude aos aplicativos e serviços existentes. As integrações suportadas incluem aplicativos de consumidores como PayPal, ferramentas como Confluence e fornecedores como o Cloudflare.
  • Google tem atualizado Sua caixa de areia de música com novos modelos e novos recursos. Ao contrário dos geradores de música como o SUNO, o Sandbox da Music AI é projetado como uma ferramenta criativa para os músicos trabalharem: editar, estender e gerar clipes musicais.
  • O Google construiu Dolphingemmaum modelo de idioma treinado em vocalizações de golfinhos. Embora o modelo possa prever o próximo som em uma sequência, ainda não sabemos o que eles estão dizendo; Isso nos ajudará a aprender!
  • O Tons O conjunto de dados foi projetado para ajudar os desenvolvedores de modelos a encontrar e eliminar estereótipos prejudiciais e outros comportamentos discriminatórios. Tonses são multilíngues; Foi construído observando como os modelos respondem a estereótipos. O conjunto de dados está disponível em Abraçando o rosto.

Programação

  • Jules A entrada do Google está no espaço de codificação habilitado para agentes. Ele usa Gêmeos e proclama: “Jules faz as tarefas de codificação que você não deseja realizar”. É claro que se integra ao GitHub, testa seu código em uma VM em nuvem, cria e executa testes e mostra seu raciocínio.
  • As linguagens de descrição de {hardware} são difíceis e opacas; Eles se parecem pouco com qualquer linguagem de nível superior em uso. é um novo HDL projetado com modernas linguagens de programação de alto nível em mente; É fortemente influenciado pela ferrugem.
  • Openai tem lançado O Codex, um agente de codificação com base em uma nova versão da O3 que teve treinamento especializado para programação. Ele pode retirar uma base de código de um repo Git, escrever um novo código, gerar solicitações de tração e usar uma caixa de areia para teste. Está disponível apenas para assinantes profissionais.
  • Ao gerar código, os LLMs têm uma tendência problemática de escrever demais, para favorecer soluções detalhadas e com excesso de enigmas. Fred Benenson discute o problema e oferece algumas soluções.
  • Nix é um gerente de dependência que pode fazer muito para melhorar a segurança da cadeia de suprimentos. Seu objetivo é provar a integridade das fontes usadas para criar software program, rastrear todas as fontes e cadeias de ferramentas usadas na construção e exportar as fontes usadas em cada liberação para facilitar as auditorias de terceiros.
  • Openai tem anunciado Um conector que permite que o recurso de pesquisa profunda do ChatGPT investigue o código no GitHub. Como a pesquisa profunda se apresentará sobre bases de código herdadas? Vamos ver.
  • Redis tem retornou Para uma licença de código aberto! Redis V8 é coberto pelo AGPL V3 licença.
  • Deepwiki é uma “enciclopédia livre de todos os repositórios do GitHub”. Você obtém um resumo (aparentemente) gerado pela IA do repositório, além de um chatbot sobre como usar o repositório.
  • Um catálogo de “código cheiro” é um trabalho agradável e útil. O website é um pouco estranho, mas é pesquisável e tem explicações detalhadas dos antipateriais de software program, completos com exemplos e soluções.
  • Para aqueles que não se lembram de seus comandos de terminais: Zev é uma ferramenta de linha de comando que usa AI (OpenAI, Google Gemini, Azure Openai ou Ollama) para obter uma descrição verbal do que você deseja fazer e convertê -lo em um comando. Você pode copiar/colar o comando ou executá -lo através de um menu.
  • Docker introduziu Docker Mannequin Runneroutra maneira de executar grandes modelos de linguagem localmente. Executar um modelo é tão simples quanto executar um contêiner.

Internet

  • CSS Minecraft é a Minecraft O clone que é executado no navegador, implementado inteiramente em HTML e CSS. Nenhum JavaScript está envolvido. Aqui está uma explicação de como funciona.
  • A Microsoft anunciou Nlwebum projeto que permite que os websites integrem o suporte ao MCP facilmente. O resultado: qualquer website pode se tornar um aplicativo de IA.
  • 10Web criou um aplicativo de IA generativo sem código para a criação de websites de comércio eletrônico. O que distingue é que ele gera código que pode ser executado no WordPress e permite que os clientes “brancos” novos websites exportando essa capacidade de solicitar.
  • E se o seu navegador tivesse a IA Agentic completamente integrada? E se fosse construído em torno da IA ​​desde o início, não como um complemento? Pode ser como Morango.
  • UM enquete dos desenvolvedores da Internet diz que, enquanto a maioria dos desenvolvedores está usando a IA, menos de 25% de seu código é gerada pela IA. Uma maioria sólida (76%) diz que mais da metade do código gerado pela IA precisa ser refaturado antes de poder ser usado.

Segurança

  • O sinal de aplicação de mensagens seguras tem adicionado Um recurso que impede o recall da Microsoft de tirar capturas de tela do aplicativo. É um hack interessante que usa o DRM embutido do Home windows para desativar as capturas de tela por aplicativo.
  • Como você distingue bons bots e agentes dos maliciosos? Cloudflare sugere Usando criptografia – especificamente, o Assinatura da mensagem HTTP padrão. Openai já está fazendo isso.

Computação quântica

  • Os pesquisadores têm demonstrado Correção de erro quântico para qudits – como qubits, mas com três ou mais estados em vez de dois.

Biologia

  • Nuvem cortical Afirma ser um computador biológico programável: neurônios cultivados em laboratório com uma interface digital e um sistema de apoio à vida em uma caixa. Quando será capaz de jogar xadrez?

Realidade digital e aumentada

  • O Google Glasses está de volta? O Google anunciou uma parceria com a Warby Parker para construir óculos habilitados para Android XR AR/VR incorporando IA. A IA será executada no seu telefone (Android).

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *