Tendências de radar para assistir: março de 2025 – O’Reilly


Não obstante o anúncio do Anthropic de Claude 3,7 sonetos, o ritmo vertiginoso dos principais anúncios da IA ​​parecia desacelerar até fevereiro. Isso nos deu algum tempo para analisar alguns outros tópicos. Duas postagens importantes sobre programação apareceram: “We Are Destroying Software program”, de Salvatore Sanfilippo, e o Slide Deck de Rob Pike, “On Bloat”. Eles são surpreendentemente semelhantes. Nem menciona a IA; Ambos abordam a questão de por que nosso {hardware} está ficando cada vez mais rápido, mas nossos aplicativos não são. Também observamos o retorno de Pebble, o primeiro relógio inteligente e uma lâmpada de mesa acionada pela AI da Apple Analysis, que parece ter vindo do logotipo da Pixar. Diversão, talvez, mas não procure isso nas lojas da Apple.

Inteligência synthetic

  • Antrópico lançou Claude 3,7 soneto, o primeiro modelo de raciocínio da empresa. É um “modelo híbrido”; Você pode dizer se deseja ativar sua capacidade de raciocínio. Você também pode controlar seu “orçamento” ao pensar limitando o número de tokens que ele gera para o processo de raciocínio.
  • O Enviornment de agente de computadores é uma plataforma para testes de agentes de crowdsourcing. Ele permite que qualquer pessoa execute um agente usando dois modelos diferentes de IA, observe o que o agente está fazendo e avalie os resultados. Os resultados estão resumidos em uma tabela de classificação; No momento, Claude 3,5 sonetos está no topo.
  • O Google está desenvolvendo um “co-cientistaIsso sugere hipóteses para os cientistas investigarem. As hipóteses são baseadas nos objetivos, idéias e pesquisas anteriores do cientista. A empresa está procurando pesquisadores para ajudar nos testes.
  • Github tem atualizado Modo de agente para copiloto. Agora ele irá iterar no código de buggy até fornecer resultados corretos e pode adicionar novas subtaretas ao authentic, se forem necessárias para atingir a meta do usuário.
  • Open-R1 é um novo projeto Isso pretende criar uma reprodução totalmente aberta do Deepseek R1. Além de código e pesos, este projeto lançará todas as ferramentas e dados sintéticos usados ​​para treinar o modelo.
  • Moshi é um novo modelo de linguagem de conversação (fala a fala) que está ouvindo constantemente e pode lidar com interjeções como “uh huh” sem ficar confuso.
  • Codinome Goose é um novo código aberto estrutura para Desenvolvimento de IA agêntica Aplicações. Ele usa o protocolo de contexto de modelo do Anthropic para se comunicar com sistemas que possuem dados e podem descobrir novas fontes de dados em tempo actual.
  • A Universidade de Surrey estará construindo um Modelo de idioma para linguagem de sinais. Um foco será traduzir entre a linguagem falada e a linguagem de sinais. O objetivo é garantir que a comunidade surda não seja deixada para trás pela explosão das ferramentas de IA.
  • Galileu é um conjunto de ferramentas agênticas para detectar quando um modelo de IA é alucinando. É particularmente importante para os sistemas agênticos, onde um erro de um agente leva ao mau comportamento por outros a jusante.
  • Um grupo de pesquisadores lançado S1um modelo de raciocínio de 32b com desempenho próximo da arte. S1 custou apenas US $ 6 para treinar. Um pequeno conjunto de dados de treinamento (apenas 1.000 amostras de raciocínio) provaram que o modelo foi forçado a reservar um tempo additional para o raciocínio.
  • Alguns pesquisadores publicados Como escalar seu modeloum livro sobre como escalar grandes modelos de idiomas. Aparentemente, o livro é documentação interna do Google DeepMind.
  • Openai tem lançado O3-mini, um modelo de linguagem pequeno e econômico baseado em seu modelo de raciocínio (ainda não lançado) da O3.
  • Antrópico tem implantado isso é Classificador Constitucional para testes adversários do público. O classificador é um sistema que protege os modelos de Claude dos jailbreaks e tenta fazer com que Claude responda a perguntas que não são permitidas. Os primeiros resultados parecem muito bons.
  • O Lição para aprender com o Deepseek R1 é que, dado um bom modelo de fundação, é menos difícil do que muitos pensaram desenvolver um modelo de raciocínio. Nos próximos meses, espere muitas alternativas abertas.
  • Openai introduziu DeePresearchum aplicativo baseado em seu modelo O3 que reivindica a capacidade de sintetizar grandes quantidades de informações e executar tarefas de pesquisa em várias etapas.
  • Sam Altman reconheceu que o Openai está no “lado errado da históriaNo que diz respeito à IA de código aberto, mas também disse que abordar os problemas não period uma alta prioridade.
  • Alibaba tem lançado QWEN2.5-MAXoutro modelo de linguagem grande com desempenho no mesmo nível que o GPT-4 e o Claude 3,5 sonetos. Pode ser acessado através Qwen Chat ou nuvem de Alibaba.
  • Laboratório de Transformador é uma ferramenta para experimentar os modelos de treinamento, ajuste fino e programação LLM localmente. Ainda está instalando, mas parece o ollama em esteróides.
  • Smolgpt é “uma implementação mínima de pytorch para treinar seu próprio pequeno LLM do zero”.
  • Sim, a Microsoft está reclamando que o DeepSeek usou o OpenAI para gerar dados de treinamento sintético. Essas objeções não impediram de fazer Deepseek disponível no Azure.
  • Dois compositores colaborou com o Google’s Gemini para criar O paradoxo gêmeoum trabalho para uma orquestra sinfônica clássica.
  • Alibaba tem lançado dois “pontos de verificação” para seus modelos, Qwen2.5-7b-Instruct-1M e Qwen2.5-14b-Instruct-1M. Esses modelos têm grandes janelas de contexto de 1m-Token. A Alibaba também de código aberto sua estrutura de inferência, que a empresa afirma ser de três a sete vezes mais rápida.
  • TinyZero Reproduz o R1 Zero da Deepseek, um modelo de raciocínio com parâmetros 3B. Treinamento TinyZero Price Below US $ 30. Você pode baixar o TinyZero, mas também pode fazer o seu por menos do que o custo de uma noite fora. Precisamos de modelos caros?

Programação

  • Tanagram é promissor Um conjunto de ferramentas para ajudar os desenvolvedores a entender e trabalhar com bases de código complexas. Até agora, existem apenas demos, mas parece interessante.
  • Harper Reed descreve Seu fluxo de trabalho para programar com IA. O desenvolvimento de um fluxo de trabalho é essencial para usar a IA de maneira eficaz, e Harper deu a descrição mais completa que já vimos.
  • Como Linux, Rubi nos trilhos pode correr no navegador. Este hack usa WebAssembly.
  • Linux inicialização dentro de um pdf em Chrome. As implementações em PDF suportam JavaScript; C pode ser compilado em um subconjunto de JavaScript (Asm.JS), o que significa que um emulador RISC-V pode ser compilado ao JavaScript e executado em um PDF no navegador, que então executa o Linux. Um hack incrível.
  • Ocr4all Fornece software program de reconhecimento de caracteres ópticos de código aberto gratuito e aberto. Você deve precisar.
  • Por que o software program não funciona mais rápido do que há 20 ou 30 anos, apesar dos computadores muito mais rápidos? Rob Pike tem algumas reflexões sobre controlando inchaço.
  • Como o nome indica, Registros de decisão arquitetônica (ADRS) Seize uma decisão sobre a arquitetura de software program e o motivo da decisão. Com muita frequência, essas informações não são capturadas. É provável que se torne mais importante na period do desenvolvimento de software program assistido por AA.
  • Jank é uma nova linguagem de programação de uso geral. É um dialeto de clojure que incorpora idéias de muitos outros idiomas, incluindo C ++ e ferrugem, e é construído sobre o LLVM.
  • Aqui está um conjunto de padrões para a construção de tempo actual recursos em aplicativos.
  • Salvatore “Antirez” Sanfilippo’s Submit, “Estamos destruindo o software program”É uma leitura obrigatória. (Não diz nada sobre a IA.) Começa “estamos destruindo o software program por não levar em consideração a complexidade”.
  • Script é uma biblioteca GO que possibilita a programação semelhante a uma concha. Sua maior contribuição é a capacidade de criar tubos; Ele também possui funções que são semelhantes a Grep, encontre, cabeça, cauda e outros comandos de shell comuns.

Segurança

  • Os atores de ameaças alinhados com a Rússia estão sinal de direcionamentoo aplicativo de mensagens seguras, com ataques de phishing que vinculam as contas dos usuários a dispositivos hostis. Um grupo envia códigos QR que Parece legítimo mas hyperlink para um dispositivo sob seu controle; Outro representa uma aplicação usada pelas forças armadas da Ucrânia. A melhor proteção é atualizar para a versão mais recente do sinal.
  • Duas novas vulnerabilidades em OpenSsh foram encontrados. Expõe-se os servidores OpenSsh a ataques man-in-the-middle; O outro pode levar a ataques de negação de serviço. Uma atualização foi lançada; instale.
  • Darkmind é um novo ataque contra modelos de linguagem de raciocínio. É possível criar aplicativos personalizados (como os da loja GPT) com “gatilhos ocultos” que modificam o processo de raciocínio.
  • Um novo tipo de ataque da cadeia de suprimentos envolve obter AWS abandonado S3 Buckets que ainda contêm bibliotecas que são frequentemente baixadas. O novo proprietário pode inserir malware nas bibliotecas; O proprietário authentic, que abandonou o balde, não pode consertar as bibliotecas corrompidas.
  • A segurança está bloqueando a adoção da IAparticularmente em indústrias fortemente regulamentadas. Isso é compreensível; Muitas das perguntas que fazemos sobre sistemas seguros não podem ser respondidas adequadamente para a IA.
  • A equipe AI Crimson da Microsoft publicou Lições da Crimson Teaming 100 produtos generativos de IA. É uma leitura essencial para qualquer pessoa interessada em construir um sistema de IA seguro.
  • AI está sendo acostumada a Envie solicitações falsas de recursos e relatórios de bug sobre projetos de código aberto. Muitos deles podem ser inadvertidos, mas, independentemente da causa, está gerando problemas para mantenedores de software program.
  • Linux tem vários ferramentas Para detectar rootkits e outros malware. Chkrootkit e LMD (Detecção de malware Linux) vale sua atenção.
  • Bandido de tempo é um novo jailbreak para os modelos GPT. O ataque faz com que o modelo perca o controle do passado, do presente e do futuro. Essencialmente, você pergunta ao GPT como alguém no passado faria algo que só pode ser feito no presente. Não está claro se esse ataque funciona em outros modelos.
  • Quando o preço do bitcoin aumenta, o mesmo acontece com a frequência de Jacking de criptografia: Computadores de seqüestro para formar botnets de mineração de criptografia. Alega -se que, para cada dólar de criptografia extraído, a vítima incorre em US $ 53 em custos em nuvem.
  • UM Novo backdoor para VPNs foi descoberto na natureza, dando aos atacantes acesso a redes corporativas. Esses backdoors permanecem inativos até serem desencadeados por um “pacote mágico” especialmente construído, tornando -os difíceis de detectar.

Net

  • À medida que mais pessoas solicitam recomendações de produtos à IA, os profissionais de advertising and marketing precisarão otimizar a percepção do produto por modelos de idiomas. LLMO substitui website positioning? Otimizar para um LLM pode ser a próxima geração de website positioning.
  • Esse artigo Diz a você como optar por não participar dos recursos Gemini no Gmail e em outros aplicativos do Google Workspace. É possível desativar Gêmeos seletivamente. Infelizmente, exige que você tenha acesso ao console do administrador.
  • JavaScript Temporal O objeto está começando a aparecer nos navegadores! Temporal é um substituto para o objeto de knowledge inadequado. Ele permite que os programadores funcionem efetivamente com datas e horários.
  • Marginalia é um mecanismo de pesquisa de código aberto que prioriza resorts não comerciais.

Computação quântica

  • Microsoft criou um qubit topológico em um novo chip quântico. Enquanto seu chip atualmente possui apenas 8 qubits, a Microsoft afirma que pode ser escalada para milhões de qubits. Colocar tantos qubits em um chip ajudaria bastante a resolver o problema de mover dados quânticos entre os chips.
  • A startup canadense Xanadu construiu um computador quântico usando fotônica. Atualmente, possui 12 qubits, mas a empresa acredita que pode escalar para sistemas maiores.

Robótica

Devices

  • Retornos de seixos? Lembre -se do smartwatch de seixos de financiamento coletivo que estava disponível muito antes do relógio da Apple? Está voltando – talvez. E será hackeable.
  • Algo que todos precisamos: uma equipe de engenharia da Apple desenvolveu um Lâmpada de mesa acionada por IA. Não está disponível em uma loja da Apple perto de você.

Aprenda mais rápido. Cavar mais fundo. Veja mais longe.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *