Não obstante o anúncio do Anthropic de Claude 3,7 sonetos, o ritmo vertiginoso dos principais anúncios da IA parecia desacelerar até fevereiro. Isso nos deu algum tempo para analisar alguns outros tópicos. Duas postagens importantes sobre programação apareceram: “We Are Destroying Software program”, de Salvatore Sanfilippo, e o Slide Deck de Rob Pike, “On Bloat”. Eles são surpreendentemente semelhantes. Nem menciona a IA; Ambos abordam a questão de por que nosso {hardware} está ficando cada vez mais rápido, mas nossos aplicativos não são. Também observamos o retorno de Pebble, o primeiro relógio inteligente e uma lâmpada de mesa acionada pela AI da Apple Analysis, que parece ter vindo do logotipo da Pixar. Diversão, talvez, mas não procure isso nas lojas da Apple.
Inteligência synthetic
- Antrópico lançou Claude 3,7 soneto, o primeiro modelo de raciocínio da empresa. É um “modelo híbrido”; Você pode dizer se deseja ativar sua capacidade de raciocínio. Você também pode controlar seu “orçamento” ao pensar limitando o número de tokens que ele gera para o processo de raciocínio.
- O Enviornment de agente de computadores é uma plataforma para testes de agentes de crowdsourcing. Ele permite que qualquer pessoa execute um agente usando dois modelos diferentes de IA, observe o que o agente está fazendo e avalie os resultados. Os resultados estão resumidos em uma tabela de classificação; No momento, Claude 3,5 sonetos está no topo.
- O Google está desenvolvendo um “co-cientistaIsso sugere hipóteses para os cientistas investigarem. As hipóteses são baseadas nos objetivos, idéias e pesquisas anteriores do cientista. A empresa está procurando pesquisadores para ajudar nos testes.
- Github tem atualizado Modo de agente para copiloto. Agora ele irá iterar no código de buggy até fornecer resultados corretos e pode adicionar novas subtaretas ao authentic, se forem necessárias para atingir a meta do usuário.
- Open-R1 é um novo projeto Isso pretende criar uma reprodução totalmente aberta do Deepseek R1. Além de código e pesos, este projeto lançará todas as ferramentas e dados sintéticos usados para treinar o modelo.
- Moshi é um novo modelo de linguagem de conversação (fala a fala) que está ouvindo constantemente e pode lidar com interjeções como “uh huh” sem ficar confuso.
- Codinome Goose é um novo código aberto estrutura para Desenvolvimento de IA agêntica Aplicações. Ele usa o protocolo de contexto de modelo do Anthropic para se comunicar com sistemas que possuem dados e podem descobrir novas fontes de dados em tempo actual.
- A Universidade de Surrey estará construindo um Modelo de idioma para linguagem de sinais. Um foco será traduzir entre a linguagem falada e a linguagem de sinais. O objetivo é garantir que a comunidade surda não seja deixada para trás pela explosão das ferramentas de IA.
- Galileu é um conjunto de ferramentas agênticas para detectar quando um modelo de IA é alucinando. É particularmente importante para os sistemas agênticos, onde um erro de um agente leva ao mau comportamento por outros a jusante.
- Um grupo de pesquisadores lançado S1um modelo de raciocínio de 32b com desempenho próximo da arte. S1 custou apenas US $ 6 para treinar. Um pequeno conjunto de dados de treinamento (apenas 1.000 amostras de raciocínio) provaram que o modelo foi forçado a reservar um tempo additional para o raciocínio.
- Alguns pesquisadores publicados Como escalar seu modeloum livro sobre como escalar grandes modelos de idiomas. Aparentemente, o livro é documentação interna do Google DeepMind.
- Openai tem lançado O3-mini, um modelo de linguagem pequeno e econômico baseado em seu modelo de raciocínio (ainda não lançado) da O3.
- Antrópico tem implantado isso é Classificador Constitucional para testes adversários do público. O classificador é um sistema que protege os modelos de Claude dos jailbreaks e tenta fazer com que Claude responda a perguntas que não são permitidas. Os primeiros resultados parecem muito bons.
- O Lição para aprender com o Deepseek R1 é que, dado um bom modelo de fundação, é menos difícil do que muitos pensaram desenvolver um modelo de raciocínio. Nos próximos meses, espere muitas alternativas abertas.
- Openai introduziu DeePresearchum aplicativo baseado em seu modelo O3 que reivindica a capacidade de sintetizar grandes quantidades de informações e executar tarefas de pesquisa em várias etapas.
- Sam Altman reconheceu que o Openai está no “lado errado da históriaNo que diz respeito à IA de código aberto, mas também disse que abordar os problemas não period uma alta prioridade.
- Alibaba tem lançado QWEN2.5-MAXoutro modelo de linguagem grande com desempenho no mesmo nível que o GPT-4 e o Claude 3,5 sonetos. Pode ser acessado através Qwen Chat ou nuvem de Alibaba.
- Laboratório de Transformador é uma ferramenta para experimentar os modelos de treinamento, ajuste fino e programação LLM localmente. Ainda está instalando, mas parece o ollama em esteróides.
- Smolgpt é “uma implementação mínima de pytorch para treinar seu próprio pequeno LLM do zero”.
- Sim, a Microsoft está reclamando que o DeepSeek usou o OpenAI para gerar dados de treinamento sintético. Essas objeções não impediram de fazer Deepseek disponível no Azure.
- Dois compositores colaborou com o Google’s Gemini para criar O paradoxo gêmeoum trabalho para uma orquestra sinfônica clássica.
- Alibaba tem lançado dois “pontos de verificação” para seus modelos, Qwen2.5-7b-Instruct-1M e Qwen2.5-14b-Instruct-1M. Esses modelos têm grandes janelas de contexto de 1m-Token. A Alibaba também de código aberto sua estrutura de inferência, que a empresa afirma ser de três a sete vezes mais rápida.
- TinyZero Reproduz o R1 Zero da Deepseek, um modelo de raciocínio com parâmetros 3B. Treinamento TinyZero Price Below US $ 30. Você pode baixar o TinyZero, mas também pode fazer o seu por menos do que o custo de uma noite fora. Precisamos de modelos caros?
Programação
- Tanagram é promissor Um conjunto de ferramentas para ajudar os desenvolvedores a entender e trabalhar com bases de código complexas. Até agora, existem apenas demos, mas parece interessante.
- Harper Reed descreve Seu fluxo de trabalho para programar com IA. O desenvolvimento de um fluxo de trabalho é essencial para usar a IA de maneira eficaz, e Harper deu a descrição mais completa que já vimos.
- Como Linux, Rubi nos trilhos pode correr no navegador. Este hack usa WebAssembly.
- Linux inicialização dentro de um pdf em Chrome. As implementações em PDF suportam JavaScript; C pode ser compilado em um subconjunto de JavaScript (Asm.JS), o que significa que um emulador RISC-V pode ser compilado ao JavaScript e executado em um PDF no navegador, que então executa o Linux. Um hack incrível.
- Ocr4all Fornece software program de reconhecimento de caracteres ópticos de código aberto gratuito e aberto. Você deve precisar.
- Por que o software program não funciona mais rápido do que há 20 ou 30 anos, apesar dos computadores muito mais rápidos? Rob Pike tem algumas reflexões sobre controlando inchaço.
- Como o nome indica, Registros de decisão arquitetônica (ADRS) Seize uma decisão sobre a arquitetura de software program e o motivo da decisão. Com muita frequência, essas informações não são capturadas. É provável que se torne mais importante na period do desenvolvimento de software program assistido por AA.
- Jank é uma nova linguagem de programação de uso geral. É um dialeto de clojure que incorpora idéias de muitos outros idiomas, incluindo C ++ e ferrugem, e é construído sobre o LLVM.
- Aqui está um conjunto de padrões para a construção de tempo actual recursos em aplicativos.
- Salvatore “Antirez” Sanfilippo’s Submit, “Estamos destruindo o software program”É uma leitura obrigatória. (Não diz nada sobre a IA.) Começa “estamos destruindo o software program por não levar em consideração a complexidade”.
- Script é uma biblioteca GO que possibilita a programação semelhante a uma concha. Sua maior contribuição é a capacidade de criar tubos; Ele também possui funções que são semelhantes a Grep, encontre, cabeça, cauda e outros comandos de shell comuns.
Segurança
- Os atores de ameaças alinhados com a Rússia estão sinal de direcionamentoo aplicativo de mensagens seguras, com ataques de phishing que vinculam as contas dos usuários a dispositivos hostis. Um grupo envia códigos QR que Parece legítimo mas hyperlink para um dispositivo sob seu controle; Outro representa uma aplicação usada pelas forças armadas da Ucrânia. A melhor proteção é atualizar para a versão mais recente do sinal.
- Duas novas vulnerabilidades em OpenSsh foram encontrados. Expõe-se os servidores OpenSsh a ataques man-in-the-middle; O outro pode levar a ataques de negação de serviço. Uma atualização foi lançada; instale.
- Darkmind é um novo ataque contra modelos de linguagem de raciocínio. É possível criar aplicativos personalizados (como os da loja GPT) com “gatilhos ocultos” que modificam o processo de raciocínio.
- Um novo tipo de ataque da cadeia de suprimentos envolve obter AWS abandonado S3 Buckets que ainda contêm bibliotecas que são frequentemente baixadas. O novo proprietário pode inserir malware nas bibliotecas; O proprietário authentic, que abandonou o balde, não pode consertar as bibliotecas corrompidas.
- A segurança está bloqueando a adoção da IAparticularmente em indústrias fortemente regulamentadas. Isso é compreensível; Muitas das perguntas que fazemos sobre sistemas seguros não podem ser respondidas adequadamente para a IA.
- A equipe AI Crimson da Microsoft publicou Lições da Crimson Teaming 100 produtos generativos de IA. É uma leitura essencial para qualquer pessoa interessada em construir um sistema de IA seguro.
- AI está sendo acostumada a Envie solicitações falsas de recursos e relatórios de bug sobre projetos de código aberto. Muitos deles podem ser inadvertidos, mas, independentemente da causa, está gerando problemas para mantenedores de software program.
- Linux tem vários ferramentas Para detectar rootkits e outros malware. Chkrootkit e LMD (Detecção de malware Linux) vale sua atenção.
- Bandido de tempo é um novo jailbreak para os modelos GPT. O ataque faz com que o modelo perca o controle do passado, do presente e do futuro. Essencialmente, você pergunta ao GPT como alguém no passado faria algo que só pode ser feito no presente. Não está claro se esse ataque funciona em outros modelos.
- Quando o preço do bitcoin aumenta, o mesmo acontece com a frequência de Jacking de criptografia: Computadores de seqüestro para formar botnets de mineração de criptografia. Alega -se que, para cada dólar de criptografia extraído, a vítima incorre em US $ 53 em custos em nuvem.
- UM Novo backdoor para VPNs foi descoberto na natureza, dando aos atacantes acesso a redes corporativas. Esses backdoors permanecem inativos até serem desencadeados por um “pacote mágico” especialmente construído, tornando -os difíceis de detectar.
Net
- À medida que mais pessoas solicitam recomendações de produtos à IA, os profissionais de advertising and marketing precisarão otimizar a percepção do produto por modelos de idiomas. LLMO substitui website positioning? Otimizar para um LLM pode ser a próxima geração de website positioning.
- Esse artigo Diz a você como optar por não participar dos recursos Gemini no Gmail e em outros aplicativos do Google Workspace. É possível desativar Gêmeos seletivamente. Infelizmente, exige que você tenha acesso ao console do administrador.
- JavaScript Temporal O objeto está começando a aparecer nos navegadores! Temporal é um substituto para o objeto de knowledge inadequado. Ele permite que os programadores funcionem efetivamente com datas e horários.
- Marginalia é um mecanismo de pesquisa de código aberto que prioriza resorts não comerciais.
Computação quântica
- Microsoft criou um qubit topológico em um novo chip quântico. Enquanto seu chip atualmente possui apenas 8 qubits, a Microsoft afirma que pode ser escalada para milhões de qubits. Colocar tantos qubits em um chip ajudaria bastante a resolver o problema de mover dados quânticos entre os chips.
- A startup canadense Xanadu construiu um computador quântico usando fotônica. Atualmente, possui 12 qubits, mas a empresa acredita que pode escalar para sistemas maiores.
Robótica
Devices
- Retornos de seixos? Lembre -se do smartwatch de seixos de financiamento coletivo que estava disponível muito antes do relógio da Apple? Está voltando – talvez. E será hackeable.
- Algo que todos precisamos: uma equipe de engenharia da Apple desenvolveu um Lâmpada de mesa acionada por IA. Não está disponível em uma loja da Apple perto de você.