Tendências de radar para assistir: fevereiro de 2025 – O’Reilly


No mês passado, a Deepseek lançou seu modelo de raciocínio R1 (agora aparentemente chamado DeepThink), com recursos semelhantes ao Openai O1. O que é importante na Deepseek não são seus resultados de referência; Existem vários modelos no mesmo nível que O1. O importante é que parece ter sido treinado com um décimo os recursos de modelos comparáveis. Jogar mais {hardware} em um problema raramente é a melhor maneira de obter bons resultados.

Inteligência synthetic

  • Antrópico adicionou um API de citações para Claude. As citações se formam diretamente no modelo. Ele permite que os usuários adicionem documentos ao contexto. Ao gerar uma resposta, Claude inclui citações que mostram exatamente quais partes dos documentos foram usadas no desenvolvimento da resposta.
  • Openi lançou uma prévia de pesquisa de Operadorseu concorrente do uso do computador da Anthrópica. Como o uso do computador, o operador é um agente de uso geral: pode usar um navegador para navegar na Net, trazer informações de volta e gerar novas ações para atender à solicitação do usuário.
  • Berkeley tem lançado Sky-T1-32b-PREVIED, um pequeno modelo de raciocínio que custou menos de US $ 450 para treinar. É baseado na instrução QWEN2.5-32B do Alibaba. O desempenho do Sky é semelhante ao OpenAI O1-Preview e está totalmente aberto: dados de treinamento, pesos, código e infraestrutura são todos de código aberto.
  • Deepseek lançou seu R1 Modelo de raciocínio, no qual seu modelo V3 foi baseado. O R1 possui desempenho equivalente ou superior ao OpenAI O1 e é significativamente mais barato. Deepseek também lançou vários Outros modelos derivados de R1incluindo vários modelos menores baseados em lhama e Qwen do Alibaba. Todos esses modelos têm código aberto e pesos.
  • O Chave para usar o Openai O1 Efetivamente é o contexto, não é inteligente solicitação. “Não escreva instruções, escreva resumos”; Dê todas as informações necessárias para resolver um problema.
  • A Openai anunciou uma nova técnica para treinar seus novos modelos de raciocínio para serem seguros. Alinhamento deliberativo Treina os modelos para raciocinar as próprias políticas de segurança, em vez de exigir que os seres humanos classificassem as respostas dos modelos.
  • Meta introduziu Seamlessm4tum modelo multimodal (fala e texto) projetado para tradução. Ele pode traduzir a fala para fala e o texto em fala para quase 100 linguagens de entrada e 35 linguagens de saída.
  • Antrópico recebeu Certificação ISO 42001. Esta certificação abrange a IA responsável e aborda processos de design e implantação de IA, transparência, teste e monitoramento e supervisão.
  • O Google lançou um artigo sobre uma nova arquitetura LLM chamada Titãs (também conhecido como Transformers 2.0). A principal vantagem dos Titãs é sua capacidade de dimensionar para janelas de contexto muito grandes. Com efeito, adiciona memória persistente de longo prazo ao modelo Transformers.
  • Chatgpt pode agora agende tarefas recorrentestornando -o mais como um assistente pessoal. As tarefas podem incluir gerar lembretes, agendar, resumir notícias e outras tarefas.
  • Sistemas de IA podem “pensar” usando uma variante da navalha de Occamque prioriza soluções mais simples para problemas.
  • Mistral lançou Codestral 25.01um modelo de idioma que é otimizado para geração de código. Ele reivindica proficiência em mais de 80 linguagens de programação. Esta nova versão é mais rápida, suporta uma janela de contexto maior e fornece melhores resultados de referência do que os modelos de tamanho semelhante.
  • Harvard’s Iniciativa de dados institucionais montou um grande conjunto de dados de obras sem direitos autorais digitalizadas para modelos de linguagem de treinamento. Atualmente, a coleção possui cerca de 1 milhão de livros; É significativamente maior que o conjunto de dados do Books3 que foi usado para treinar modelos anteriores.
  • O modelo PHI-4 da Microsoft é agora Disponível no rosto de abraçar e Ollama. É mais um modelo impressionante que pode ser executado em um laptop computer razoavelmente bem equipado.
  • 4m é uma estrutura de código aberto para o treinamento de modelos multimodais de IA.
  • Nvidia tem anunciado Dígitos do projetoum supercomputador pessoal para executar modelos de IA até 200B parâmetros localmente. O sistema vem com 128 GB de RAM. Eles estarão disponíveis em maio; O preço inicial é de US $ 3.000.
  • O2 (a empresa, não o número de versão do GPT qualificado) anunciou Margaridaum modelo de idioma próprio. Ele responde telefonemas fraudulentos em tempo actual, desperdiçando o tempo do scammer, se passando por uma pessoa idosa vulnerável.
  • Quick-llm é uma biblioteca de código aberto para treinar grandes modelos de idiomas. Ele pode escalar para executar qualquer coisa, de uma única GPU a grandes clusters e pode treinar modelos até (e exceder) parâmetros 70B.

Programação

  • O Puppet se junta ao grupo de antigos projetos de código aberto que possuem um garfo de código aberto: OpenVox. O OpenVox promete ser totalmente compatível com fantoche. O projeto está procurando patrocinadores.
  • Stratoshark é uma nova ferramenta para Analisando chamadas de sistema no Linux. É um companheiro do Wireshark, com uma interface de usuário semelhante projetada para ajudar os usuários a capturar chamadas de sistema e analisar o que estão fazendo.
  • Precisa escrever aplicativos para o Cray X-MP em seu porão? Você precisará de um compilador. Aqui está um que funciona com Linux e MacOS.
  • Sigstore é um projeto que simplifica a assinatura e gerenciamento digitalmente de componentes de software program de código aberto. Reduz o ônus de estabelecer proveniência para o software program que você desenvolveu, juntamente com a verificação da proveniência de dependências de software program que você usa.
  • Se você gerar mais código, haverá mais código para depurar e revisar. Dois terços dos desenvolvedores de grupos que usam IA estão gastando mais tempo depurando e resolvendo vulnerabilidades de segurança.
  • Você realmente precisa de um novo emulador de terminal? Fantasma está recebendo RAVE REVISTA. Vale a pena tentar. Forgejo é um software program de código aberto forja. É uma plataforma descentralizada para o desenvolvimento colaborativo de software program que inclui uma alternativa auto-hospedada ao GitHub.
  • Uma startup está construindo gêmeos digitais de cidades. Estes serão muito úteis para os planejadores da cidade – e possivelmente também para resposta a emergências.
  • Leptos é um novo estrutura da internet para ferrugem. Como Sycamore, outra estrutura da internet de ferrugem, o Leptos compila ferrugem à WebAssembly.
  • O Concurso Internacional de Código C Offado está de volta! (Você perdeu?) Para obter mais informações, siga @ioccc no mastodon (fosstodon.org).
  • Um motor de xadrez em 84.688 expressões regulares: É uma obra -prima regex. Como diz o autor, mais pessoas devem fazer coisas completamente inúteis.

Segurança

  • Os cibercriminosos estão distribuindo malware por meio Roblox mods. Os canais de comunicação Discord, Reddit, Github e outros canais de comunicação são usados ​​para atrair usuários para pacotes contendo malware.
  • Cloudflare mitigou com sucesso o O maior ataque de DDOs já visto: 5.6 Terabits/segundo da botnet mirai. Uma nova reviravolta importante: os ataques têm vida muito curta, impossibilitando a resposta humana.
  • O phishing nem sempre começa com um e-mail. Os cibercriminosos estão colocando Anúncios de pesquisa do Google que direcionam as vítimas a websites de phishing que roubam suas credenciais.
  • O FBI tem forçaram o malware plugx a excluir de mais de 4.200 computadores. Desde cerca de 2014, o Plugx tem sido usado pelo governo chinês para roubar dados das vítimas. Suspeita-se que a próxima versão do Plugx não tenha um comando “auto-delete”.
  • Um novo ataque de ransomware chamado Codefinger Encrypts AWS S3 baldes. O ataque usa a criptografia do lado do servidor da AWS (SSE) para gerar chaves criptográficas que a Amazon não armazena; Eles são conhecidos apenas pelo atacante.
  • Microsoft tem processado Um grupo de desenvolvedores sem nome (e desconhecidos) por comprometer contas de usuário legítimas e usar essas contas para gerar conteúdo prejudicial.
  • Um Certificado incorreto está fazendo com que o MacOS trate o Docker Desktop como malware, impedindo que ele inicie. O problema pode ser corrigido atualizando para o Docker 4.37.2.
  • Um ataque contra o mecanismo de simulação de transação de criptomoeda Traça as vítimas a aprovar as transações que retiram sua carteira de criptomoeda.
  • O Marca de confiança cibernética é uma certificação destinada a garantir os consumidores que os dispositivos que incorporam IA atendem a certos padrões estabelecidos pelo Instituto Nacional de Padrões e Tecnologia dos EUA (NIST) e pela Comissão Federal de Comunicações (FCC).
  • A Apple está descobrindo que os erros não são o único problema com a IA voltada para o consumidor; A empresa também está tendo problemas com resumos de e -mail e bate -papo que fazer com que as mensagens de spam e fraude pareçam legítimas.
  • Produtos de segurança baseados no medojuntamente com as práticas de vendas e advertising de segurança, são contraproducentes.

Net

  • Independentemente do futuro de Tiktok, Pixelded– Um aplicativo descentralizado para compartilhar fotos e vídeos – visita uma boa alternativa. Como Mastodon, Pixelded faz parte do Fediverse e é construído no protocolo Federated ActivityPub.
  • Mercator: extremo Permite que você coloque o Pólo Norte em qualquer lugar que desejar e desenha o mapa Mercator correspondente. Além de ser uma obra -prima da internet, mostra o quão distorcida é a projeção Mercator. Infelizmente, quase todos os nossos mapas ainda são baseados nisso.
  • Marimo Playgrounds são cadernos (como Jupyter) que são executados inteiramente no navegador usando o WebAssembly. Eles podem ser facilmente criados e compartilhados no Github ou em Marimo.App.
  • A maioria das organizações on-line tem algum tipo de acesso à API baseado na Net. Agora que a IA está na foto, APIs devem ser utilizáveis ​​por agentes de IA. Eles precisam ser devidamente documentados de maneira legível por máquina (por exemplo, com Openapi) e o mais uniforme possível.
  • Um novo Fork of the Flutter Missionchamado Rebanhopretende fornecer recursos e correções de bugs que os usuários queriam, mas que nunca entraram no lançamento.
  • Ruas é uma versão 3D do OpenStreetMap. Demora muito tempo para carregar e muitos dos rótulos não estão atualizados, mas é impressionante.
  • Qual é o futuro da internet? Se an online for uma fonte de dados para a IA, precisará obter muito mais simplesderramando megabytes de JavaScript e CSS a favor do texto.
  • Algo novo em Captchas: Play Ruína e matar pelo menos três monstros. Ele foi construído com IA pronta para a IA usando o V0 de Vercel e corre no navegador com WASM. Infelizmente, duvido que mantenha os bots fora por muito tempo.

Realidade digital

Computação quântica

  • Uma nova tecnologia de computação quântica permite que os íons presos se movam em torno de um chip de computação quântica. Isso permite que os desenvolvedores criem chips que suportam mais qubits com eficiência.
  • Um novo tipo de geladeira quântica torna possível Qubits legais a 22 milikelvin. Em temperaturas mais baixas, elas serão menos vulneráveis ​​a erros do ruído.

Robótica

  • UM mão robótica Foi desenvolvido que pode treinar pianistas para realizar movimentos muito difíceis de maneira mais eficaz.

Biologia

  • AI pode ser usada para afiar imagens biológicas que foram distorcidos pela luz que passa por camadas de tecido. No passado, esse problema period resolvido com óptica adaptativa cara.

Aprenda mais rápido. Cavar mais fundo. Veja mais longe.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *