Tendências de radar para observar: agosto de 2024 – O’Reilly


Julho foi um grande mês para lançamentos de modelos: há novos modelos grandes da Mistral e Meta, modelos multilíngues menores da Mistral e DeepL, outro modelo da Mistral especializado em geração de código e uma versão pequena do GPT-4o. O mundo da segurança viu outro desastre na cadeia de suprimentos de software program quando a CrowdStrike lançou uma atualização de software program ruim que desabilitou muitas máquinas Home windows em todo o mundo. Embora o lançamento da CrowdStrike não tenha sido “hostil”, estritamente falando, ele demonstra que não há diferença actual entre um ataque hostil ou um bug que desabilita sua infraestrutura de TI. Também estamos vendo um aumento no tráfego de malware, juntamente com relatórios de vulnerabilidade falsos no CVE.

Inteligência synthetic

  • do Google AlphaProof e Alpha Geometry resolveu quatro dos seis problemas da Olimpíada de Matemática, uma efficiency que teria rendido uma medalha de prata em uma competição actual. Isso é de longe o melhor que uma IA já conseguiu. No entanto, foi significativamente mais lento do que os humanos.
  • Mistral lançou Mistral Grande 2um modelo de 123 bilhões de parâmetros que (como outros modelos) alega desempenho semelhante ao GPT-4o. É particularmente forte na geração de código. Mistral também destaca suas capacidades multilíngues. O Massive 2 está disponível em Abraçando o Rosto.
  • Fb/Meta tem lançado Llama 3.1, um modelo de 405 bilhões de parâmetros que alega desempenho superior ao GPT-4 e Claude 3.5 Sonnet (pelo menos em benchmarks). É semiaberto: código-fonte e pesos estão disponíveis, mas não dados de treinamento, e há restrições quanto ao seu uso.
  • O Google desenvolveu novas técnicas para prever o clima que combinam IA e modelagem física tradicional. O novo modelo produz previsões de longo prazo mais precisas e reduz o consumo de energia.
  • É um bom dia para liberar modelos. Mistral’s NeMo é um pequeno modelo de linguagem multilíngue de código aberto. Ele tem uma grande janela de contexto (128K) e tem bom desempenho em inglês, francês, alemão, espanhol, italiano, português, chinês, japonês, coreano, árabe e hindi.
  • GPT-4o Miniuma versão pequena do carro-chefe da OpenAI, GPT-4o, já está disponível. O desempenho do Mini supera o GPT-3.5 Turbo e é muito mais barato por token. A OpenAI também afirma que o GPT é resistente a jailbreaks e injeção rápida. Especialistas em segurança discordo.
  • O mais recente modelo de linguagem de grande porte do DeepL, que é treinado para se especializar em tradução, supera Google Translate e GPT-4 para tarefas de tradução.
  • Mistral lançou Codestral Mambaum novo modelo para geração de código que utiliza o novo Mamba arquitetura em vez de Transformers. O Mamba é significativamente mais rápido que os Transformers e escala linearmente com o tamanho da entrada.
  • RTNetum novo tipo de rede neural, aparece para tomar decisões da mesma forma que um humano faria.
  • Andrej Karpathy reproduz GPT-2 (o modelo completo de 1,6B parâmetros) em 24 horas por menos de US$ 700.
  • Uma startup chamada Ganho de texto construiu um modelo de linguagem que detecta discurso de ódio em todas as 24 línguas da União Europeia.
  • Maggie Appleton apresenta um excelente argumento sobre o papel da IA ​​na viabilização de “desenvolvedores descalços”: Programadores não profissionais que resolvem problemas reais e importantes que não estão na escala necessária para interessar a indústria de software program.
  • A Microsoft lançou GráficoRAG sobre GitHub. GraphRAG é um conjunto de ferramentas para geração de recuperação aumentada (RAG) que usa tecnologia de gráficos em vez de incorporações vetoriais para armazenar e recuperar documentos.
  • Com a devida orientação, grandes modelos de linguagem são capazes de detectar imagens deep pretend quase tão bem quanto software program personalizado. Os LLMs também podem dizer por que acreditam que uma imagem é falsa.
  • Figma, a ferramenta de design colaborativo on-line, introduziu IA para designers. As ferramentas são para buscar ideias, explorar diferentes direções e automatizar tarefas repetitivas. Esses recursos estão atualmente em beta e são gratuitos para todos os usuários até o ultimate do ano.
  • A Toys “R” Us criou um comercial que foi amplamente gerado por SORAIA de geração de vídeo da OpenAI.
  • Projetos Claude adiciona aos recursos do Anthropic. Ele permite que você carregue documentos e outros dados que são compartilhados em todos os chats associados ao projeto. Você pode compartilhar projetos com outras pessoas da sua equipe. (Somente planos Group e Professional.)
  • Este é o fim da GPU? Pesquisadores têm desenvolvido uma maneira de treinar modelos de linguagem sem multiplicação de matrizes (MatMul), exigindo assim muito menos energia. Seus modelos também exigem menos memória e têm desempenho comparable aos modelos treinados com MatMul.

Programação

  • Inrupt, uma empresa que comercializa a construção de software program em ambiente aberto Sólido protocolo, anunciou um carteira de dados para armazenar e compartilhar dados pessoais com segurança.
  • O Jogo de cartas Unix Pipe deveria ter existido há muito tempo!
  • eBPFque em breve será suportado pelo Home windows, fornece um recurso de execução de kernel seguro. Se estivesse disponível, teria prevenido os travamentos do CrowdStrike.
  • PythonMacaco permite Programas Python para executar código JavaScript, e vice-versa. Também dá ao Python a habilidade de executar módulos WebAssembly (Wasm).
  • 1 JPM (1 Java Challenge Supervisor) apresenta uma abordagem diferente para gerenciamento de construct. É um único arquivo de código-fonte Java, que você edita para refletir as dependências do seu projeto e outras personalizações. É uma alternativa interessante ao amplamente usado e odiado Maven.
  • Um artigo acadêmico discute padrões de design para aplicações de baixa latência em C++. Embora se concentre na negociação de alta frequência, as ideias neste artigo são, sem dúvida, úteis para muitos tipos de aplicações.
  • O Princípios Wiki é uma ótima fonte de informação e discussão sobre princípios de design de software program. Parece ser novo; ajude-o a crescer!
  • Julia Evans (@b0̷rk) dá alguns bons lembretes de por que o controle de tarefas do shell é útil—e não menos importante, encerrar um programa que não responde ao CTRL-C.
  • Marimo é um pocket book Python que roda inteiramente no navegador usando Wasm e Pyodide. Elementos do pocket book, incluindo elementos da interface do usuário, rodam automaticamente sempre que você os modifica ou faz interface com eles.

Segurança

  • O princípio do menor privilégio no controle de acesso é essential, mas, na prática, raramente é bem implementado. A IA pode fazer um trabalho melhor? de determinar quem deve acessar o quê e quando?
  • UM atualização ruim do CrowdStrike causou o travamento de muitos sistemas Home windows, causando sérias interrupções de serviço para companhias aéreas, hospitais e outras organizações. A segurança da cadeia de suprimentos não é apenas sobre código aberto; fornecedores comerciais também são um problema.
  • Atualização de 2024 do relatório de segurança de aplicativos da Cloudflare afirma que está vendo um aumento substancial no tráfego malicioso, que agora é de aproximadamente 7% de todo o tráfego. O tráfego de bots é um grande contribuidor.
  • Uma análise de um ataque à cadeia de fornecimento de software program mostra como código malicioso está escondido em imagens aparentemente normais. A engenharia desses ataques é cada vez mais sofisticada.
  • Raio de explosão é um novo ataque man-in-the-middle contra o protocolo RADIUS amplamente usado para autenticação, autorização e contabilidade. Entre outras coisas, o RADIUS é usado para autenticação por VPNs, ISPs e Wi-Fi.
  • Ente Autor é um autenticador de código aberto que fornece 2FA, backups criptografados na nuvem e sincronização entre plataformas. Sua criptografia foi auditada externamente.
  • Um recém-descoberto vulnerabilidade no OpenSSH permite execução remota de código não autenticado. Se você não está se mantendo atualizado sobre patches, é hora de começar.
  • O sistema CVE, que relata e arquiva vulnerabilidades de segurança, tem sido cada vez mais utilizado para relatórios de vulnerabilidade falsos. Alguns desses erros são de boa-fé, mas um número crescente vem de caçadores de recompensas e outras pessoas que tentam enriquecer seus currículos.
  • Hiperlinks sequestráveis são um problema. Esses hyperlinks têm URLs com erros de ortografia, URLs de espaço reservado para websites que ainda não existem e muito mais. Esses erros frequentemente não são corrigidos antes do web site entrar no ar. Qualquer um que descubra esses hyperlinks pode registrar seu nome de domínio e construir um web site hostil.
  • Carga de caracol é um ataque surpreendente contra a privacidade on-line. Depois que um usuário baixa o malware — que não faz nada abertamente hostil — o SnailLoad monitora a latência da web. Pequenas variações na latência são usadas como assinaturas para detectar qual mídia o usuário está usando.

Rede

  • O Google está abandonando seu plano de eliminar o suporte a cookies de terceiros no Chrome. Em vez disso, haverá controles configuráveis ​​pelo usuário para uso de cookies. Enquanto os defensores da privacidade se opõem ao abandono do plano de eliminar cookies, é justo relatar que os defensores da privacidade também se opuseram às alternativas propostas pelo Google.
  • O Corridor da Vergonha tem um catálogo de padrões escuros que os internet designers usam para enganar ou manipular usuários. Seja você um desenvolvedor internet ou um usuário, é uma boa ideia se familiarizar com os tipos de abusos que existem por aí.
  • WebVM é uma emulação digital do Linux em execução no navegador. É baseado em uma camada de emulação x86 escrita em WebAssembly.
  • Transferir Pensamento é uma plataforma de código aberto para desenvolvendo WebXR (VR, AR, qualquer outro tipo de R) experiências.
  • O Navegador Joaninha projeto está recebendo muita atenção. É uma tentativa de construir um navegador da internet compatível com os padrões completamente do zero, sem depender de código do Google ou de outros fornecedores. Uma versão alfa não é esperada antes de 2026.
  • Mordida de lua é a segunda nova linguagem projetada especificamente para atingir o WebAssembly. Ela é inspirada no Rust, mas projetada para ser uma boa combinação para a semântica do Wasm.

Computação Quântica

  • A PsiQuantum, uma startup de computação quântica, está planejando construir uma computador quântico de milhões de qubits dentro de 10 anos. Diferentemente de outras equipes quânticas, que se concentraram em construir sistemas pequenos, a PsiQuantum está pulando diretamente para um computador que é capaz de trabalho útil.
  • Não é um computador quântico pessoal, mas sim o Quokka é um emulador de computador quântico pessoal com 30 qubits tolerantes a falhas. É uma plataforma para aprender como programar computadores quânticos úteis antes de obtermos a coisa actual.

Robótica

  • Um cão robótico com aspiradores de pó em seus pés pode ser usado para limpar praias.
  • Treinando robôs humanoides para dançar pode torná-los melhores em trabalhar com humanos. Eles se tornam mais capazes de aprender novos movimentos e gestos.
  • Os pesquisadores estão trabalhando em robôs que aprenda ouvindo. Embora o áudio forneça pistas importantes para muitas tarefas que os robôs são solicitados a executar, ele raramente é usado como fonte de dados de treinamento.

{Hardware}

  • Tenstorrent desenvolveu um novo conjunto de chips de IA que são muito mais baratos que os da NVIDIA. Eles estão disponíveis como placas PCIe ou como componentes de estações de trabalho completas.

Aprenda mais rápido. Vá mais fundo. Veja mais longe.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *