Tendências de radar a serem observadas: novembro de 2024 – O’Reilly


Outubro teve muitos lançamentos de modelos de idiomas. Os modelos de tamanho médio, e até mesmo os modelos pequenos, estão alcançando modelos de ponta como o GPT-4.5o em desempenho. Mas o lançamento que nos surpreendeu não foi um modelo de linguagem: foi a API de uso de computador de Claude. O uso do computador permite que você ensine Claude como usar um computador: como executar um aplicativo, clicar em botões e usar um shell ou editor. Tem muitos problemas, e a segurança não é o menor deles – mas está fadado a melhorar. Enviar capturas de tela para Claude para que ele possa calcular onde clicar é, na melhor das hipóteses, desajeitado, e sem dúvida existem soluções melhores (como usar ferramentas de acessibilidade). No entanto, o uso do computador nos dá um vislumbre de um futuro em que trabalharemos com agentes que podem planejar e executar operações complexas em várias etapas.

IA

  • Pequenos modelos de linguagem é um programa educacional que ensina crianças sobre probabilidade, inteligência synthetic e tópicos relacionados. É divertido e lúdico e pode permitir que as crianças construam seus próprios modelos simples.
  • Grafana e NVIDIA estão trabalhando em um modelo de linguagem grande para observabilidadeaparentemente dado o nome estranho LLo11yPop. O modelo visa responder questões de linguagem pure sobre o standing e desempenho do sistema com base em dados de telemetria.
  • Google é código aberto SynthID, um sistema para colocar marcas d’água em texto para que documentos gerados por IA possam ser rastreados até o LLM que os gerou. As marcas d’água não afetam a precisão ou a qualidade dos documentos gerados. As marcas d’água SynthID resistem a algumas adulterações, incluindo edição.
  • Mistral tem lançado dois novos modelos, Ministral 3B e Ministral 8B. Estes são modelos pequenos, projetados para funcionar em sistemas de “borda” com recursos limitados. Ao contrário de muitos dos pequenos modelos anteriores do Mistral, estes não são de código aberto.
  • Antrópico adicionou um “uso do computador” API para Claude. O uso do computador permite que o modelo assuma o controle do computador e o use para encontrar dados lendo a tela, clicando em botões e outras possibilidades e digitando. Atualmente está em beta.
  • Luar é um novo modelo de voz para texto de código aberto que foi otimizado para dispositivos pequenos e com recursos limitados. Ele afirma ter precisão equivalente ao Whisper, com velocidade cinco vezes maior.
  • Meta é liberando um conjunto de dados gratuito nomeado Materiais Abertos 2024 para ajudar os cientistas de materiais a descobrir novos materiais.
  • A Anthropic publicou alguns ferramentas por trabalhar com Claude no GitHub. Neste ponto, ferramentas para ajudar a analisar dados financeiros e construir agentes de suporte ao cliente estão disponíveis.
  • NVIDIA tem lançado silenciosamente Lhama-3.1-Nemotron-70B-Instruct-HFum modelo de linguagem que supera GPT-4o e Claude 3.5 em benchmarks. Este modelo é baseado no Llama de código aberto e é relativamente pequeno (parâmetros 70B).
  • NotebookLM empolgou a todos com sua capacidade de gerar podcasts. O Google deu um passo adiante ao adicionar ferramentas que dão aos usuários mais controle sobre o que os participantes do podcast digital dizem.
  • A alfabetização em dados é a nova habilidade de sobrevivência: Já sabemos disso há algum tempo, mas é muito fácil esquecer, principalmente na period da IA.
  • A Open Supply Initiative tem um “humilde” definição para IA de código aberto. A definição reconhece quatro categorias distintas de dados: abertos, públicos, obtidos e não compartilháveis.
  • O treinamento de modelos de IA exige grandes information facilities? PrimeIntellect é treinando um modelo 10B usando recursos distribuídos e contribuídos.
  • OpenAI publicou Enxameuma plataforma para construção de agentes de IA, no GitHub. Eles alertam que o Swarm é experimental e não responderá a pull requests. Sinta-se à vontade para participar do experimento.
  • OpenAI também lançou Telauma ferramenta interativa para escrever código e texto com GPT-4o. A tela é semelhante à de Claude Artefatos.
  • Dois dos recém-lançados Lhama 3.2 os modelos – 90B e 11B – são multimodais. O modelo 11B funcionará confortavelmente em um laptop computer. Meta também lançou o APIs de pilha de lamaum conjunto de APIs para ajudar os desenvolvedores a criar aplicativos generativos de IA.
  • OpenAI tem anunciado uma API pseudo-tempo actual. Seu objetivo é permitir a construção de aplicativos de voz realistas, incluindo a capacidade de interromper a IA no fluxo da conversa.
  • Os óculos com tecnologia de IA se tornarão o próximo dispositivo de consumo de grande sucesso? O protótipo Orion da Meta pode ser a interface de usuário matadora para IA. Não se trata de jogos; trata-se de perguntar à IA sobre as coisas que você vê. Agora, se eles só puderem ser fabricados a um preço decente.
  • Avatares de IA estão entrevistando candidatos a empregos. Isto não vai correr bem…
  • O Allen Institute desenvolveu um pequeno modelo de linguagem chamado Molmo que eles alegar tem desempenho equivalente ao GPT-4o.
  • Inteligência Humanauma organização fundada por Rumman Chowdhury, ofereceu um prêmio para desenvolvedores que criam um modelo de visão de IA que pode detectar imagens on-line baseadas em ódio.
  • Hoje em dia, não é surpresa que um computador possa jogar xadrez e outros jogos de tabuleiro. Mas tênis de mesa? Você pode preferir o vídeo para o papel.
  • O Família Qwen de modelos de linguagem, variando de parâmetros de 0,5B a 72B, está recebendo críticas impressionantes. Mesmo os maiores podem ser feitos para rodar em GPUs mais antigasnão apenas H100s e A100s.
  • Agora uma IA pode “provar” que é humana. Um modelo de visão computacional baseado em IA demonstrou a capacidade de derrotar O CAPTCHA mais recente do Google (reCAPTCHAv2) 100% do tempo.
  • A IA aberta agora está se expandindo acesso ao seu modo de voz avançado para mais usuários. O modo de voz avançado torna o ChatGPT verdadeiramente conversacional: você pode interrompê-lo no meio de uma frase e ele responde ao seu tom de voz.
  • Planejamento de movimento neural é uma técnica baseada em redes neurais que permite aos robôs planejar e executar tarefas em ambientes desconhecidos.

Programação

  • C++ seguro propõe extensões para a linguagem C++ para torná-la memória segura. Erros na segurança da memória são há muito tempo a maior fonte de vulnerabilidades de segurança.
  • Microsoft vê GenAIOps como uma “mudança de paradigma” para TI. Isso se tornará cada vez mais necessário à medida que o software program incorpora IA e as equipes de TI precisam se tornar especialistas em infraestrutura de IA. Um aspecto do GenAIOps será a coleta, curadoria e limpeza de conjuntos de dados.
  • Huly é uma plataforma de código aberto para gerenciamento de projetos.
  • Tipo é um novo sistema para escrever textos científicos (e outros). Possui capacidades equivalentes ao LaTeX, mas a sintaxe é muito mais simples, semelhante ao Markdown.
  • A Microsoft iniciou um projeto que tornará o Linux eBPF disponível no Home windows. No mundo Linux, o eBPF provou ser inestimável para ferramentas de observabilidade, segurança e conformidade. Home windows eBPF será compatível com bytecode com Linux.
  • Python 3.13 foi lançado. As mudanças mais importantes são um novo REPL que apresenta edição multilinha e suporte a cores; uma opção experimental para desabilitar o bloqueio world de intérprete (GIL); e um compilador experimental just-in-time.
  • Ziggy é uma nova linguagem para serialização de dados. Não é uma linguagem de programação de uso geral; é uma linguagem especializada para definir esquemas de dados com precisão e facilidade.
  • O novo da Microsoft A iniciativa de segurança em primeiro lugar está vinculada aos seus esforços de engenharia de plataforma. A engenharia da plataforma limita o número de ferramentas que os desenvolvedores precisam usar, o que, por sua vez, reduz a quantidade de código que precisa ser protegido e mantido.
  • A CNCF Central de artefatos é um fonte para configurações nativas da nuvem, plug-ins e outros softwares para construir infraestrutura nativa da nuvem. Não é um repositório semelhante ao GitHub; ele se vincula às fontes dos artefatos, em vez de armazená-los.
  • Quer correr Linux em um Intel 4004uma CPU de 1971? A inicialização levará quase 5 dias. O que é mais surpreendente é que ele está rodando em um emulador que roda no 4004.

Segurança

  • Não é nenhuma surpresa que a injeção imediata funcione bem com a incrível API de uso de computador da Anthropic. A documentação da Anthropic alerta sobre muitas vulnerabilidades. Portanto, também não é surpreendente que alguém tenha ido em frente e tentei. Não pare de experimentar, mas tenha cuidado.
  • Improvisador é um ataque contra grandes modelos de linguagem que usa um immediate malicioso para forçar o modelo a exfiltrar dados de bate-papos anteriores.
  • Uma importante fonte de vulnerabilidades de segurança é o código que inclui segredos (nomes de contas e senhas, certificados, and so forth.). HashiCorp Radar do cofre verifica software program, incluindo repositórios e solicitações pull, para detectar segredos que foram expostos.
  • Os pesquisadores de segurança da Mandiant descoberto que 70% das vulnerabilidades exploradas no ano passado eram de dia zero, ou seja, novas vulnerabilidades que não haviam sido relatadas anteriormente. Uma vez descobertas, as vulnerabilidades são quase imediatamente transformadas em armas e usadas como ataques.
  • OpenAI tem desligar as contas de atores de ameaças que usam GPT para diversas atividades, incluindo desenvolvimento de malware, geração e propagação de informações incorretas e phishing. Seria surpreendente se abusos semelhantes não ocorressem com outros modelos.
  • As últimas atualizações de segurança do GitLab endereço uma vulnerabilidade que permite que invasores acionem pipelines de CI/CD em qualquer ramificação de um repositório.
  • Os alunos têm conectado Óculos inteligentes Ray-Ban da Meta para um web site invasivo de busca de imagens. Eles então usam modelos de linguagem para reunir dados de vários bancos de dados que contêm informações pessoais, como endereços.
  • A Cloudflare bloqueou uma série de ataques distribuídos de negação de serviço (DDoS), incluindo um com um taxa de pico de 3,8 terabits por segundoo maior já registrado.
  • Em revisões de incidentesnão discuta itens de ação em resposta ao incidente. A revisão do incidente trata de aprendizado e compreensão; falar sobre soluções irá atrapalhar tudo. As soluções sempre poderão ser discutidas posteriormente e serão melhores se forem baseadas em um entendimento firme.
  • Há muito sabemos que os requisitos para alteração de senhas eram uma má prática. NIST é agora propondo regras isso eliminaria os requisitos de composição de senha, como uma letra maiúscula, um número e um caractere em um alfabeto não latino.
  • UM ataque de injeção imediata contra a memória de longo prazo da GPT permite que o invasor envie todas as entradas e saídas de um usuário para um servidor arbitrário. Este ataque é persistente; permanece na memória de longo prazo do GPT. Neste ponto, foi parcialmente remediado.
  • A Kaspersky, que está encerrando as operações nos EUA, excluiu seu software program do computador dos usuários dos EUA e instalado UltraAV do Grupo Pango e (em alguns casos) UltraVPN sem a permissão dos usuários. O comportamento da Kaspersky levanta a questão: quando um fornecedor de antimalware se transforma em malware?

Rede

  • Vídeos do XOXO 2024 foram postado. Molly White e Erin Kissane são particularmente recomendadas.
  • Precisamos de mais um framework internet React? Os desenvolvedores de Um acho que sim. Um deles promete ser simples, teimoso e priorizar o native.
  • Tom Coates tem anunciado a formação do Fundação Internet Socialuma organização dedicada a ajudar redes federadas a crescer de maneira saudável.
  • Problemas no mundo WordPress: WordPress.org tem bloqueado Motor WPum importante provedor de hospedagem para usuários do WordPress, de acessar seus recursos. O drama segue, aumenta e se torna cada vez mais merciless.

{Hardware}

Biologia

Aprenda mais rápido. Vá mais fundo. Veja mais longe.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *