Tendências de radar para observar: julho de 2024 – O’Reilly


Qualquer coisa programável pode ter um LLM incorporado? Aparentemente sim. llama.ttf é uma fonte simples e antiga que se parece com Open Sans — você pode baixá-la e instalá-la. Não sabemos se isso é uma vulnerabilidade massiva ou uma maneira de incorporar IA em quase qualquer aplicativo baseado em texto. Provavelmente ambos.

Pode ser apenas uma coincidência, mas várias novas linguagens de programação surgiram no cenário no último mês ou dois. Por quê? Provavelmente não é uma reação contra a programação automatizada. (Um LLM obviamente não pode ser treinado para uma linguagem sem muito código-fonte público.)

Aprenda mais rápido. Vá mais fundo. Veja mais longe.

IA

  • Isso é loucura. lhama.ttf é uma fonte que incorpora um modelo de linguagem (pequeno) grande. A fonte em si pode fazer geração automática de texto. Ela depende do mecanismo de modelagem de fontes HarfBuzz, que usa Wasm. Ela funciona no Gimp; também pode funcionar no Chrome e no Firefox. Tudo roda localmente.
  • Os pesquisadores estão descobrindo que as conversas com uma IA pode ajudar a dissipar crenças em teorias da conspiração. (Este artigo observa que é preliminar e ainda não foi revisado por pares. Todos os dados da pesquisa serão publicados quando ela estiver concluída.)
  • O Laboratório de IA Podman é uma boa maneira para usuários Linux experimentarem executar IA localmente. Sem surpresa, o Podman é baseado em contêiner, o que simplifica a movimentação de modelos de um ambiente de desktop para um ambiente de produção.
  • Os pesquisadores têm desenvolvido um modelo baseado em BERT para detectar prompts LLM maliciosos que instruem o LLM a gerar websites ou e-mails de phishing.
  • Antrópico tem lançado a nova versão do seu modelo de linguagem de médio porte, Claude 3.5 Sonnet. Ele alega desempenho comparable ao GPT-4o e Gemini 1.5. Uma nova janela Artifacts permite interação com a saída do Claude.
  • E se personagens não-jogadores em jogos pudessem conversar com você e entre si? ​​E se a estrutura de um jogo se desenrolasse dinamicamente em resposta à jogada, em vez de ser roteirizada com antecedência? Isso é algo IA generativa poderia trazer para jogos.
  • Um sistema de IA foi treinado para contar flores. Essa habilidade tem aplicações importantes na agricultura: se você consegue contar as flores, consegue prever o rendimento das colheitas.
  • A Anthropic forneceu documentação sobre a construção de avaliações e casos de teste para Claude.
  • Meta desenvolveu Selo de áudioum sistema para marca d’água em conteúdo de áudio gerado por IA. É 90% a 100% confiável e pode identificar pequenos clipes inseridos em um arquivo maior. O AudioSeal é gratuito e está disponível no GitHub, embora o próprio Meta ainda não o esteja usando.
  • O modelo mais recente da Cohere, Command R, pode use várias ferramentas externas para responder a prompts. Ele é capaz de usar ferramentas multietapas, nas quais ele cria um plano para resolver o problema, usa APIs (descritas em um documento JSON) para acessar ferramentas externas e gera um resultado.
  • Um grande modelo de linguagem pode escrever comédia? Aparentemente não. As ideias não são originais, os modelos têm problemas com incongruência e surpresa, e não têm noção do arco mais longo de um diálogo.
  • Máquina dos sonhos de Luma é uma ferramenta de IA generativa impressionante para criar vídeos curtos a partir de um immediate de texto.
  • A NVIDIA tem anunciado um conjunto de modelos para gerar dados de treinamento sintéticos. O uso dos modelos é governado por um novo Contrato de licença de modelo abertoque especifica que os modelos podem ser usados ​​comercialmente, os modelos derivados podem ser distribuídos livremente e a NVIDIA não reivindica nenhuma propriedade sobre as saídas dos modelos.
  • Os detectores de IA, muitos dos quais apresentam taxas de erro muito elevadas, apesar das alegações dos fornecedores, estão a ser utilizados para detectar incorretamente escritores profissionais blackball.
  • Uma nova estratégia para fragmentando conteúdo para RAG está usando o BERT de frase (SBERT) para calcular incorporações para cada frase e, em seguida, usar a incorporação para detectar mudanças no tópico.
  • Se você estiver criando um aplicativo de IA com RAG, considere o uso de bancos de dados de gráficos (GráficoRAG) em vez de bancos de dados vetoriais. Os gráficos são mais difíceis de trabalhar, mas são melhores em fornecer contexto apropriado para responder a consultas complexas.
  • Experimental do Google Iluminar transforma artigos acadêmicos em discussões tipo entrevista que resumem os pontos importantes. Atualmente está em beta privado.
  • Ensaio de Anthropic sobre Personagem de Claude é um artigo bem pensado sobre como eles estão dando a Claude 3 traços de caráter e como os traços de caráter afetam a maneira como Claude interage com o mundo.
  • Vice-presidente de engenharia da Honeycomb sugere que a IA será mais útil no desenvolvimento de código front-end do que back-end e que os chats geralmente são uma interface de usuário ineficiente.
  • OpenAI e Anthropic têm pesquisa publicada na extração de características de seus GPT e Cláudio modelos. Isso representa um passo significativo em direção à interpretabilidade ou compreensão do porquê um modelo dá uma resposta específica a um immediate.
  • O que seu cachorro está tentando dizer? Um projeto de pesquisa está usando IA para decodificar vocalizações de cães.
  • Aqui está um olhar no modelo de linguagem baseado em transformador que a Apple está incorporando ao macOS. Ele é muito pequeno (aparentemente 34M parâmetros) e parece ser baseado em GPT-2 — claramente projetado para rodar em dispositivos como telefones sem drenar a bateria.
  • Códigostral é um novo modelo de linguagem da Mistral especializado em geração de código. Ele foi treinado em mais de 80 linguagens e alega produzir melhores resultados do que outros modelos de linguagem.
  • Modelos de linguagem podem criar esquemas de banco de dados, mas os esquemas raramente permanecem inalterados para sempre. Até que ponto os modelos de linguagem podem modificar um esquema?
  • A IA pode ajudar os pesquisadores? digitalizar cheiros? A digitalização funcionou bem para a visão e o som. O olfato ficou muito para trás.
  • A IA pode ser usada para melhorar a privacidade? Pesquisadores desenvolveram aplicações para removendo partes sensíveis das imagens e substituí-los por algo semelhante, mas diferente — uma espécie de Photoshop automatizado.
  • Usar gráficos de conhecimento no contexto do RAG faz sentido intuitivo. Em um comparação entre “GraphRAG” e “RAG tradicional”, GraphRag sai na frente porque o gráfico codifica relacionamentos entre os dados.

Programação

  • Brilho é um novo linguagem funcional type-safe. Ela compila para Erlang e JavaScript. Seu objetivo é permitir que desenvolvedores construam grandes sistemas concorrentes.
  • OpenTofu, o fork de código aberto do Terraform, agora tem criptografia de estadoum recurso muito solicitado que está na fila do Terraform há quase uma década.
  • Cotovia-estrela é uma pequena linguagem parecida com Python para descrever como construir código. Os princípios de design do Starlark incluem determinismo e segurança; executar um programa várias vezes dá resultados idênticos e não pode acessar a rede, o sistema de arquivos ou o relógio do sistema.
  • Um dos cocriadores do WebAssembly tem desenvolvido uma nova linguagem de programação chamada Virgílio. Ele foi projetado como uma linguagem de programação de sistemas, embora não tenha a intenção de competir com o Zig (seja lá o que isso signifique).
  • O Telescópio Espacial James Webb é um passo à frente para tecnologia digital twin. Um modelo digital do telescópio foi usado para coreografar sua automontagem no espaço sideral. O gêmeo continua monitorando o telescópio e prevendo os efeitos das atualizações de software program.
  • Mesopo é um Python muito leve estrutura para desenvolvimento rápido de aplicativos da internet. É bom para demonstrações, provavelmente não é bom para produção. Construído pelo Google, mas não suportado.
  • Portais de IA são como gateways de API, mas especializado para acessar as APIs de modelos de linguagem. Eles facilitam o monitoramento, a escolha de qual modelo atender a uma solicitação, o cache, a segurança e muitos outros recursos.
  • O último zine de Julia Evans (@b0rk), Como o Git funcionaé uma leitura obrigatória para qualquer um que não entenda Git. O que é quase todo mundo.
  • Os desenvolvedores de linguagem têm estado ocupados. Grão a linguagem foi projetada para compilação para WebAssembly. Foi inspirada em OCaml; correspondência de padrões é um recurso-chave.
  • VáFr é uma estrutura para construindo microsserviços em Go. Ele incorpora ferramentas para observabilidade e suporta o uso de muitas fontes de dados diferentes.
  • Infraestrutura do Código afirma que os requisitos de infraestrutura de um sistema podem ser inferidos a partir do próprio código e que uma especificação para a infraestrutura necessária pode ser gerada automaticamente.

Segurança

  • Embora não esteja claro o que está acontecendo, parece ter havido uma ataque à cadeia de suprimentos contra o serviço CDN Polyfill.io. A Polyfill alega que foi difamada e mudou para um novo nome de domínio. Especialistas em segurança aconselham cautela.
  • Uma nova vulnerabilidade crítica no produto MoveIT da Progress Software program está sendo explorada ativamente. Os invasores podem personificar qualquer usuário legítimo de SFTP, dando a eles a capacidade de copiar, excluir ou criar arquivos. Os invasores também podem obter hashes criptográficos para senhas de usuários.
  • Os EUA são proibindo vendas do Kasperskysoftware program antivírus da a partir de julho.
  • Malware Linux controlado por emojis enviados do Discord? Isso é criativo. O malware, que se espalha por meio de phishes, usa emojis para enviar comandos. Os emojis aparentemente escapam do software program de segurança que espera que os comandos sejam sequências de texto.
  • A novo tipo de phish usa o protocolo Home windows Search para baixar malware. Outro novo phish usa aplicativos internet progressivos (PWAs) para roubar credenciais.
  • Após críticas generalizadas ao seu recurso Recall para o Home windows 11 habilitado para IA, a Microsoft anunciado que seria desabilitado por padrão. O lançamento do Recall foi adiado; ele será entregue primeiro ao Home windows Insider Program, essencialmente um beta privado.
  • À medida que a importância da IA ​​cresceu, Abraçar o rosto virou alvo para agentes de ameaças. Mais recentemente, os invasores roubaram tokens de autorização de Espaços.

Rede

  • Cidade Sim no navegador com WebAssembly? Impressionante.
  • UIX é um novo estrutura de desenvolvimento internet full stack. Faz parte de uma maior Unidade projeto, que tem o objetivo ambicioso de desenvolver a próxima geração de web descentralizada.
  • A BBC Ventures é investindo em uma plataforma de streaming de vídeo 3D.
  • Ligação direta é uma abordagem para construir aplicações internet (especificamente, single-page functions ou SPAs) que envia HTML para encapsular dados complexos em vez de JSON. Seu objetivo é minimizar a necessidade de JavaScript.
  • Cobalto é uma plataforma muito leve para executar aplicativos criados a partir de HTML5, CSS e JavaScript. O Google, seu criador, menciona o YouTube como um aplicativo típico, mas suspeito que ele possa ser usado para trabalhos mais interessantes.
  • Adrian Holovaty de Fatia sonora incorporou a digitalização de música: você pode carregar um PDF ou uma foto de uma partitura musical, e o Soundslice irá analisá-la. Você pode então editar, reorganizar e reproduzir a partitura.

{Hardware}

  • Um padrão aberto para conectores? Isso é importante se você deseja um desempenho muito alto sem precisar licenciar designs proprietários.
  • Medidor de energia é uma ferramenta para medir a energia consumida por CPUs Intel. Pode ser útil nestes dias de aplicativos de IA que consomem muita energia, embora não possa levar em conta GPUs. Roda em Linux, mas é a maioria dos servidores do mundo.
  • A Mitsubishi construiu uma robô que resolve o cubo mágico em 0,305 segundos. O melhor tempo deles é de 0,204 segundos, mas, de acordo com o Guinness, isso não foi feito em condições adequadas.
  • Robôs salva-vidas estão em uso no Lago Michigan para ajudar pessoas que estão se afogando a permanecerem à tona até que um salva-vidas chegue.

Biologia

  • Neurociência de Precisão implantou com sucesso uma matriz de 4.096 eletrodos miniaturizados em um cérebro humano. Ao fazer isso, eles alcançaram maior resolução para atividade neuronal do que implantes anteriores, incluindo o da Neuralink.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *