O obtain: Sycophantic LLMS e o IA Hype Index -itstec.com.br. All rights reserved.

Esta é a edição de hoje deO obtainAssim,Nosso boletim informativo durante a semana que fornece uma dose diária do que está acontecendo no mundo da tecnologia.

Este benchmark usou o Aita do Reddit para testar o quanto os modelos de IA sugam

Em abril, o OpenAI anunciou que estava revertindo uma atualização para o seu modelo GPT-4O que tornou muito as respostas do ChatGPT às consultas do usuário.

Um modelo de IA que age de uma maneira excessivamente agradável e lisonjeira é mais do que apenas irritante. Isso poderia reforçar as crenças incorretas dos usuários, enganar as pessoas e espalhar informações erradas que podem ser perigosas – um risco explicit ao aumentar o número de jovens usando o ChatGPT como consultor de vida. E como é difícil detectar a bajulação, pode passar despercebida até que um modelo ou atualização já tenha sido implantado.

Um novo benchmark chamado Elephant que mede as tendências bajuladoras dos principais modelos de IA poderia ajudar as empresas a evitar esses problemas no futuro. Mas apenas saber quando os modelos são Sycofantic não é suficiente; Você precisa ser capaz de fazer algo a respeito. E isso é mais complicado. Leia a história completa.

– Rhiannon Williams

O índice de hype da IA

Separar a realidade da IA da ficção aumentada nem sempre é fácil. É por isso que criamos o índice de hype da IA-um resumo simples e de tudo o que você precisa saber sobre o estado da indústria. Dê uma olhada na edição deste mês do índice aqui.

As leituras obrigatórias

Pentei a Web para encontrar histórias mais divertidas/importantes/assustadoras/fascinantes de hoje.

1 Anduril está em parceria com a Meta para construir um sistema de armas avançado
Os fones de ouvido VR da Eagleeye melhorarão a audição e a visão dos soldados. (WSJ $)
+ Palmer Luckey quer transformar “combatentes de guerra em tecnomâncias”. (TechCrunch)
+ Luckey e Mark Zuckerberg enterraram o machado, então. (Insider $)
+ Palmer Luckey no futuro da realidade mista do Pentágono. (MIT Expertise Overview)

2 Uma nova lei do Texas exige que as lojas de aplicativos verifiquem as idades dos usuários
Está seguindo os passos de Utah, que aprovaram um projeto de lei semelhante em março. (NYT $)
+ A Apple adiantou a lei. (CNN)

3 O que acontece com Doge agora?
Ele perdeu seu líder e um dos principais tenentes dentro do espaço de uma semana. (WSJ $)
+ A partida de Musk levanta questões sobre quanta poder ela usará sem ele. (O guardião)
+ A aquisição tecnológica da DOGE ameaça a segurança e a estabilidade de nossos dados críticos. (MIT Expertise Overview)

4 As ambições da NASA de um pouso na lua de 2027 parecem menos propensas
Ele precisa de naves estelares da SpaceX, que continua explodindo. (WP $)
+ Existe uma alternativa viável? (Novo cientista $)

5 alunos estão usando a IA para gerar imagens nuas uma da outra
É um problema grave e crescente para o qual ninguém tem uma solução. (404 Mídia)

6 Visão geral do Google AI não sabe em que ano é
Um ano após sua introdução, o recurso ainda está cometendo erros óbvios. (Conectado $)
+ A nova pesquisa movida à IA do Google não é adequada para lidar nem de consultas básicas. (NYT $)
+ A empresa está empurrando a IA para tudo. Vai pagar? (Vox)
+ Por que a visão geral da IA do Google errou as coisas. (MIT Expertise Overview)

7 Abraçando o rosto criou dois robôs humanóides
As máquinas são de código aberto, o que significa que qualquer pessoa pode criar software program para elas. (TechCrunch)

8 Um aplicativo de codificação de vibração in style tem uma grande falha de segurança
Apesar de ser notificado sobre isso meses atrás. (Semafor)
+ Qualquer programa de codificação de IA que atenda aos amadores enfrenta o mesmo problema. (A informação $)
+ O que é a codificação do vibe, exatamente? (MIT Expertise Overview)

9 vídeos gerados pela IA estão se tornando muito mais realistas
Mas não quando se trata de representar a ginástica. (ARS Technica)

10 Esta tatuagem eletrônica mede seus níveis de estresse
Considere um anel de humor para o seu rosto. (Espectro IEEE)

Citação do dia

“Acho que finalmente estamos vendo a Apple sendo arrastada para a enviornment de segurança infantil chutando e gritando.”

– Sarah Gardner, CEO da Iniciativa de Calor Coletivo de Segurança Infantil, diz The Washington Put up Por que a nova lei da App Retailer do Texas pode sinalizar um ponto de virada para a Apple.

Mais uma coisa

Os algoritmos de flutuação de casas estão chegando ao seu bairro

Quando Michael Maxson encontrou sua casa de sonho em Nevada, não period de propriedade de uma pessoa, mas de uma empresa de tecnologia, Zillow. Quando ele foi dar uma olhada na propriedade, no entanto, ele a descobriu danificada por um enorme vazamento de água. Apesar de se oferecer para lidar com os reparos dispendiosos, Maxson descobriu que a casa já havia sido vendida para outra família, pelo mesmo preço que ele havia oferecido.

Durante esse período, a Zillow perdeu mais de US $ 420 milhões em três meses de compra de casas irregulares e vendas não lucrativas, levando os analistas a questionar se todo o modelo orientado pela tecnologia é realmente viável. Para o resto de nós, permanece uma questão maior: a chegada do Silício Tech Tech aponta para um futuro melhor para a habitação ou uma interrupção da indústria para o medo? Leia a história completa.

—Matthew Ponsford

Ainda podemos ter coisas boas

Um lugar para conforto, diversão e distração para iluminar o seu dia. (Tem alguma idéia? Me mande uma linha ou Skeet para mim.)

+ A Videogame de Ultramarathon em tempo actual de 100 milhas Isso dura em qualquer lugar de até 27 horas é tão divertido quanto parece.
+ Aqui está como glitter comestível poderia ajudar a salvar o humilde rubão de água da extinção.
+ Limpeza enorme estátuas não é para os fracos de coração ($)
+ Quando um professor de flauta não é um flautista? Quando ele é um denunciante.

O obtain: Sycophantic LLMS e o IA Hype Index

Deixe um comentário Cancelar resposta

usando fotografia drone para conservação marinha

Aquisição Quantum Programs FERNRIDE – DRONELIFE

Avanço de nanozimas metálicas para biossensor multimodal multiplexado no diagnóstico precoce de doenças

Melhorando a precisão nos cálculos do múon g-2 – Physics World

Mudanças de energia Exciton em heteroestruturas WS2-Grafeno

Transporte térmico em materiais bidimensionais deformados mecanicamente e estruturas projetadas com suas aplicações

Celular supera Wi-Fi na maioria dos aeroportos dos EUA: relatório Ookla

O que saber sobre redes de transporte em 2026

GPT‑5.2 no Microsoft Foundry: IA empresarial reinventada

Amazon S3 Storage Lens adiciona métricas de desempenho, suporte para bilhões de prefixos e exportação para tabelas S3

Um guia para compreender as tolerâncias da sua impressora 3D

A IA pode aprender a linguagem da biologia para reimaginar a medicina? | Weblog do Microsoft Sign