Google DeepMind revelou Alfa evolveum agente de codificação evolutivo projetado para descobrir autonomamente novos algoritmos e soluções científicas. Apresentado no artigo intitulado ““AlphaEvolve: um agente de codificação para descoberta científica e algorítmica” Esta pesquisa representa um passo basic para Inteligência Geral Synthetic (AGI) e até Superintelligência Synthetic (ASI). Em vez de depender de conjuntos de dados estáticos de ajuste fino ou marcados por humanos, a AlphaEvolve segue um caminho totalmente diferente-um que se concentra em criatividade autônoma, inovação algorítmica e auto-aperfeiçoamento contínuo.
No coração da alfa-evolve está um oleoduto evolutivo independente alimentado por Modelos de idiomas grandes (LLMS). Este pipeline não gera apenas saídas – ele muda, avalia, seleciona e melhora o código através das gerações. O AlphaEvolve começa com um programa inicial e o refina iterativamente, introduzindo alterações cuidadosamente estruturadas.
Essas mudanças assumem a forma de diferenças geradas por LLM-modificações de código sugeridas por um modelo de idioma com base em exemplos anteriores e instruções explícitas. Um ‘diff’ na engenharia de software program refere -se à diferença entre duas versões de um arquivo, normalmente destacando linhas a serem removidas ou substituídas e novas linhas a serem adicionadas. No AlphaEvolve, o LLM gera essas diferenças analisando o programa atual e proporcitando pequenas edições – adquirindo uma função, otimizando um loop ou alterando um hiperparâmetro – baseado em um immediate que inclui métricas de desempenho e edições prévias bem -sucedidas.
Cada programa modificado é então testado usando avaliadores automatizados adaptados à tarefa. Os candidatos mais eficazes são armazenados, referenciados e recombinados como inspiração para iterações futuras. Com o tempo, esse loop evolutivo leva ao surgimento de algoritmos cada vez mais sofisticados – geralmente superando os projetados por especialistas humanos.
Compreendendo a ciência por trás do AlphaEvolve
Na sua essência, o AlphaEvolve é construído sobre os princípios de Computação evolutiva– Um subcampo de inteligência synthetic inspirada na evolução biológica. O sistema começa com uma implementação básica de código, que trata como um “organismo” inicial. Através de gerações, o AlphaVolve modifica esse código-intoduzindo variações ou “mutações”-e avalia a aptidão de cada variação usando uma função de pontuação bem definida. As variantes de melhor desempenho sobrevivem e servem como modelos para a próxima geração.
Este loop evolutivo é coordenado por:
- Amostragem imediata: Construções do AlphaEvolve Prompts selecionando e incorporando amostras de código anteriormente bem-sucedidas, métricas de desempenho e instruções específicas de tarefas.
- Mutação e proposta de código: O sistema usa uma mistura de LLMs poderosos – Flash e Professional PRO – para gerar modificações específicas na base de código atual na forma de diferenças.
- Mecanismo de avaliação: Uma função de avaliação automatizada avalia o desempenho de cada candidato executando -o e retornando as pontuações escalares.
- Banco de dados e controlador: Um controlador distribuído orquestra esse loop, armazenando resulta em um banco de dados evolutivo e equilibrando a exploração com a exploração por meio de mecanismos como o mapa-elite.
Esse processo evolutivo automatizado e rico em suggestions difere radicalmente das técnicas padrão de ajuste fino. Ele capacita a AlphaVolve a gerar soluções novas, de alto desempenho e às vezes contra-intuitivas-pressionando o limite do que o aprendizado de máquina pode alcançar autonomamente.
Comparando o alfa -evolve ao rlHF
Para apreciar a inovação da AlphaEvolve, é essential compará -la com Aprendizagem de reforço com o suggestions humano (RLHF)uma abordagem dominante usada para ajustar modelos de linguagem grandes.
No RLHF, as preferências humanas são usadas para treinar um modelo de recompensa, que orienta o processo de aprendizado de um LLM by way of Aprendizagem de reforço Algoritmos como Otimização de política proximal (PPO). O RLHF melhora o alinhamento e a utilidade dos modelos, mas requer um amplo envolvimento humano para gerar dados de suggestions e normalmente opera em um regime estático e de ajuste fino.
Alphavolve, em contraste:
- Take away o suggestions humano do loop a favor dos avaliadores executáveis da máquina.
- Apoia o aprendizado contínuo por meio de seleção evolutiva.
- Explora espaços de solução muito mais amplos devido a mutações estocásticas e execução assíncrona.
- Pode gerar soluções que não estão apenas alinhadas, mas romance e cientificamente significativo.
Onde o comportamento de tunes finos RLHF, alfavolve descobre e inventa. Essa distinção é basic ao considerar futuras trajetórias em relação à AGI: o alfa -evolve não apenas faz melhores previsões – encontra novos caminhos para a verdade.
Aplicações e avanços
1. Descoberta algorítmica e avanços matemáticos
A AlphaEvolve demonstrou sua capacidade de descobertas inovadoras em problemas algorítmicos principais. Mais notavelmente, descobriu um novo algoritmo para multiplicar duas matrizes com valor complexo 4 × 4 usando apenas 48 multiplicações escalares-o resultado de 49 multiplicações de Strassen em 1969 e quebra um teto teórico de 56 anos. A AlphaEvolve conseguiu isso por meio de técnicas avançadas de decomposição do tensor que evoluíram sobre muitas iterações, superando várias abordagens de última geração.
Além da multiplicação da matriz, a AlphaEvolve fez contribuições substanciais para a pesquisa matemática. Foi avaliado em mais de 50 problemas abertos em campos como combinatórios, teoria dos números e geometria. Ele correspondeu aos resultados mais conhecidos em aproximadamente 75% dos casos e os excedeu em cerca de 20%. Esses sucessos incluíram melhorias no problema mínimo de sobreposição da ERDőS, uma solução mais densa para o problema do número de beijos em 11 dimensões e configurações de embalagem geométricas mais eficientes. Esses resultados destacam sua capacidade de atuar como um explorador matemático autônomo – refinando, iterando e evoluindo soluções cada vez mais ótimas sem intervenção humana.
2. Otimização na pilha de computação do Google
A AlphaEvolve também forneceu melhorias tangíveis de desempenho em toda a infraestrutura do Google:
- Em programação de knowledge heartdescobriu uma nova heurística que melhorou a colocação de cargos, recuperando 0,7% dos recursos de computação previamente encalhados.
- Para Os grãos de treinamento de GêmeosA AlphaEvolve desenvolveu uma melhor estratégia de telha para multiplicação de matriz, produzindo uma aceleração de 23% do kernel e uma redução geral de 1% no tempo de treinamento.
- Em Projeto de circuito TPUidentificou uma simplificação à lógica aritmética no RTL (nível de transferência de registro), verificado pelos engenheiros e incluído em chips de TPU de próxima geração.
- Também otimizado Código de Flashattion gerado pelo compilador Ao editar representações intermediárias do XLA, cortando o tempo de inferência nas GPUs em 32%.
Juntos, esses resultados validam a capacidade da AlphaEvolve de operar em vários níveis de abstração-desde a matemática simbólica até a otimização de {hardware} de baixo nível-e ofereça ganhos de desempenho no mundo actual.
- Programação evolutiva: Um paradigma da IA usando mutação, seleção e herança para refinar iterativamente as soluções.
- Superotimização de código: A pesquisa automatizada pela implementação mais eficiente de uma função – geralmente produz melhorias surpreendentes e contra -intuitivas.
- Meta Immediate Evolution: AlphaEvolve não evoluirá apenas o código; Ele também evolui como comunica instruções ao LLMS-abordando a auto-refinamento do processo de codificação.
- Perda de discretização: Um termo de regularização incentivando saídas a se alinhar com valores meio inteiros ou inteiros, críticos para a clareza matemática e simbólica.
- Perda de alucinação: Um mecanismo para injetar aleatoriedade em soluções intermediárias, incentivando a exploração e evitando mínimos locais.
- Algoritmo de mapa-elites: Um tipo de algoritmo de diversidade de qualidade que mantém uma população diversificada de soluções de alto desempenho nas dimensões dos recursos-abordando a inovação robusta.
Implicações para AGI e ASI
O AlphaEvolve é mais do que um otimizador – é um vislumbre de um futuro em que agentes inteligentes podem demonstrar autonomia criativa. A capacidade do sistema de formular problemas abstratos e projetar suas próprias abordagens para resolvê -los representa um passo significativo em direção à inteligência geral synthetic. Isso vai além da previsão de dados: envolve raciocínio estruturado, formação de estratégia e adaptação ao suggestions – marcas de comportamento inteligente.
Sua capacidade de gerar e refinar as hipóteses iterativamente também sinaliza uma evolução na forma como as máquinas aprendem. Ao contrário de modelos que requerem extenso treinamento supervisionadoO AlphaEvolve se melhora através de um loop de experimentação e avaliação. Essa forma dinâmica de inteligência permite navegar em espaços problemáticos complexos, descartar soluções fracas e elevar as mais fortes sem a supervisão humana direta.
Ao executar e validar suas próprias idéias, a Alphavolve funciona como teórica e experimentalista. Ele vai além de executar tarefas predefinidas e para o domínio da descoberta, simulando um processo científico autônomo. Cada melhora proposta é testada, comparada e re-integrada-permitindo um refinamento contínuo com base em resultados reais, e não nos objetivos estáticos.
Talvez o mais notavelmente, o AlphaEvolve seja um exemplo inicial de auto-aperfeiçoamento recursivo-onde um sistema de IA não apenas aprende, mas aprimora os componentes de si mesmo. Em vários casos, a Alphavolve melhorou a infraestrutura de treinamento que suporta seus próprios modelos de fundação. Embora ainda seja limitado pelas arquiteturas atuais, esse recurso estabelece um precedente. Com mais problemas emoldurados em ambientes avaliáveis, o AlphaEvolve pode escalar em direção a um comportamento cada vez mais sofisticado e auto-otimista-uma característica basic da superinteligência synthetic (ASI).
Limitações e trajetória futura
A limitação atual da AlphaEvolve é sua dependência de funções de avaliação automatizadas. Isso limita sua utilidade a problemas que podem ser formalizados matematicamente ou algoritmicamente. Ainda não pode operar significativamente em domínios que requerem entendimento humano tácito, julgamento subjetivo ou experimentação física.
No entanto, as direções futuras incluem:
- Integração da avaliação híbrida: combinando o raciocínio simbólico com preferências humanas e críticas em linguagem pure.
- Implantação em ambientes de simulação, permitindo a experimentação científica incorporada.
- Destilação de saídas evoluídas nos LLMs de base, criando modelos de fundação mais capazes e com eficiência de amostra.
Essas trajetórias apontam para sistemas cada vez mais agênticos capazes de resolver problemas autônomos e de alto risco.
Conclusão
O AlphaEvolve é um passo profundo – não apenas na ferramenta de IA, mas em nossa compreensão da própria inteligência da máquina. Ao fundir a pesquisa evolutiva com o raciocínio e o suggestions do LLM, redefine o que as máquinas podem descobrir autonomamente. É um sinal precoce, mas significativo, que os sistemas auto-improvantes capazes de pensamento científico actual não são mais teóricos.
Olhando para o futuro, a arquitetura subjacente ao alfa evolve pode ser aplicada recursivamente a si mesma: evoluindo seus próprios avaliadores, melhorando a lógica da mutação, refinando as funções de pontuação e otimizando os dutos de treinamento subjacentes para os modelos depende. Esse loop de otimização recursivo representa um mecanismo técnico para bootstrapping em direção à AGI, onde o sistema não apenas conclui tarefas, mas melhora a própria infraestrutura que permite seu aprendizado e raciocínio.
Com o tempo, à medida que a alfa -evolve escala em domínios mais complexos e abstratos – e à medida que a intervenção humana no processo diminui -, pode exibir ganhos de inteligência acelerando. Esse ciclo auto-reforçador de melhoria iterativa, aplicado não apenas a problemas externos, mas interiormente à sua própria estrutura algorítmica, é um componente teórico-chave do AGI e todos os benefícios que isso poderia fornecer à sociedade. Com sua mistura de criatividade, autonomia e recursão, o alfa -evolve pode ser lembrado não apenas como um produto de DeepMindmas como um plano para as primeiras mentes artificiais verdadeiramente gerais e auto-evolutivas.