

A JetBrains anunciou que seu código Conclusão LLM, Mellum, agora está disponível em Abraçando o rosto como um modelo de código aberto.
Segundo a empresa, Mellum é um “modelo focal”, o que significa que foi construído propositadamente para uma tarefa específica, em vez de tentar ser bom em tudo. “Ele foi projetado para fazer uma coisa muito bem: conclusão de código”, escreveu Anton Semenkin, gerente sênior de produtos da JetBrains, e Michelle Frost, advogada da IA da JetBrains, em um Postagem do weblog.
Os modelos focais tendem a ser mais baratos de correr do que os modelos gerais maiores, o que os torna mais acessíveis a equipes que não têm recursos para executar modelos grandes.
“Pense nisso como habilidades em forma de T-um conceito em que uma pessoa tem um amplo entendimento em muitos tópicos (a barra superior horizontal ou sua amplitude de conhecimento), mas uma profunda experiência em uma área específica (a haste ou profundidade vertical). Os modelos focais seguem a mesma idéia: eles não são construídos para lidar com tudo. Em vez disso, eles se especializam e se especializam em uma única tarefa em que se autora a verdade.
Atualmente, a Mellum suporta a conclusão do código para vários idiomas populares: Java, Kotlin, Python, Go, Php, C, C ++, C#, JavaScript, TypeScript, CSS, HTML, Rust, Ruby.
Há planos de transformar o Mellum em uma família de diferentes modelos focais, ideais para outras tarefas de codificação específicas, como a previsão de diff.
A versão atual do Mellum é mais excellent para pesquisadores de IA/ML que exploram o papel da IA no desenvolvimento de software program, ou engenheiros ou educadores de IA/ML como base para aprender a construir, ajustar e adaptar os modelos de idiomas específicos de domínio.
“Mellum não é uma solução plug-and-play. Ao libertá-la ao abraçar o rosto, estamos oferecendo a pesquisadores, educadores e equipes avançadas a oportunidade de explorar como um modelo construído para propósito funciona sob o capô”, escreveram os autores.