O braço de IA da Sony Analysis ajudará a desenvolver um grande modelo de linguagem com a AI Singapore


O braço de IA da Sony Analysis ajudará a desenvolver um grande modelo de linguagem com a AI Singapore

devrimb/Getty Photos

A Sony Analysis fechou uma parceria para ajudar a testar e ajustar o modelo de inteligência synthetic (IA) do Southeast Asian Languages ​​in One Community (SEA-LION), com foco em línguas indianas.

O braço de IA da Sony Analysis trabalhará com AI Singapura (AISG) responsável pelo desenvolvimento de LEÃO-MARINHOpara preencher lacunas na garantia de que o modelo de grande linguagem (LLM) se destaque bem no cenário international, representando as populações e línguas da região. Os parceiros disse em uma declaração Na terça-feira, a colaboração de pesquisa envolverá LLMs sob o guarda-chuva SEA-LION, todos pré-treinados e com instrutores afinados especificamente em culturas e línguas do Sudeste Asiático.

O LLM de código aberto foi treinado em 981 bilhões de tokens de idioma, que o AISG outline como fragmentos de palavras criados a partir da quebra de texto durante o processo de tokenização. Esses fragmentos incluem 623 bilhões de tokens em inglês, 128 bilhões de tokens do Sudeste Asiático e 91 bilhões de tokens chineses.

Também: Perdido na tradução: chatbots de IA ainda são muito centrados na língua inglesa, segundo estudo de Stanford

A parceria implica que a Sony trabalhará em testes e suggestions sobre o modelo de IA, aproveitando a presença de pesquisa do fornecedor japonês na Índia e a experience no desenvolvimento de LLMs para idiomas indianos (incluindo o tâmil). Estima-se que o tâmil seja usado por 60 milhões a 85 milhões de pessoas globalmente, a maioria das quais está baseada na Índia e no Sudeste Asiático.

A Sony compartilhará as melhores práticas em desenvolvimento de LLM e metodologias de pesquisa, bem como a aplicação de sua pesquisa em geração de fala, análise de conteúdo e reconhecimento.

A integração do modelo SEA-LION AI com recursos da língua tâmil tem o potencial de impulsionar o desempenho de novos aplicativos, disse o diretor sênior de produtos de IA da AISG, Leslie Teo. Ele acrescentou que a agência de Cingapura também compartilhará seu conhecimento e melhores práticas no desenvolvimento de LLM.

Também: Líderes de IA são instados a integrar modelos de dados locais em prol da diversidade

IBM e Google estão entre outros participantes do setor atraídos para refinar o LLM regional, incluindo disponibilizá-lo para desenvolvedores criarem aplicativos de IA personalizados.

“O acesso a LLMs que abordam o cenário international de idioma e cultura tem sido uma barreira para impulsionar a pesquisa e desenvolver novas tecnologias que sejam representativas e equitativas para as populações globais que atendemos”, disse Hiroaki Kitano, presidente da Sony Analysis. “Diversidade e localização são forças vitais. No Sudeste Asiático especificamente, há mais de 1.000 idiomas diferentes falados pelos cidadãos da região. Isso diversidade linguística ressalta a importância de garantir que modelos e ferramentas de IA sejam projetados para atender às necessidades de todas as populações ao redor do mundo.”

Também: A transparência está extremamente ausente em meio ao crescente interesse pela IA

Fundada em abril de 2023, a Sony Analysis foca no desenvolvimento tecnológico que pode melhorar a criação de conteúdo e o engajamento dos fãs, incluindo nas áreas de IA, sensoriamento e espaços virtuais. Por exemplo, sua equipe de pesquisa de aprendizado profundo tem trabalhado em tecnologias que abrangem, entre outras, compressão de modelos e renderização neural, que espera poder ser integrada à ferramenta de desenvolvimento de GUI da Sony, Neural Community Console, e bibliotecas de código aberto Neural Community Libraries.

Essas tecnologias podem ser usadas em produtos eletrônicos alimentados por IA abrangendo vários setores, como jogos, filmes, música e video games, disse a Sony.

Sua unidade de entretenimento interativo registrou uma patente para um “aparelho de detecção de assédio” que inclui uma unidade de entrada construída para receber dados biométricos e com capacidade de gerar, com base em dados biométricos, dados emocionais associados aos usuários, de acordo com um Publicação de abril de 2024 na plataforma de busca PatentScope da Organização Mundial da Propriedade Intelectual.

Também: Novo padrão international visa construir segurança em torno de grandes modelos de linguagem

Com o sistema, a Sony espera ser capaz de detectar e mitigar comunicações entre indivíduos em jogos multijogador ou experiências de realidade digital que sejam maliciosas, como assédio. Aproveitando modelos de aprendizado de máquina e IA, o sistema pode detectar dados biométricos, como fala, e determinar o estado emocional de um jogador, por exemplo, por meio de sons como soluços e gritos. Eles podem ser usados ​​para identificar vítimas de assédio dentro do ambiente compartilhado, de acordo com o processo.

Em maio, o Sony Music Group divulgou uma declaração observando que as obras protegidas por direitos autorais de seus artistas, incluindo composições, letras e gravações de áudio, não devem ser copiadas e usadas para treinar modelos de IA, a menos que explicitamente autorizado.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *