O ajuste fino do modelo Claude 3 Haiku da Anthropic no Amazon Bedrock já está disponível para o público geral


O ajuste fino do modelo Claude 3 Haiku da Anthropic no Amazon Bedrock já está disponível para o público geral

Hoje, estamos anunciando a disponibilidade geral do ajuste fino para Modelo Claude 3 Haiku da Anthropic no Amazon Bedrock na região da AWS Oeste dos EUA (Oregon). O Amazon Bedrock é o único serviço totalmente gerenciado que oferece a capacidade de ajustar os modelos Claude. Agora você pode ajustar e personalizar o modelo Claude 3 Haiku com seu próprio conjunto de dados de treinamento específico para tarefas para aumentar a precisão, qualidade e consistência do modelo para adaptá-lo ainda mais IA generativa para o seu negócio.

O ajuste fino é uma técnica em que um modelo de linguagem grande (LLM) pré-treinado é personalizado para uma tarefa específica, atualizando os pesos e ajustando hiperparâmetros como taxa de aprendizagem e tamanho do lote para obter resultados ideais.

Modelo Claude 3 Haiku da Antrópico é o modelo mais rápido e compacto da família de modelos Claude 3. O ajuste fino do Claude 3 Haiku oferece vantagens significativas para as empresas:

  • Personalização – Você pode personalizar modelos que se destacam em áreas cruciais para o seu negócio em comparação com modelos mais gerais, codificando o conhecimento da empresa e do domínio.
  • Desempenho especializado – Você pode gerar resultados de maior qualidade e criar experiências de usuário exclusivas que refletem as informações, marca, produtos de propriedade da sua empresa e muito mais.
  • Otimização específica de tarefa – Você pode melhorar o desempenho de ações específicas de domínio, como classificação, interações com APIs personalizadas ou interpretação de dados específicos do setor.
  • Segurança de dados – Você pode fazer ajustes finos com tranquilidade em seu ambiente seguro da AWS. O Amazon Bedrock faz uma cópia separada do modelo básico que só pode ser acessado por você e treina essa cópia privada do modelo.

Agora você pode otimizar o desempenho para casos de uso de negócios específicos, fornecendo dados rotulados específicos de domínio para ajustar o modelo Claude 3 Haiku no Amazon Bedrock.

No início de 2024, começamos a envolver os clientes com uma equipe de especialistas do Centro de inovação em IA generativa da AWS para ajudar a ajustar os modelos Claude da Anthropic com suas fontes de dados proprietárias. Tenho o prazer de compartilhar que agora você pode ajustar o modelo Claude 3 Haiku da Anthropic no Amazon Bedrock diretamente no Console Amazon Bedrock.

Comece com o ajuste fino do modelo Claude 3 Haiku da Anthropic no Amazon Bedrock
Demonstrarei como ajustar facilmente o modelo Claude 3 Haiku no Amazon Bedrock. Para saber mais sobre o fluxo de trabalho de ajuste fino em detalhes, visite a postagem do weblog AWS Machine Studying, Ajuste Claude 3 Haiku da Anthropic no Amazon Bedrock para aumentar a precisão e a qualidade do modelo.

Para criar um trabalho simples de ajuste fino no Console Amazon Bedrockvá para o Modelos de fundação seção no painel de navegação e selecione Modelos personalizados. No Modelos seção, selecione o Personalizar modelo botão e selecione Criar trabalho de ajuste fino.

Em seguida, escolha o modelo que deseja personalizar com seus próprios dados, dê um nome ao modelo resultante e, opcionalmente, adicione chaves de criptografia e quaisquer tags para associar ao modelo no arquivo Detalhes do modelo seção. Insira um nome para o trabalho e, opcionalmente, adicione tags para o trabalho no campo Configuração do trabalho seção.

Você pode selecionar o native do Amazon S3 do arquivo do conjunto de dados de treinamento e, se aplicável, o arquivo do conjunto de dados de validação na caixa Dados de entrada seção.

Cada conjunto de dados pode ser criado usando um Linhas JSON (JSONL) arquivo com várias linhas JSON usando o formato de mensagens de uma ou várias voltas. Cada linha JSON é uma amostra contendo um system e mensagem, uma série de message objetos.

Preparei algumas das informações mais recentes sobre Modelo Claude 3.5 Sonnet da Anthropic no Amazon Bedrock. Para saber mais, visite Put together os conjuntos de dados na documentação do Amazon Bedrock.

{"system": "You might be an useful assistant.","messages":({"function": "person", "content material": "What’s the most recent fashions to assist Amazon Bedrock"},{"function": "assistant", "content material": "Amazon Bedrock is a totally managed service that assist Anthropic’s Claude 3 Sonnet, Haiku, and Opus fashions and the most recent Claud 3.5 Sonnet mannequin."})}
{"system": "You might be an useful assistant.","messages":({"function": "person", "content material": "How lengthy context window of Claude 3.5?"},{"function": "assistant", "content material": "Anthropic's Claude 3 fashions have a 200,000 token context window enabling you to relay a big quantity of knowledge to Claude. This interprets to roughly 150,000 phrases, or over 500 pages of fabric."})}
{"system": "You might be an useful assistant.","messages":({"function": "person", "content material": "Is Claude 3.5 obtainable in Bedrock?"},{"function": "assistant", "content material": "Anthropic’s most clever and superior mannequin, Claude 3.5 Sonnet, demonstrates distinctive capabilities throughout a various vary of duties and evaluations whereas additionally outperforming Claude 3 Opus."})}

No Hiperparâmetros seção, insira valores para hiperparâmetros para usar no treinamento, como épocas, tamanho do lote e multiplicador de taxa de aprendizagem. Se você incluiu um conjunto de dados de validação, poderá ativar Parada antecipadauma técnica usada para evitar overfitting e interromper o processo de treinamento quando a perda de validação para de melhorar. Você pode definir um limite de parada antecipada e um valor de paciência.

Você também pode selecionar o native de saída onde o Amazon Bedrock deve salvar a saída do trabalho no arquivo Dados de saída seção. Escolha um AWS Id and Entry Administration (IAM) função de serviço personalizada com as permissões apropriadas no arquivo Acesso ao serviço seção. Para saber mais, consulte Crie uma função de serviço para personalização do modelo na documentação do Amazon Bedrock.

Por fim, escolha Criar trabalho de ajuste fino e espere que seu trabalho de ajuste fino comece.

Você pode acompanhar seu progresso ou interrompê-lo no Empregos guia no Modelos personalizados seção.

Após a conclusão de um trabalho de personalização de modelo, você poderá analisar os resultados do processo de treinamento observando os arquivos na saída Serviço de armazenamento simples da Amazon (Amazon S3) pasta que você especificou quando enviou o trabalho ou pode visualizar detalhes sobre o modelo.

Antes de usar um modelo customizado, você precisa adquirir Taxa de transferência provisionada para Amazon Bedrock e, em seguida, use o modelo provisionado resultante para inferência. Ao adquirir o rendimento provisionado, você pode selecionar um termo de compromisso, escolher um número de unidades modelo e ver os custos estimados por hora, diariamente e mensalmente. Para saber mais sobre o preço do modelo personalizado para o modelo Claude 3 Haiku, visite Preços da Amazon Bedrock.

Agora você pode testar seu modelo personalizado no playground do console. Eu escolho meu modelo personalizado e pergunto se o modelo Claude 3.5 Sonnet da Anthropic está disponível no Amazon Bedrock.

Recebo a resposta:

Sure. You need to use Anthropic’s most clever and superior mannequin, Claude 3.5 Sonnet within the Amazon Bedrock. You possibly can reveal distinctive capabilities throughout a various vary of duties and evaluations whereas additionally outperforming Claude 3 Opus.

Você pode concluir este trabalho usando APIs da AWS, SDKs da AWSou Interface de linha de comando da AWS (AWS CLI). Para saber mais sobre como usar a AWS CLI, visite Amostras de código para personalização de modelo na documentação da AWS.

Se você estiver usando o Jupyter Pocket book, visite o Repositório GitHub e siga um guia prático para modelos personalizados. Para construir uma operação em nível de produção, recomendo a leitura Simplifique a criação e implantação de modelos personalizados para Amazon Bedrock com taxa de transferência provisionada usando Terraform no weblog de aprendizado de máquina da AWS.

Conjuntos de dados e parâmetros
Ao ajustar o Claude 3 Haiku, a primeira coisa que você deve fazer é examinar seus conjuntos de dados. Existem dois conjuntos de dados envolvidos no treinamento do Haiku: o conjunto de dados de treinamento e o conjunto de dados de validação. Existem parâmetros específicos que você deve seguir para que seu treinamento seja bem-sucedido, que são descritos na tabela a seguir.

Dados de treinamentoDados de validação
Formato de arquivoJSONL
Tamanho do arquivo<= 10 GB<= 1 GB
Contagem de linhas32 – 10.000 linhas32 – 1.000 linhas
Soma de Treinamento + Validação <= 10.000 linhas
Limite de token<32.000 tokens por entrada
Palavras-chave reservadasEvite ter “nHuman:” ou “nAssistant:” em prompts

Ao preparar os conjuntos de dados, comece com um conjunto de dados pequeno de alta qualidade e itere com base nos resultados do ajuste. Você pode considerar o uso de modelos maiores da Anthropic, como Claude 3 Opus ou Claude 3.5 Sonnet, para ajudar a refinar e melhorar seus dados de treinamento. Você também pode usá-los para gerar dados de treinamento para ajustar o modelo Claude 3 Haiku, o que pode ser muito eficaz se os modelos maiores já tiverem um bom desempenho na tarefa desejada.

Para obter mais orientações sobre como selecionar os hiperparâmetros adequados e preparar os conjuntos de dados, leia a postagem do weblog AWS Machine Studying, Melhores práticas e lições para ajustar o Claude 3 Haiku da Anthropic no Amazon Bedrock.

Vídeo de demonstração
Confira este vídeo de demonstração aprofundado para obter um passo a passo que o ajudará a começar a ajustar o modelo Claude 3 Haiku da Anthropic no Amazon Bedrock.

Agora disponível
O ajuste fino do modelo Claude 3 Haiku da Anthropic no Amazon Bedrock agora está disponível na região da AWS Oeste dos EUA (Oregon); verifique o lista completa de regiões para atualizações futuras. Para saber mais, visite Modelos personalizados na documentação do Amazon Bedrock.

Experimente o ajuste fino do modelo Claude 3 Haiku no Console Amazon Bedrock hoje e envie suggestions para AWS re:Put up para Amazon Bedrock ou por meio de seus contatos habituais do AWS Assist.

Estou ansioso para ver o que você construirá quando colocar essa nova tecnologia para trabalhar em seu negócio.

Channy



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *