A partir de hoje, você pode usar três novos modelos de texto para imagem do Estabilidade IA em Base rochosa da Amazônia: Secure Picture Extremely, Secure Diffusion 3 Giant e Secure Picture Core. Esses modelos melhoram muito o desempenho em prompts multiassunto, qualidade de imagem e tipografia e podem ser usados para gerar rapidamente visuais de alta qualidade para uma ampla gama de casos de uso em advertising, publicidade, mídia, entretenimento, varejo e muito mais.
Esses modelos se destacam na produção de imagens com fotorrealismo impressionante, ostentando detalhes, cores e iluminação excepcionais, abordando desafios comuns como renderizar mãos e rostos realistas. A compreensão avançada de prompts dos modelos permite que eles interpretem instruções complexas envolvendo raciocínio espacial, composição e estilo.
Os três novos modelos de IA de estabilidade disponíveis no Amazon Bedrock abrangem diferentes casos de uso:
Imagem Estável Extremely – Produz saídas fotorrealistas da mais alta qualidade, perfeitas para mídia impressa profissional e aplicações de grande formato. O Secure Picture Extremely se destaca na renderização de detalhes e realismo excepcionais.
Difusão Estável 3 Grande – Atinge um equilíbrio entre velocidade de geração e qualidade de saída. Perfect para criar ativos digitais de alto quantity e alta qualidade, como websites, boletins informativos e materiais de advertising.
Núcleo de Imagem Estável – Otimizado para geração rápida e acessível de imagens, ótimo para iterar rapidamente conceitos durante a ideação.
Esta tabela resume as principais características do modelo:
Características | Imagem Estável Extremely | Difusão Estável 3 Grande | Núcleo de Imagem Estável |
---|---|---|---|
Parâmetros | 16 bilhões | 8 bilhões | 2,6 bilhões |
Entrada | Texto | Texto ou imagem | Texto |
Tipografia | Feito sob medida para exibição em grande escala | Feito sob medida para exibição em grande escala | Versatilidade e legibilidade em diferentes tamanhos e aplicações |
Visible estética | Fotorealista saída de imagem | Altamente realista com maior atenção aos detalhes | Boa renderização; não tão detalhista |
Uma das principais melhorias do Secure Picture Extremely e do Secure Diffusion 3 Giant em comparação com o Secure Diffusion XL (SDXL) é a qualidade do texto nas imagens geradas, com menos erros de ortografia e tipografia graças ao seu inovador Transformador de difusão arquitetura, que implementa dois conjuntos separados de pesos para imagem e texto, mas permite o fluxo de informações entre as duas modalidades.
Aqui estão algumas imagens criadas com esses modelos.
Imagem Estável Extremely – Incitar: foto, realista, uma mulher sentada em um campo observando uma pipa voar no céu, céu tempestuoso, altamente detalhada, arte conceitual, intrincada, composição profissional.
Difusão Estável 3 Grande – Immediate: cIlustração em estilo ômico, detetive parado sob um poste de luz, cidade noir, vestindo um sobretudo, chapéu fedora, escuro e chuvoso, letreiros de neon, reflexos no pavimento molhado, iluminação detalhada e sombria.
Núcleo de Imagem Estável – Incitar: renderização 3D profissional de um tênis branco e laranja, flutuando no centro, pairando, flutuando, alta qualidade, fotorrealista.
Casos de uso para os novos modelos de IA de estabilidade no Amazon Bedrock
Os modelos de texto para imagem oferecem potencial transformador para empresas em vários setores e podem otimizar significativamente os fluxos de trabalho criativos em departamentos de advertising e publicidade, permitindo a geração rápida de visuais de alta qualidade para campanhas, conteúdo de mídia social e mockups de produtos. Ao agilizar o processo criativo, as empresas podem responder mais rapidamente às tendências de mercado e reduzir o tempo de lançamento no mercado para novas iniciativas. Além disso, esses modelos podem aprimorar as sessões de brainstorming, fornecendo representações visuais instantâneas de conceitos que podem estimular mais inovação.
Para empresas de e-commerce, imagens geradas por IA podem ajudar a criar vitrines de produtos diversas e materiais de advertising personalizados em escala. No reino da experiência do usuário e design de interface, essas ferramentas podem produzir rapidamente wireframes e protótipos, acelerando o processo de iteração do design. A adoção de modelos de texto para imagem pode levar a economias de custo significativas, aumento de produtividade e uma vantagem competitiva na comunicação visible em várias funções de negócios.
Aqui estão alguns exemplos de casos de uso em diferentes setores:
Publicidade e Advertising and marketing
- Secure Picture Extremely para publicidade de marcas de luxo e vitrines de produtos fotorrealistas
- Difusão estável 3 Grande para imagens de advertising de produtos de alta qualidade e campanhas impressas
- Use o Secure Picture Core para testes A/B rápidos de conceitos visuais para anúncios de mídia social
Comércio eletrônico
- Secure Picture Extremely para personalização de produtos de alta qualidade e itens feitos sob encomenda
- Difusão estável 3 Grande para a maioria dos visuais de produtos em um website de comércio eletrônico
- Secure Picture Core para gerar rapidamente imagens de produtos e manter as listagens atualizadas
Mídia e Entretenimento
- Secure Picture Extremely para artes-chave ultra-realistas, materiais de advertising e visuais de jogos
- Difusão estável 3 Grande para texturas de ambiente, arte de personagens e ativos no jogo
- Núcleo de imagem estável para prototipagem rápida e exploração de arte conceitual
Agora, vamos ver esses novos modelos em ação, primeiro usando o Console de gerenciamento da AWSentão com o Interface de linha de comando da AWS (AWS CLI) e SDKs da AWS.
Usando os novos modelos de IA de estabilidade no console Amazon Bedrock
No Console Amazon Bedrockeu escolho Acesso ao modelo do painel de navegação para permitir o acesso aos três novos modelos no Estabilidade IA seção.
Agora que tenho acesso, escolho Imagem no Parques infantis seção do painel de navegação. Para o modelo, eu escolho Estabilidade IA e Imagem Estável Extremely.
Conforme solicitado, eu digito:
A stylized image of a cute outdated steampunk robotic with in its fingers an indication written in chalk that claims "Secure Picture Extremely in Amazon Bedrock".
Deixo todas as outras opções com seus valores padrão e escolho Correr. Depois de alguns segundos, recebo o que pedi. Aqui está a imagem:
Usando o Secure Picture Extremely com a AWS CLI
Enquanto ainda estou no console Parque de diversões de imagensescolho os três pequenos pontos no canto da janela do playground e então Exibir solicitação de API. Dessa forma, posso ver o Interface de linha de comando da AWS (AWS CLI) comando equivalente ao que acabei de fazer no console:
Para usar o Secure Picture Core ou o Secure Diffusion 3 Giant, posso substituir o ID do modelo.
O comando anterior gera a imagem em Base64 formato dentro de um objeto JSON em um arquivo de texto.
Para obter a imagem com um único comando, escrevo o arquivo JSON de saída na saída padrão e uso o JQ-e ferramenta para extrair a imagem codificada para que ela possa ser decodificada em tempo actual. A saída é escrita no img.png
arquivo. Aqui está o comando completo:
Usando o Secure Picture Extremely com SDKs da AWS
Veja como você pode usar o Secure Picture Extremely com o SDK da AWS para Python (Boto3). Este aplicativo simples solicita interativamente um immediate de texto para imagem e, em seguida, chama o Amazon Bedrock para gerar a imagem.
import base64
import boto3
import json
import os
MODEL_ID = "stability.stable-image-ultra-v1:0"
bedrock_runtime = boto3.consumer("bedrock-runtime", region_name="us-west-2")
print("Enter a immediate for the text-to-image mannequin:")
immediate = enter()
physique = {
"immediate": immediate,
"mode": "text-to-image"
}
response = bedrock_runtime.invoke_model(modelId=MODEL_ID, physique=json.dumps(physique))
model_response = json.masses(response("physique").learn())
base64_image_data = model_response("photos")(0)
i, output_dir = 1, "output"
if not os.path.exists(output_dir):
os.makedirs(output_dir)
whereas os.path.exists(os.path.be part of(output_dir, f"img_{i}.png")):
i += 1
image_data = base64.b64decode(base64_image_data)
image_path = os.path.be part of(output_dir, f"img_{i}.png")
with open(image_path, "wb") as file:
file.write(image_data)
print(f"The generated picture has been saved to {image_path}")
O aplicativo grava a imagem resultante em um output
diretório que é criado se não estiver presente. Para não sobrescrever arquivos existentes, o código verifica se há arquivos existentes para encontrar o primeiro nome de arquivo disponível com o img_
formatar.
Mais exemplos de como usar modelos de difusão estável estão disponíveis em Biblioteca de códigos do Documentação da AWS.
Vozes do cliente
Aprenda com Ken Hoge, diretor de aliança international da Stability AI, como os modelos de difusão estável estão remodelando o setor de texto para imagem para vídeo, áudio e 3D, e como a Amazon Bedrock capacita os clientes com uma solução completa, segura e escalável.
Entre em um mundo onde a leitura ganha vida com Nicolette Han, Product Proprietor, Stride Studying. Com o suporte da Amazon Bedrock e da AWS, a Legend Library da Stride Studying está transformando a maneira como mentes jovens se envolvem e compreendem a literatura usando IA para criar ilustrações impressionantes e seguras para histórias infantis.
Coisas a saber
Os novos modelos de IA de estabilidade – Imagem Estável Extremely, Difusão Estável 3 Grandee Núcleo de Imagem Estável – estão disponíveis hoje em Base rochosa da Amazônia no oeste dos EUA (Oregon) Região AWS. Com este lançamento, a Amazon Bedrock oferece um conjunto mais amplo de soluções para impulsionar sua criatividade e acelerar os fluxos de trabalho de geração de conteúdo. Veja o Página de preços do Amazon Bedrock para entender os custos do seu caso de uso.
Você pode encontrar mais informações em Difusão Estável 3 no artigo de pesquisa que descreve em detalhes a tecnologia subjacente.
Para começar, veja o Seção de modelos do Stability AI do Guia do usuário do Amazon Bedrock. Para descobrir como outros estão usando IA generativa em suas soluções e aprender com conteúdo técnico aprofundado, visite comunidade.aws.
— Danilo