Hoje, estamos anunciando a disponibilidade geral do Modelo Amazon Titan Picture Generator v2 com novas capacidades em Base rochosa da Amazônia. Com o Amazon Titan Picture Generator v2, você pode orientar a criação de imagens usando imagens de referência, editar visuais existentes, remover fundos, gerar variações de imagem e personalizar o modelo com segurança para manter o estilo da marca e a consistência do assunto. Esta ferramenta poderosa simplifica os fluxos de trabalho, aumenta a produtividade e dá vida a visões criativas.
O Amazon Titan Picture Generator v2 traz uma série de novos recursos além de todos os recursos do Amazon Titan Picture Generator v1, incluindo:
- Condicionamento de imagem – Forneça uma imagem de referência junto com um immediate de texto, resultando em saídas que seguem o structure e a estrutura da referência fornecida pelo usuário.
- Orientação de imagem com paleta de cores – Controle precisamente a paleta de cores das imagens geradas fornecendo uma lista de códigos hexadecimais junto com o immediate de texto.
- Remoção de fundo – Remova automaticamente o fundo de imagens que contenham vários objetos.
- Consistência do assunto – Ajuste o modelo para preservar um assunto específico (por exemplo, um determinado cachorro, sapato ou bolsa) nas imagens geradas.
Novos recursos no Amazon Titan Picture Generator v2
Antes de começar, se você é novo no uso de modelos Amazon Titan, vá para o Console Amazon Bedrock e escolher Acesso ao modelo no painel inferior esquerdo. Para acessar os modelos mais recentes do Amazon Titan em Amazonassolicite acesso separadamente para Amazon Titan Picture Generator G1 v2.
Aqui estão os detalhes do Amazon Titan Picture Generator v2 no Amazon Bedrock:
Condicionamento de imagem
Você pode usar o recurso de condicionamento de imagem para moldar suas criações com precisão e intenção. Ao fornecer uma imagem de referência (ou seja, uma imagem de condicionamento), você pode instruir o modelo a focar em características visuais específicas, como bordas, contornos de objetos e elementos estruturais, ou mapas de segmentação que definem regiões e objetos distintos dentro da imagem de referência.
Oferecemos suporte a dois tipos de condicionamento de imagem: Canny edge e segmentação.
- O algoritmo Canny edge é usado para extrair as bordas proeminentes dentro da imagem de referência, criando um mapa que o Amazon Titan Picture Generator pode então usar para guiar o processo de geração. Você pode “desenhar” as bases da sua imagem desejada, e o modelo preencherá os detalhes, texturas e estética closing com base na sua orientação.
- A segmentação fornece um nível de controle ainda mais granular. Ao fornecer a imagem de referência, você pode definir áreas ou objetos específicos dentro da imagem e instruir o Amazon Titan Picture Generator a gerar conteúdo que se alinhe com essas regiões definidas. Você pode controlar precisamente o posicionamento e a renderização de caracteres, objetos e outros elementos-chave.
Aqui estão exemplos de gerações que usam condicionamento de imagem.
Para usar o recurso de condicionamento de imagem, você pode usar API do Amazon Bedrock, SDK da AWSou Interface de linha de comando da AWS (AWS CLI) e escolher CANNY_EDGE
ou SEGMENTATION
para controlMode
de textToImageParams
com sua imagem de referência.
"taskType": "TEXT_IMAGE",
"textToImageParams": SEGMENTATION
"controlStrength": 0.7 # Optionally available: weight given to the situation picture. Default: 0.7
A seguir, um exemplo de código Python usando SDK da AWS para Python (Boto3) mostra como invocar o Amazon Titan Picture Generator v2 no Amazon Bedrock para usar o condicionamento de imagem.
import base64
import io
import json
import logging
import boto3
from PIL import Picture
from botocore.exceptions import ClientError
def fundamental():
"""
Entrypoint for Amazon Titan Picture Generator V2 instance.
"""
attempt:
logging.basicConfig(stage=logging.INFO,
format="%(levelname)s: %(message)s")
model_id = 'amazon.titan-image-generator-v2:0'
# Learn picture from file and encode it as base64 string.
with open("/path/to/picture", "rb") as image_file:
input_image = base64.b64encode(image_file.learn()).decode('utf8')
physique = json.dumps({
"taskType": "TEXT_IMAGE",
"textToImageParams": {
"textual content": "a cartoon deer in a fairy world",
"conditionImage": input_image,
"controlMode": "CANNY_EDGE",
"controlStrength": 0.7
},
"imageGenerationConfig": {
"numberOfImages": 1,
"top": 512,
"width": 512,
"cfgScale": 8.0
}
})
image_bytes = generate_image(model_id=model_id,
physique=physique)
picture = Picture.open(io.BytesIO(image_bytes))
picture.present()
besides ClientError as err:
message = err.response("Error")("Message")
logger.error("A consumer error occurred: %s", message)
print("A consumer error occured: " +
format(message))
besides ImageError as err:
logger.error(err.message)
print(err.message)
else:
print(
f"Completed producing picture with Amazon Titan Picture Generator V2 mannequin {model_id}.")
def generate_image(model_id, physique):
"""
Generate a picture utilizing Amazon Titan Picture Generator V2 mannequin on demand.
Args:
model_id (str): The mannequin ID to make use of.
physique (str) : The request physique to make use of.
Returns:
image_bytes (bytes): The picture generated by the mannequin.
"""
logger.data(
"Producing picture with Amazon Titan Picture Generator V2 mannequin %s", model_id)
bedrock = boto3.consumer(service_name="bedrock-runtime")
settle for = "software/json"
content_type = "software/json"
response = bedrock.invoke_model(
physique=physique, modelId=model_id, settle for=settle for, contentType=content_type
)
response_body = json.masses(response.get("physique").learn())
base64_image = response_body.get("photos")(0)
base64_bytes = base64_image.encode('ascii')
image_bytes = base64.b64decode(base64_bytes)
finish_reason = response_body.get("error")
if finish_reason shouldn't be None:
increase ImageError(f"Picture technology error. Error is {finish_reason}")
logger.data(
"Efficiently generated picture with Amazon Titan Picture Generator V2 mannequin %s", model_id)
return image_bytes
class ImageError(Exception):
"Customized exception for errors returned by Amazon Titan Picture Generator V2"
def __init__(self, message):
self.message = message
logger = logging.getLogger(__name__)
logging.basicConfig(stage=logging.INFO)
if __name__ == "__main__":
fundamental()
Condicionamento de cor
A maioria dos designers deseja gerar imagens seguindo as diretrizes de marca de cores, por isso buscam controle sobre a paleta de cores nas imagens geradas.
Com o Amazon Titan Picture Generator v2, você pode gerar imagens condicionadas por cores com base em uma paleta de cores — uma lista de cores hexadecimais fornecidas como parte das entradas aderindo às diretrizes de marca de cores. Você também pode fornecer uma imagem de referência como entrada (opcional) para gerar uma imagem com cores hexadecimais fornecidas enquanto herda o estilo da imagem de referência.
Neste exemplo, o immediate descreve:a jar of salad dressing in a country kitchen surrounded by contemporary greens with studio lighting
A imagem gerada reflete tanto o conteúdo do immediate de texto quanto o esquema de cores especificado para se alinhar às diretrizes de cores da marca.
Para usar o recurso de condicionamento de cores, você pode definir taskType
para COLOR_GUIDED_GENERATION
com seus códigos de immediate e hexadecimais.
"taskType": "COLOR_GUIDED_GENERATION",
"colorGuidedGenerationParam": {
"textual content": "a jar of salad dressing in a country kitchen surrounded by contemporary greens with studio lighting",
"colours": ('#ff8080', '#ffb280', '#ffe680', '#e5ff80'), # Optionally available: listing of coloration hex codes
"referenceImage": input_image, #Optionally available
}
Remoção de fundo
Quer você esteja procurando compor uma imagem em um fundo de cor sólida ou colocá-la sobre outra cena, a capacidade de remover o fundo de forma limpa e precisa é uma ferramenta essencial no fluxo de trabalho criativo. Você pode remover instantaneamente o fundo de suas imagens com uma única etapa. O Amazon Titan Picture Generator v2 pode detectar e segmentar de forma inteligente vários objetos de primeiro plano, garantindo que até mesmo cenas complexas com elementos sobrepostos sejam isoladas de forma limpa.
O exemplo mostra uma imagem de uma iguana sentada em uma árvore em uma floresta. O modelo foi capaz de identificar a iguana como o objeto principal e remover o fundo da floresta, substituindo-o por um fundo transparente. Isso permite que a iguana se destaque claramente sem a floresta distrativa ao redor dela.
Para usar o recurso de remoção de fundo, você pode definir taskType
para BACKGROUND_REMOVAL
com sua imagem de entrada.
"taskType": "BACKGROUND_REMOVAL",
"backgroundRemovalParams": {
"picture": input_image,
}
Consistência do assunto com ajuste fino
Agora você pode incorporar perfeitamente assuntos específicos em cenas visualmente cativantes. Seja um produto de marca, um logotipo de empresa ou um animal de estimação querido da família, você pode ajustar o modelo Amazon Titan usando imagens de referência para aprender as características únicas do assunto escolhido.
Depois que o modelo estiver ajustado, você pode simplesmente fornecer um immediate de texto, e o Amazon Titan Generator gerará imagens que mantêm uma representação consistente do assunto, colocando-o naturalmente em contextos diversos e imaginativos. Isso abre um mundo de possibilidades para advertising, publicidade e narrativa visible.
Por exemplo, você pode usar uma imagem com a legenda Ron the canine
durante o ajuste fino, dê o immediate como Ron the canine carrying a superhero cape
durante a inferência com o modelo ajustado e obter uma imagem única em resposta.
Para aprender, visite parâmetros de inferência de modelo e exemplos de código para Amazon Titan Picture Generator na documentação da AWS.
Agora disponível
O modelo Amazon Titan Generator v2 está disponível hoje na Amazon Bedrock nas regiões Leste dos EUA (Norte da Virgínia) e Oeste dos EUA (Oregon). Verifique o lista completa de regiões para atualizações futuras. Para saber mais, confira o Página do produto Amazon Titan e a Preços do Amazon Bedrock página.
Experimente o Amazon Titan Picture Generator v2 em Base rochosa da Amazônia hoje e envie suggestions para AWS re:Publish para Amazon Bedrock ou por meio de seus contatos habituais de suporte da AWS.
Visite nosso comunidade.sítio aws para encontrar conteúdo técnico aprofundado e descobrir como nossas comunidades Builder estão usando o Amazon Bedrock em suas soluções.
— Channy