Os modelos de IA generativos estão mudando a maneira como criamos conteúdo, seja texto, imagens, vídeo ou código. Com o GEN AI Python SDK do Google, agora você pode acessar e interagir com os modelos generativos de IA generativos do Google em seus aplicativos Python com mais facilidade, além de usar a API de desenvolvedor de Gemini e APIs de vértice ai. Isso significa que os desenvolvedores podem criar mais facilmente aplicativos, incluindo chatbots, geradores de conteúdo ou ferramentas criativas. Neste artigo, abordaremos tudo o que você precisa saber para começar a usar o Google Gen AI Python SDK.
Leia também: Construa um modelo LLM usando a API do Google Gemini
O que é o Google Gen Ai Python SDK?
O Google Gen AI Python SDK é uma biblioteca de clientes para os desenvolvedores usarem as habilidades generativas de IA do Google facilmente usando o Python. Ele fornece:
- Suporte à API de desenvolvedor de Gemini (texto avançado e modelos generativos multimodais do Google)
- Integração com APIs de AI da Vertex para cargas de trabalho de IA em escala corporativa
- Suporte para gerar texto, imagens, vídeos, incorporação, conversas de bate -papo e muito mais
- Ferramentas para gerenciamento de arquivos, cache e suporte async
- Recursos avançados de chamada de função e aplicação de esquema
Este SDK também abstrava grande parte da complexidade em torno das chamadas da API e permite que você se concentre na criação de aplicativos movidos a IA.
Instalação
Instalar o SDK é simples. Correr:
pip set up google-genai
O comando acima instalará o pacote do Google Gen AI Python SDK usando o PIP. Este comando baixa tudo o que você precisa para o ambiente Python iniciar os serviços generativos de IA do Google, incluindo os recursos e todas as dependências.
Importações e configuração do cliente
Depois de instalar o SDK, crie um arquivo python e importe o SDK:
from google import genai
from google.genai import varieties
O SDK possui dois módulos – genai e tipos. O módulo Genai cria um cliente usado para a interação da API, enquanto o módulo Varieties possui estruturas e lessons de dados que servem como ajudantes usados para criar solicitações e configurar parâmetros de solicitação.
Você criará uma instância do cliente para cada interação com os modelos de IA generativos do Google. Você instanciará o cliente com métodos diferentes, dependendo da API que você está usando.
Para a API de desenvolvedor de Gêmeos, você pode instanciar o cliente passando pela chave da API:
consumer = genai.Consumer(api_key='YOUR_GEMINI_API_KEY')
Você instancia o cliente que pode interagir com a API do desenvolvedor de Gemini passando sua chave da API. Este cliente cuidará do token de acesso e do gerenciamento de solicitar.
Opcional: usando o Google Cloud Vertex AI
consumer = genai.Consumer(
vertexai=True,
challenge="your-project-id",
location='us-central1'
)
Se você quiser usar o Google Cloud Vertex AI, inicializará o cliente de maneira diferente, especificando o ID do projeto e o native.
NOTA: O uso do vértice AI é opcional. Você pode Crie seu ID de projeto aqui.
Se você não usar o vértice ai, poderá simplesmente usar o método da chave da API acima.
Versão e configuração da API
Por padrão, o SDK usa pontos de extremidade beta para acessar os recursos beta. No entanto, se você deseja usar APIs estáveis, poderá especificar a versão da API usando o argumento HTTP_Options:
from google.genai import varieties
consumer = genai.Consumer(
vertexai=True,
challenge="your-project-id",
location='us-central1',
http_options=varieties.HttpOptions(api_version='v1')
)
Cabe a você como você deseja equilibrar a estabilidade com os recursos de ponta.
Usando variáveis de ambiente (opcional)
Em vez de passar diretamente as chaves, devemos primeiro definir variáveis de ambiente:
API de desenvolvedor de Gêmeos:
export GEMINI_API_KEY='your-api-key'
Vértice ai:
export GOOGLE_GENAI_USE_VERTEXAI=true
export GOOGLE_CLOUD_PROJECT='your-project-id'
export GOOGLE_CLOUD_LOCATION='us-central1'
Em seguida, inicialize o cliente simplesmente com:
consumer = genai.Consumer()
Google Gen AI Python SDK Casos de uso
Aqui estão as várias maneiras pelas quais você pode colocar os recursos do Google Gen AI Python SDK para usar uma vez configurados.
Geração de conteúdo
A função principal do SDK é gerar conteúdo de IA. Você fornece instruções de várias formas, como seqüências simples, conteúdo estruturado ou entradas multimodais complexas.
Geração básica de texto
response = consumer.fashions.generate_content(
mannequin="gemini-2.0-flash-001",
contents="Why Does the solar rises from east"
)
print(response.textual content)
Saída

Isso envia um immediate para o modelo e retorna a resposta gerada.
Entradas de conteúdo estruturado
Você pode inserir conteúdo estruturado em várias funções, como usuário ou modelo para contextos de chatbot, conversacional ou multi-turn.
from google.genai import varieties
content material = varieties.Content material(
function="consumer",
components=(varieties.Half.from_text(textual content="Inform me a enjoyable reality about work."))
)
response = consumer.fashions.generate_content(mannequin="gemini-2.0-flash-001", contents=content material)
print(response.textual content)
Saída

O SDK traduz internamente muitos tipos de entrada diferentes em um formato de dados estruturado para o modelo.
Add e uso de arquivos
A API de desenvolvedores de Gemini permite que você envie arquivos para o modelo processar. Isso é ótimo para resumo ou extração de conteúdo:
file = consumer.recordsdata.add(file="/content material/sample_file.txt")
response = consumer.fashions.generate_content(
mannequin="gemini-2.0-flash-001",
contents=(file, 'Please summarize this file.')
)
print(response.textual content)
Saída

Esta é uma abordagem preferrred para adicionar funcionalidade de IA às tarefas baseadas em documentos.
Chamada de função
Uma capacidade exclusiva é a capacidade de passar as funções do Python como “ferramentas” para o modelo invocar automaticamente enquanto gera a conclusão.
def get_current_weather(location: str) -> str:
return 'sunny'
response = consumer.fashions.generate_content(
mannequin="gemini-2.0-flash-001",
contents="What's the climate like in Ranchi?",
config=varieties.GenerateContentConfig(instruments=(get_current_weather))
)
print(response.textual content)
Saída

Isso permite a integração dinâmica de dados em tempo actual dentro das respostas da IA.
Configuração avançada
Você tem a capacidade de personalizar a geração com parâmetros como temperatura, max_output_tokens e configurações de segurança para gerenciar aleatoriedade, comprimento e filtrar conteúdo prejudicial.
config = varieties.GenerateContentConfig(
temperature=0.3,
max_output_tokens=100,
safety_settings=(varieties.SafetySetting(class='HARM_CATEGORY_HATE_SPEECH', threshold='BLOCK_ONLY_HIGH'))
)
response = consumer.fashions.generate_content(
mannequin="gemini-2.0-flash-001",
contents=""'Provide some encouraging phrases for somebody beginning a brand new journey.''',
config=config
)
print(response.textual content)
Saída

Isso pode fornecer granularidade sobre a qualidade e a segurança do conteúdo.
Suporte multimídia: imagens e vídeos
O SDK permite gerar e editar imagens e gerar vídeos (em visualização).
- Gere imagens usando os prompts de texto.
- Upscale ou ajuste imagens geradas.
- Gerar vídeos a partir de texto ou imagens.
Exemplo de geração de imagens:
response = consumer.fashions.generate_images(
mannequin="imagen-3.0-generate-002",
immediate="A tranquil seashore with crystal-clear water and colourful seashells on the shore.",
config=varieties.GenerateImagesConfig(number_of_images=1)
)
response.generated_images(0).picture.present()
Saída

Exemplo de geração de vídeo:
import time
operation = consumer.fashions.generate_videos(
mannequin="veo-2.0-generate-001",
immediate="A cat DJ spinning vinyl information at a futuristic nightclub with holographic beats.",
config=varieties.GenerateVideosConfig(number_of_videos=1, duration_seconds=5)
)
whereas not operation.finished:
time.sleep(20)
operation = consumer.operations.get(operation)
video = operation.response.generated_videos(0).video
video.present()
Saída:
Isso permite aplicativos de IA criativos e multimodais.
Bate -papo e conversas
Você pode começar as sessões de bate -papo que preservam o contexto ao longo de suas mensagens:
chat = consumer.chats.create(mannequin="gemini-2.0-flash-001")
response = chat.send_message('Inform me a narrative')
print(response.textual content)

response = chat.send_message('Summarize that story in a single sentence')
print(response.textual content)

Isso é útil para criar IA conversacional que se lembra do diálogo anterior.
Suporte assíncrono
Todos os métodos principais da API têm funções assíncronas para melhor integração nos aplicativos assíncronos python:
response = await consumer.aio.fashions.generate_content(
mannequin="gemini-2.0-flash-001",
contents="Inform a Horror story in 200 phrases."
)
print(response.textual content)

Contagem de token
As faixas de contagem de token quantos tokens (pedaços de texto) estão em sua entrada. Isso ajuda você a permanecer dentro dos limites do modelo e tomar decisões econômicas.
token_count = consumer.fashions.count_tokens(
mannequin="gemini-2.0-flash-001",
contents="Why does the sky have a blue hue as a substitute of different colours?"
)
print(token_count)

Incorporação
As incorporações transformam seu texto em vetores numéricos que representam seu significado, que pode ser usado para pesquisa, agrupamento e avaliação de IA.
embedding = consumer.fashions.embed_content(
mannequin="text-embedding-004",
contents="Why does the sky have a blue hue as a substitute of different colours?"
)
print(embedding)

Usando o SDK, você pode contar facilmente tokens e criar incorporações para melhorar e aprimorar seus aplicativos de IA.
Conclusão
O Google Gen Ai Python SDK é uma ferramenta robusta e versátil que permite aos desenvolvedores acessar modelos de IA generativos em seus projetos Python. Da geração de texto, bate -papo e chatbot, a geração de imagens/vídeo, chamada de função e muito mais, ele fornece um conjunto de recursos robusto com interfaces simples. Com uma instalação fácil de embalagem, um processo simples de configuração do cliente e suporte para programação assíncrona e multimídia, o SDK facilita significativamente a AI de construção que aproveita significativamente a IA. Seja você iniciante ou desenvolvedor experiente, o uso do SDK é relativamente indolor, mas poderoso quando se trata de incorporar IA generativa em seus fluxos de trabalho.
Perguntas frequentes
É uma biblioteca Python para usar os serviços e modelos de gen ai do Google no código Python
Você executa o PIP Instale Google-Genai. Se você deseja usar o SDK de forma assíncrona, execute o PIP Set up Google-Genai (AIOHTTP).
Na criação do cliente, você pode passar em uma chave da API ou definir as variáveis de ambiente gemini_api_key ou definir credenciais do Google Cloud para o VERTEX AI.
Sim, o SDK pode executar operações no que diz respeito às imagens e arquivos, carregá -las e editá -las e usá -las em conteúdo estruturado.
Gereate_content leva strings simples, listas de mensagens, avisos estruturados onde você atribui funções e conteúdo multipartidário (texto junto com imagens ou arquivos).
O recurso de chamada de função permite que o modelo chame o Python funções dinamicamente durante a sessão. Portanto, permitindo que você tenha um fluxo de trabalho que chama lógica ou computação externa.
Sim, no generate_content, você pode usar o parâmetro generation_config com argumentos como a temperatura (para controlar a aleatoriedade) e max_output_tokens (para limitar a resposta do modelo).
Faça login para continuar lendo e desfrutar de conteúdo com curado especialista.