Google Gen AI Python SDK: um guia completo


Os modelos de IA generativos estão mudando a maneira como criamos conteúdo, seja texto, imagens, vídeo ou código. Com o GEN AI Python SDK do Google, agora você pode acessar e interagir com os modelos generativos de IA generativos do Google em seus aplicativos Python com mais facilidade, além de usar a API de desenvolvedor de Gemini e APIs de vértice ai. Isso significa que os desenvolvedores podem criar mais facilmente aplicativos, incluindo chatbots, geradores de conteúdo ou ferramentas criativas. Neste artigo, abordaremos tudo o que você precisa saber para começar a usar o Google Gen AI Python SDK.

Leia também: Construa um modelo LLM usando a API do Google Gemini

O que é o Google Gen Ai Python SDK?

O Google Gen AI Python SDK é uma biblioteca de clientes para os desenvolvedores usarem as habilidades generativas de IA do Google facilmente usando o Python. Ele fornece:

  • Suporte à API de desenvolvedor de Gemini (texto avançado e modelos generativos multimodais do Google)
  • Integração com APIs de AI da Vertex para cargas de trabalho de IA em escala corporativa
  • Suporte para gerar texto, imagens, vídeos, incorporação, conversas de bate -papo e muito mais
  • Ferramentas para gerenciamento de arquivos, cache e suporte async
  • Recursos avançados de chamada de função e aplicação de esquema

Este SDK também abstrava grande parte da complexidade em torno das chamadas da API e permite que você se concentre na criação de aplicativos movidos a IA.

Instalação

Instalar o SDK é simples. Correr:

pip set up google-genai

O comando acima instalará o pacote do Google Gen AI Python SDK usando o PIP. Este comando baixa tudo o que você precisa para o ambiente Python iniciar os serviços generativos de IA do Google, incluindo os recursos e todas as dependências.

Importações e configuração do cliente

Depois de instalar o SDK, crie um arquivo python e importe o SDK:

from google import genai
from google.genai import varieties

O SDK possui dois módulos – genai e tipos. O módulo Genai cria um cliente usado para a interação da API, enquanto o módulo Varieties possui estruturas e lessons de dados que servem como ajudantes usados para criar solicitações e configurar parâmetros de solicitação.

Você criará uma instância do cliente para cada interação com os modelos de IA generativos do Google. Você instanciará o cliente com métodos diferentes, dependendo da API que você está usando.

Para a API de desenvolvedor de Gêmeos, você pode instanciar o cliente passando pela chave da API:

consumer = genai.Consumer(api_key='YOUR_GEMINI_API_KEY')

Você instancia o cliente que pode interagir com a API do desenvolvedor de Gemini passando sua chave da API. Este cliente cuidará do token de acesso e do gerenciamento de solicitar.

Opcional: usando o Google Cloud Vertex AI

consumer = genai.Consumer(
   vertexai=True,
   challenge="your-project-id",
   location='us-central1'
)

Se você quiser usar o Google Cloud Vertex AI, inicializará o cliente de maneira diferente, especificando o ID do projeto e o native.

NOTA: O uso do vértice AI é opcional. Você pode Crie seu ID de projeto aqui.

Se você não usar o vértice ai, poderá simplesmente usar o método da chave da API acima.

Versão e configuração da API

Por padrão, o SDK usa pontos de extremidade beta para acessar os recursos beta. No entanto, se você deseja usar APIs estáveis, poderá especificar a versão da API usando o argumento HTTP_Options:

from google.genai import varieties

consumer = genai.Consumer(
   vertexai=True,
   challenge="your-project-id",
   location='us-central1',
   http_options=varieties.HttpOptions(api_version='v1')
)

Cabe a você como você deseja equilibrar a estabilidade com os recursos de ponta.

Usando variáveis de ambiente (opcional)

Em vez de passar diretamente as chaves, devemos primeiro definir variáveis de ambiente:

API de desenvolvedor de Gêmeos:

export GEMINI_API_KEY='your-api-key'

Vértice ai:

export GOOGLE_GENAI_USE_VERTEXAI=true
export GOOGLE_CLOUD_PROJECT='your-project-id'
export GOOGLE_CLOUD_LOCATION='us-central1'

Em seguida, inicialize o cliente simplesmente com:

consumer = genai.Consumer()

Google Gen AI Python SDK Casos de uso

Aqui estão as várias maneiras pelas quais você pode colocar os recursos do Google Gen AI Python SDK para usar uma vez configurados.

Geração de conteúdo

A função principal do SDK é gerar conteúdo de IA. Você fornece instruções de várias formas, como seqüências simples, conteúdo estruturado ou entradas multimodais complexas.

Geração básica de texto

response = consumer.fashions.generate_content(
   mannequin="gemini-2.0-flash-001",
   contents="Why Does the solar rises from east"
)
print(response.textual content)

Saída

Google Gen AI Python SDK: um guia completo

Isso envia um immediate para o modelo e retorna a resposta gerada.

Entradas de conteúdo estruturado

Você pode inserir conteúdo estruturado em várias funções, como usuário ou modelo para contextos de chatbot, conversacional ou multi-turn.

from google.genai import varieties


content material = varieties.Content material(
   function="consumer",
   components=(varieties.Half.from_text(textual content="Inform me a enjoyable reality about work."))
)
response = consumer.fashions.generate_content(mannequin="gemini-2.0-flash-001", contents=content material)
print(response.textual content)

Saída

Google Gen AI - Saída de conteúdo estruturado

O SDK traduz internamente muitos tipos de entrada diferentes em um formato de dados estruturado para o modelo.

Add e uso de arquivos

A API de desenvolvedores de Gemini permite que você envie arquivos para o modelo processar. Isso é ótimo para resumo ou extração de conteúdo:

file = consumer.recordsdata.add(file="/content material/sample_file.txt")
response = consumer.fashions.generate_content(
   mannequin="gemini-2.0-flash-001",
   contents=(file, 'Please summarize this file.')
)
print(response.textual content)

Saída

Google Gen AI - Upload de arquivo e uso

Esta é uma abordagem preferrred para adicionar funcionalidade de IA às tarefas baseadas em documentos.

Chamada de função

Uma capacidade exclusiva é a capacidade de passar as funções do Python como “ferramentas” para o modelo invocar automaticamente enquanto gera a conclusão.

def get_current_weather(location: str) -> str:
   return 'sunny'


response = consumer.fashions.generate_content(
   mannequin="gemini-2.0-flash-001",
   contents="What's the climate like in Ranchi?",
   config=varieties.GenerateContentConfig(instruments=(get_current_weather))
)
print(response.textual content)

Saída

Google Gen AI - Chamada de funções

Isso permite a integração dinâmica de dados em tempo actual dentro das respostas da IA.

Configuração avançada

Você tem a capacidade de personalizar a geração com parâmetros como temperatura, max_output_tokens e configurações de segurança para gerenciar aleatoriedade, comprimento e filtrar conteúdo prejudicial.

config = varieties.GenerateContentConfig(
   temperature=0.3,
   max_output_tokens=100,
   safety_settings=(varieties.SafetySetting(class='HARM_CATEGORY_HATE_SPEECH', threshold='BLOCK_ONLY_HIGH'))
)


response = consumer.fashions.generate_content(
   mannequin="gemini-2.0-flash-001",
   contents=""'Provide some encouraging phrases for somebody beginning a brand new journey.''',
   config=config
)
print(response.textual content)

Saída

Google Gen AI - Configuração avançada

Isso pode fornecer granularidade sobre a qualidade e a segurança do conteúdo.

Suporte multimídia: imagens e vídeos

O SDK permite gerar e editar imagens e gerar vídeos (em visualização).

  • Gere imagens usando os prompts de texto.
  • Upscale ou ajuste imagens geradas.
  • Gerar vídeos a partir de texto ou imagens.

Exemplo de geração de imagens:

response = consumer.fashions.generate_images(
   mannequin="imagen-3.0-generate-002",
   immediate="A tranquil seashore with crystal-clear water and colourful seashells on the shore.",
   config=varieties.GenerateImagesConfig(number_of_images=1)
)
response.generated_images(0).picture.present()

Saída

Google Gen AI Image Saída

Exemplo de geração de vídeo:

import time
operation = consumer.fashions.generate_videos(
   mannequin="veo-2.0-generate-001",
   immediate="A cat DJ spinning vinyl information at a futuristic nightclub with holographic beats.",
   config=varieties.GenerateVideosConfig(number_of_videos=1, duration_seconds=5)
)


whereas not operation.finished:
   time.sleep(20)
   operation = consumer.operations.get(operation)
video = operation.response.generated_videos(0).video
video.present()

Saída:

Isso permite aplicativos de IA criativos e multimodais.

Bate -papo e conversas

Você pode começar as sessões de bate -papo que preservam o contexto ao longo de suas mensagens:

chat = consumer.chats.create(mannequin="gemini-2.0-flash-001")
response = chat.send_message('Inform me a narrative')
print(response.textual content)
Google Gen AI - bate -papos e conversas
response = chat.send_message('Summarize that story in a single sentence')
print(response.textual content)
Google Gen AI - bate -papos e conversas

Isso é útil para criar IA conversacional que se lembra do diálogo anterior.

Suporte assíncrono

Todos os métodos principais da API têm funções assíncronas para melhor integração nos aplicativos assíncronos python:

response = await consumer.aio.fashions.generate_content(
   mannequin="gemini-2.0-flash-001",
   contents="Inform a Horror story in 200 phrases."
)
print(response.textual content)
Google Gen AI - Suporte assíncrono

Contagem de token

As faixas de contagem de token quantos tokens (pedaços de texto) estão em sua entrada. Isso ajuda você a permanecer dentro dos limites do modelo e tomar decisões econômicas.

token_count = consumer.fashions.count_tokens(
   mannequin="gemini-2.0-flash-001",
   contents="Why does the sky have a blue hue as a substitute of different colours?"
)
print(token_count)
Google Gen AI - Contagem de token

Incorporação

As incorporações transformam seu texto em vetores numéricos que representam seu significado, que pode ser usado para pesquisa, agrupamento e avaliação de IA.

embedding = consumer.fashions.embed_content(
   mannequin="text-embedding-004",
   contents="Why does the sky have a blue hue as a substitute of different colours?"
)
print(embedding)
Google Gen AI - incorporação

Usando o SDK, você pode contar facilmente tokens e criar incorporações para melhorar e aprimorar seus aplicativos de IA.

Conclusão

O Google Gen Ai Python SDK é uma ferramenta robusta e versátil que permite aos desenvolvedores acessar modelos de IA generativos em seus projetos Python. Da geração de texto, bate -papo e chatbot, a geração de imagens/vídeo, chamada de função e muito mais, ele fornece um conjunto de recursos robusto com interfaces simples. Com uma instalação fácil de embalagem, um processo simples de configuração do cliente e suporte para programação assíncrona e multimídia, o SDK facilita significativamente a AI de construção que aproveita significativamente a IA. Seja você iniciante ou desenvolvedor experiente, o uso do SDK é relativamente indolor, mas poderoso quando se trata de incorporar IA generativa em seus fluxos de trabalho.

Perguntas frequentes

O que é o Google Gen Ai Python SDK?

É uma biblioteca Python para usar os serviços e modelos de gen ai do Google no código Python

Como faço para instalar o SDK?

Você executa o PIP Instale Google-Genai. Se você deseja usar o SDK de forma assíncrona, execute o PIP Set up Google-Genai (AIOHTTP).

Como faço para autenticar o cliente?

Na criação do cliente, você pode passar em uma chave da API ou definir as variáveis de ambiente gemini_api_key ou definir credenciais do Google Cloud para o VERTEX AI.

O SDK usa multimídia?

Sim, o SDK pode executar operações no que diz respeito às imagens e arquivos, carregá -las e editá -las e usá -las em conteúdo estruturado.

Que entradas posso usar para gerar_content?

Gereate_content leva strings simples, listas de mensagens, avisos estruturados onde você atribui funções e conteúdo multipartidário (texto junto com imagens ou arquivos).

O que está chamando de função?

O recurso de chamada de função permite que o modelo chame o Python funções dinamicamente durante a sessão. Portanto, permitindo que você tenha um fluxo de trabalho que chama lógica ou computação externa.

Posso configurar o comportamento dos modelos?

Sim, no generate_content, você pode usar o parâmetro generation_config com argumentos como a temperatura (para controlar a aleatoriedade) e max_output_tokens (para limitar a resposta do modelo).

Olá, sou Janvi, um entusiasta apaixonado da ciência de dados atualmente trabalhando na Analytics Vidhya. Minha jornada para o mundo dos dados começou com uma profunda curiosidade sobre como podemos extrair insights significativos de conjuntos de dados complexos.

Faça login para continuar lendo e desfrutar de conteúdo com curado especialista.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *