Tutorial Construindo um Agente de IA – Parte 1


O uso do termo “Agente de IA” aumentou 10 vezes no último 1 ano, conforme dados do Google Traits. Este aumento reflecte uma mudança mais ampla: as pessoas e as organizações querem cada vez mais Sistemas de IA que não apenas respondem a perguntas, mas também agem em seu nome. Da simplificação de tarefas rotineiras à agilização das operações de negócios, a promessa da Agentic AI está atraindo a atenção world.

Tutorial Construindo um Agente de IA – Parte 1
Tendência do agente de IA ao longo do tempo (Imagem: Google Traits)

Então, o que isso realmente significa na prática? Vamos começar com um cenário compreensível de como os Agentes de IA podem transformar as tarefas diárias em um futuro próximo. Think about planejar férias, o que envolve reserva de hotéis, voos e aluguel de carros. Hoje, esse processo é fragmentado e demorado. No entanto, em um mundo de IA Agentic, poderíamos simplesmente fornecer um immediate simples que pode gerar pacotes de viagens personalizados, completos com itinerários, restaurantes e reservas.

Aqui está um exemplo de immediate que funcionaria em tal cenário:

“Gostaria de reservar uma viagem em família com 2 crianças nos meses de junho/julho para um fim de semana mais 2 dias. Não inclui a 2ª e a 3ª semana de junho. Só precisaria levar duas malas de mão e prefiro provar a melhor comida native. Planeje um itinerário que não exceda 2 a 3 horas de carro da cidade.”

Neste artigo, iremos além da palavra da moda que é Agentes de IA. Primeiro você entenderá os fundamentos dos Agentes de IA e depois explorará as plataformas que os tornam possíveis. Por fim, construiremos um projeto prático: um Agente Summarizer do YouTube usando a estrutura Phidata. Ao ultimate, você saberá o que é Agentic AI e como começar a construir uma com as ferramentas SOTA.

Observação: Este é o primeiro artigo de uma série de duas partes sobre a construção de Agentes de IA desde o início. Neste artigo, exploraremos o valor dos Agentes de IA, apresentaremos plataformas populares de IA da Agentic e percorreremos um tutorial prático para construir um Agente de IA simples. A próxima parte da série irá se aprofundar com um tutorial prático. Lá, construiremos Agentes que podem automatizar tarefas e interagir com ferramentas e APIs externas.

Fundamentos de Agentes de IA

Em termos simples, os Agentes de IA são sistemas que podem executar tarefas de forma autônoma, interpretando os dados do ambiente. Os agentes de IA podem tomar decisões com base nesses dados para atingir os objetivos. Pense neles como orquestradores, conectando diversas ferramentas, usando Giant Language Fashions (LLM) para raciocinar, planejar e executar tarefas. Para uma introdução detalhada aos LLMs, você pode consulte este artigo.

Vamos analisar essa definição usando o exemplo de planejamento de férias acima:

  • Execute tarefas de forma autônoma: Faça reservas de voos, hotéis e aluguel de automóveis por meio dos respectivos fornecedores.
  • Interpretando os dados: Considere fatores como clima, trânsito e eventos locais para sugerir as melhores atividades que se adaptam ao ritmo.
  • Tomando decisões: Considerando que existem dezenas de restaurantes disponíveis, os agentes podem fornecer recomendações com base na preferência indicada e nas avaliações anteriores.
  • Alcançar objetivos: Elabore um plano de viagem que atenda aos requisitos – datas, duração, preferências e necessidades da família.

Plataformas de IA Agentic

Um Estrutura de IA Agentic é um equipment de ferramentas que permite a criação de sistemas de IA capazes de raciocinar, planejar e executar ações de forma autônoma ou semiautônoma por meio do uso de ferramentas e memória. Em suma, estas estruturas fornecem a estrutura necessária para criar agentes.

Existem várias plataformas populares de Agentic AI, como LangChain, CrewAI e Phidata. Para este tutorial, usaremos Phidata – uma plataforma leve e amigável ao desenvolvedor. Phidata vem com acesso integrado a uma variedade de ferramentas e LLMs. Isso nos permite construir e implantar agentes de IA em apenas algumas linhas de código.

Ferramentas integradas e wrappers de modelo no Phidata
Ferramentas integradas populares e wrappers de modelo no Phidata (para uma lista completa, hyperlinks aqui – Modelos, Ferramentas.)

Crie um agente resumidor do YouTube

O YouTube Summarizer Agent foi projetado para extrair insights e pontos principais de qualquer vídeo do YouTube. Economiza tempo ao fornecer resumos concisos sem a necessidade de assistir a todo o conteúdo. Para efeitos do tutorial, usaremos o pocket book Google Colab para escrever e executar o código e a plataforma Phidata Agentic AI para alimentar o agente.

Modelo: Dentro de Fidataaproveitaremos a plataforma de hospedagem modelo Groq. É um serviço de inferência que executa LLMs em uma infraestrutura de GPU dedicada. Observe que é diferente de Grokque é um LLM da xAI. Como os LLMs consomem muitos recursos, o uso do Groq ajuda a descarregar a computação do {hardware} native ou do {hardware} fornecido pelo Colab. Isso garante uma execução mais rápida e eficiente. Groq tem acesso a vários modelos de diferentes fornecedores de LLM. (ver lista completa aqui)

Ferramentas: Para recuperar dados de vídeo do YouTube, usaremos a ferramenta integrada da estrutura Phidata (chamada Ferramentas do YouTube). Esta ferramenta nos ajuda a acessar metadados e legendas de vídeo. O agente então os repassa ao LLM escolhido para gerar resumos precisos e esclarecedores.

Aqui está o código para um agente resumidor do YouTube:

from phi.agent import Agent
from phi.mannequin.groq import Groq
from phi.mannequin.openai import OpenAIChat
from phi.instruments.youtube_tools import YouTubeTools


agent = Agent(
    # mannequin=Groq(id="llama3-8b-8192"),
    mannequin=Groq(id="llama-3.3-70b-versatile"),  ## Toggle with totally different LLM mannequin
    instruments=(YouTubeTools()),
    show_tool_calls=True,
    # debug_mode=True,
    description="You're a YouTube agent. Receive the captions of a YouTube video and reply questions.",
)


agent.print_response("Summarize this video https://www.youtube.com/watch?v=vStJoetOxJg", markdown=True, stream=True)

A seguir está a saída gerada pelo agente YouTube Summarizer (código acima). O hyperlink do YouTube no código acima é um vídeo de Andrew Ng na especialização Machine Studying. Conforme mostrado abaixo, ele resume com precisão o conteúdo do vídeo. Observe que a resposta pode variar para cada execução devido à natureza probabilística dos LLMs.

Resultado do resumo do YouTube

Tutorial detalhado

Aqui estão as instruções passo a passo para criar o agente do YouTube Summarizer.

1. Clonar Caderno

  • Clonar caderno Colab aqui (requer uma conta do Google)
  • Instale dependências (primeira célula com código)

2. Obtenha a chave API para Groq

Para operar o Agente, visto que utilizamos a plataforma de hospedagem modelo Groq, precisamos de uma conta no Groq. Siga as etapas abaixo para se inscrever/fazer login no Groq e obter uma chave API.

– Visite o Portal do Desenvolvedor Groq: Abra seu navegador e acesse: https://console.groq.com

– Cadastre-se ou faça login

  • Se você já possui uma conta, clique em Entrar.
  • Se você é novo, clique em Inscrever-se e siga as instruções para criar uma conta (talvez seja necessário verificar seu e-mail).

– Acesse a seção API

  • Uma vez logado, você acessará o Groq Console.
  • Navegue até a seção Chaves de API na barra lateral ou no painel.

– Gere uma nova chave de API

  • Clique no botão “Criar chave API”.
  • Dê um nome à sua chave (por exemplo, “chave de oficina”).
  • Clique em Criar ou Gerar.

– Copie e armazene a chave com segurança

  • Sua chave API será mostrada apenas uma vez – copie-a imediatamente e armazene-a em um native seguro.
  • Nunca exponha sua chave de API em código do lado do cliente ou em repositórios públicos.

3. Adicione a chave API no Secret Supervisor

  • Clique em Segredos (sinal de chave) no painel esquerdo do Colab
  • Forneça o nome como GROQ_API_KEY e o valor como a chave de API copiada na Etapa 5 acima
  • Ative o acesso ao pocket book.

Conclusão

Neste artigo, exploramos a crescente demanda por um agente de IA e examinamos um exemplo actual de como eles podem simplificar as tarefas diárias. Detalhamos os fundamentos dos agentes de IA e de alguns frameworks de IA populares. Também construímos um projeto prático: um Agente Summarizer do YouTube desenvolvido pela Phidata.

Este é apenas o começo. No segundo artigo desta série, iremos nos aprofundar na construção de um agente planejador de estudos que não apenas gera planos, mas também executa ações. Ele criará tarefas no Jira, enviará convites de calendário e demonstrará como os agentes de IA podem integrar-se perfeitamente com ferramentas externas e APIs para automatizar fluxos de trabalho do mundo actual.

Confira a parte 2 desta série aqui – Construindo Agente Planejador de Estudo: Tutorial do Agente AI Parte 2

Coautor do artigo: Abhishek Agrawal

Praveen é um cientista de dados experiente, com mais de uma década de experiência em análise. Ele enfrentou desafios empresariais complexos e impulsionou a inovação por meio de tomadas de decisões baseadas em dados. Sua experiência abrange áreas como aprendizado de máquina, estatística e análise escalável, ajudando a lançar vários produtos revolucionários.

Faça login para continuar lendo e desfrutar de conteúdo com curadoria de especialistas.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *