Desde o seu lançamento há dois anos, o Assistente de Databricks tornou -se um parceiro indispensável para os profissionais de dados, ajudando -os a gerar código SQL e Python, resolver erros e receber orientações contextuais diretamente em seus fluxos de trabalho. Durante esse tempo, a paisagem da IA avançou rapidamente. A fronteira mudou de copilotes e chatbots simples para agentes que podem raciocinar, planejar e executar processos complexos e complexos e de várias etapas.
Estender esse paradigma aos dados requer mais do que fluência no código. Os agentes de dados corporativos devem estar cientes do contexto de seus dados, permitir que você revise e refine o trabalho deles e opere com os mais altos padrões de governança. O Databricks está posicionado de maneira única para cumprir essa visão. Com o Catálogo da Unidade fornecendo políticas unificadas, linhagem e semântica de negócios, a plataforma já é a base confiável para a inteligência de dados. Com base nessa base, os agentes podem comprimir o tempo da pergunta para a percepção sem comprometer a transparência, confiança ou rigor. Esse é o futuro que agora estamos trazendo para o Assistente de Databricks.
Trazendo agentes para o Assistente de Databricks
Estamos orgulhosos de apresentar o Agente de Ciência de Dadosum grande avanço que eleva o Assistente de Databricks de um copiloto útil para um verdadeiro parceiro autônomo para ciência e análise de dados. Totalmente integrado aos notebooks Databricks e o editor SQL, o Agente de Ciência de Dados Reúne inteligência, adaptabilidade e execução em uma única experiência. É a primeira de uma nova geração de agentes de dados de IA disponíveis selecionando o modo de agente no assistente e começará a ser lançado para os clientes nos próximos dias.
O agente de ciência de dados se baseia em tudo o que você já faz com o Assistente de Databricks hoje e acelera massivamente seu trabalho quando você entrega tarefas de nível superior. Aqui estão apenas algumas maneiras de ajudar seu dia-a-dia:
- Explorando dados: Você pode solicitar ao agente que “execute a análise de dados exploratórios no @Desk para identificar padrões interessantes”. Você pode fornecer orientações adicionais se deseja concentrar a exploração em uma área específica. O recurso “@” é uma capacidade de assistente existente, facilitando a indicação do assistente à tabela específica que você está referenciando.
- Treinamento e avaliação de modelos ML: O agente pode executar tarefas de aprendizado de máquina, usando os recursos do MLFlow, conforme necessário. Por exemplo, você pode pedir ao agente que “treine um modelo de previsão prevendo vendas em @sales_table”. Em seguida, você pode orientá -lo para usar tipos de modelo específicos ou quanto se concentrar no ajuste do hiperparâmetro.
- Corrigindo erros: As pessoas adoram o botão de erro de diagnóstico do assistente. No modo de agente, o recurso de erro de diagnóstico pode ajudá -lo a fazer atualizações adicionais e tentar iterativamente a correção até que o problema seja resolvido.
- Resumindo e explicando resultados: Você pode pedir ao agente que explique e resuma os resultados de sua análise ou notice análises adicionais.
- Encontrando dados relevantes: O agente pode ajudá -lo a encontrar os dados necessários para concluir sua tarefa no catálogo de unidades pesquisando tabelas que você pode acessar. Tente descrever em detalhes o que você está procurando, como os nomes das colunas ou o tipo de dados. O agente de ciência de dados será mais útil para isso se suas mesas e colunas tiverem descritivas Comentários.
Respostas precisas e confiáveis
Nosso objetivo com o agente científica de dados é fornecer uma experiência de ciência e análise de dados em que você pode confiar, com respostas precisas, relevantes e fundamentadas nos dados da sua organização. Esse é um problema difícil, mesmo para os modelos de IA da Frontier, que por si só não entendem a semântica de seus dados, sua lógica de negócios ou a maneira como suas equipes funcionam. O agente de ciência de dados preenche essa lacuna, combinando o poder de raciocínio dos modelos de IA com a plataforma de inteligência de dados do Databricks, garantindo resultados que sejam confiáveis e com reconhecimento de contexto. Por exemplo, ele pode pesquisar um catálogo de unidades para aparecer as tabelas e notebooks certos e interpretar os resultados para sugerir as melhores etapas seguintes, como refinar uma análise, treinar um modelo ou resumir as descobertas para as partes interessadas. Ao fundamentar os fluxos de trabalho agênticos em um contexto governado, o agente de ciência de dados transforma a automação bruta em aceleração confiável.
Começando
Administradores de espaço de trabalho podem permitir o modo de agente assistente beta do Portal de visualização de banco de dados.
Depois que o seu administrador habilitar o modo de agente, você verá uma alternância no canto inferior direito do assistente. Alterne para Agentedigite sua tarefa e deixe o agente levá -lo do início ao fim. Para solicitações de várias etapas ou mais complexas, recomendamos experimentar o planejador para maior transparência e controle.
Usando o planejador para fluxos de trabalho mais complexos
A capacidade do planejador do agente ajuda a lidar com fluxos de trabalho complexos, elaborando um plano antes da execução. Ativá -lo no início de um tópico de assistente, e o agente proporá etapas detalhadas, fazendo perguntas esclarecedoras conforme necessário, depois refinando o plano com base na sua entrada. Depois de parecer certo, clique Continuar, e o agente o executará passo a passo, revisando os resultados com você ao longo do caminho e resumindo os resultados no remaining.
O planejador é especialmente valioso quando a tarefa abrange várias etapas ou requer uma orquestração cuidadosa. Por exemplo, em uma investigação de rotatividade, você pode orientar o agente através da exploração do conjunto de dados, análise de coorte e visualização. Ou, ao criar um pipeline de ML, o planejador pode ajudar a estruturar a limpeza de dados, a engenharia de recursos, o treinamento de modelos e a avaliação em um fluxo coerente.
Confirmação da ferramenta
Você fica no banco do motorista. Antes de executar o código, o agente solicita sua aprovação. Você pode optar por:
- Permitir uma vez: aprovar uma única execução
- Sempre permita este tópico: otimizar o trabalho na conversa atual do assistente. Isso redefine quando você pressiona o “+” no canto superior direito do painel assistente.
- Sempre permita: Dê aprovação até alterar a configuração
Além disso, o agente possui corrimãos embutidos para ajudar a reduzir ações não intencionais, como cair acidentalmente uma mesa. Dito isto, ainda recomendamos revisar o código gerado com cuidado, especialmente quando toca nos dados de produção, tabelas importantes ou outras operações sensíveis.
No horizonte
Olhando para o futuro, estamos investindo em várias melhorias para tornar o agente de ciência de dados ainda mais poderoso:
- Contexto mais amplo: Traga um contexto adicional através da integração do MCP. Isso fornecerá ao assistente um novo conhecimento que não tem hoje.
- Memória mais inteligente: Instruções de assistente Já são usados pelo agente de ciência de dados, mas queremos que o agente facilite ainda mais a atualização e o curador de suas instruções
- Descoberta de dados mais rápida: O agente de ciência de dados pode ajudá -lo a encontrar os ativos necessários para sua tarefa. É preciso um primeiro passo hoje com sua capacidade de pesquisar tabelas e código, mas estamos trabalhando para melhorar essa área.
O agente científico de dados é apenas o começo. O modo de agente crescerá para orquestrar cargas de trabalho inteiras nos Databricks. Estamos construindo para os fluxos de trabalho do agente para engenharia de dados e além, todos alimentados pela mesma fundação de confiança e regida.
Experimente o agente de ciência de dados hoje 🚀
Confira o nosso página do produto para saber mais sobre o Assistente de Databricks ou ler o documentação Para mais informações sobre todos os recursos.
Peça ao seu administrador para habilitar o modo de agente assistente do Databricks hoje e comece a transformar horas de trabalho em minutos. Isso lhe dará mais tempo para insights e menos tempo para a mecânica.