No momento em que escrevo este blogpost, estou a apenas uma semana do fim do meu estágio de verão na equipe de Análise Exploratória de Dados (EDA) aqui na Databricks. Não acredito que o verão passou tão rápido — parece que foi ontem que eu estava clonando o repositório da minha equipe e importunando meus amigos de integração por ajuda! Ao longo de 12 semanas, concluí uma série de três fases de projeto com um tema subjacente: melhorar a experiência do usuário para interagir com imagens no pocket book da Databricks.
O Caderno Databricks
Se você já interagiu com dados por meio de código, provavelmente usou um pocket book. Notebooks são um tipo de editor de código para Python, SQL, Scala e R, comuns em ciência de dados e aprendizado de máquina como um meio de extrair e usar dados. Como uma empresa de Dados + IA, a Databricks fornece aos clientes seu próprio pocket book profundamente integrado à plataforma.
O que é o Databricks Pocket book?
O pocket book Databricks suporta os recursos regulares que outros notebooks suportam, como um editor de código, itens de menu e o Databricks Assistant. Mas o que é especial sobre o pocket book Databricks é que ele é extremamente bem integrado com o restante dos produtos Databricks: Jobs, Delta Reside Tables (DLTs), pré-treinamento e ajuste fino Generative AI (GenAI) e muito mais. Os clientes usam o pocket book Databricks para acessar todo o conjunto de ofertas Databricks, portanto, criar uma experiência de pocket book perfeita (que é o foco da equipe EDA) é um elemento importante para a Databricks desbloquear o poder dos dados para seus clientes.
Qual problema meu projeto de estágio abordou?
O pocket book Databricks é um produto maduro, mas como qualquer produto, sempre há coisas para melhorar! Transformar dados em insights é tanto sobre contar uma história quanto sobre processar números, e as imagens são uma parte basic disso. Além disso, à medida que o GenAI se expande para diferentes domínios, como visão e geração de imagens, o treinamento e o ajuste fino de modelos com imagens e vídeos estão se tornando cada vez mais comuns. A Databricks lançou recentemente Imagem ShutterstockAIque gera imagens personalizadas de alta qualidade com base em necessidades comerciais específicas.
Pesquisadores e engenheiros em todo o mundo usam o pocket book Databricks todos os dias para inúmeras aplicações que envolvem arquivos multimídia. No entanto, até recentemente, trabalhar com arquivos multimídia no pocket book period trabalhoso. Por exemplo, os clientes tinham que descobrir maneiras indiretas de incorporar imagens em células de markdown do pocket book, e eles não conseguiam nem abrir imagens do navegador de arquivos.

Meu projeto de estágio de verão focou em melhorar a experiência do usuário para interagir com imagens no pocket book do Databricks. Abaixo estão os principais recursos que lancei neste verão.
Principais características
Incorporando imagens no Markdown do pocket book
Adicionamos a capacidade de incorporar imagens em células de markdown em um formato markdown padrão mais amigável ao usuário. Agora, os clientes podem incorporar imagens com caminhos relativos e absolutos (/Workspace
para arquivos de espaço de trabalho e /Volumes
para arquivos de volumes). Isso dá aos clientes mais flexibilidade na introdução de imagens em seus notebooks, seja para visualização de dados, treinamento de imagens ou alívio cômico felino.

Arraste e solte imagens nas células do pocket book
Uma ação pure para os clientes é arrastar e soltar imagens no pocket book. Anteriormente, arrastar e soltar uma imagem no pocket book do Databricks resultava na abertura da imagem em uma nova aba do navegador, o que interrompia o fluxo do cliente e impedia que os clientes usassem as imagens facilmente.
Agora, arrastar e soltar uma imagem em uma célula de marcação do pocket book carrega automaticamente a imagem para o sistema de arquivos do espaço de trabalho e a incorpora na célula!

Devido à natureza acelerada do Databricks e à rápida iteração do produto, consegui implementar totalmente a maioria dos principais recursos do meu projeto para produção até o remaining do meu estágio! Ter tanto impacto no cliente como estagiário nunca foi algo que passou pela minha cabeça antes deste verão, e sou muito grato por ter tido a oportunidade de ter uma influência clara em nosso produto no período de apenas três meses.
Minha experiência de estágio
Meu projeto de estágio não foi a única coisa que pude fazer neste verão! Tive a oportunidade de participar do Knowledge + AI Summit (DAIS) de 2024, trabalhar em um projeto de hackathon authorized com o Databricks Assistant, visitar o novo e crescente escritório do Databricks em Seattle e fazer muitas, muitas excursões deliciosas de refeições com minha turma de estágio.
Neste verão, tive a oportunidade de conhecer, aprender e trabalhar com muitos dos líderes da indústria no espaço de Dados + IA. Além disso, interagir com uma classe de estagiários grande e enérgica me deixou mais animado com as novas tecnologias do que nunca. Não hesito em dizer que realmente fiz amigos para a vida toda durante meu tempo aqui.
Gostaria de agradecer especialmente ao meu mentor Richard Fung, minha gerente Neha Sharma, nosso diretor de organização do Workspace, Ted Tomlinson, e ao resto da equipe da EDA por sua mentoria. Cada um dos membros da minha equipe foi tão impressionantemente inteligente, mas modesto — assistindo a cada uma das minhas pequenas demonstrações de recursos e dando suggestions extensivo para ajudar a tornar os recursos do meu projeto melhores. Eles me ensinaram habilidades inestimáveis que levarei pelo resto da minha carreira.
Se você é apaixonado por construir produtos interessantes e impactantes, então eu recomendo que você se inscreva para trabalhar na Databricks! Você pode conferir as oportunidades de emprego atuais no Carreiras Databricks página.