
Embora os bots de IA tenham começado a dominar tarefas em navegadores e no Home windows, as empresas que usam Mac têm sido amplamente esquecidas até agora. A OpenAI pretende mudar isso com a aquisição da fabricante de interfaces de IA generativa Software program Functions Integrated.
A base dessa integração é o Sky, um assistente generativo baseado em IA e compatível com entrada de linguagem pure para macOS que a startup com sede em São Francisco vem desenvolvendo para ajudar os usuários a automatizar várias tarefas.
“Esteja você conversando, escrevendo, planejando ou codificando, a Sky entende o que está na sua tela e pode agir usando seus aplicativos”, escreveu a startup em seu portal descrevendo a Sky.
Dando controle de IA do sistema operacional
A ideia de automatizar tarefas para usuários de desktop não é totalmente nova. No ano passado, em outubro, a Anthropic se tornou o primeiro fornecedor de LLM a mostrar a possibilidade de controlar um computador ou algumas partes de seu sistema operacional.
Essa habilidade, que a Antrópica denominou “uso do computador”, permitiu que os desenvolvedores instruíssem Claude 3.5 Sonnet, por meio da API Anthropic, a ler e interpretar o que está na tela, digitar texto, mover o cursor, clicar em botões e alternar entre janelas ou aplicativos.
Ela chamou a atenção de especialistas e empresas, pois a capacidade representava um grande avanço em relação às práticas de automação mais tradicionais, como automação de processos robóticos (RPA), que exigiam mais tempo e mão de obra para serem configuradas e ainda assim exigiriam manutenção constante.
Outro problema com as ferramentas RPA period que os usuários corporativos ou desenvolvedores teriam que alterar o código ou script conforme a interface do sistema operacional mudasse. Em contraste, a capacidade da Anthropic demonstrou que os LLMs podem entender o que estão vendo, eliminando a necessidade de alterar scripts à medida que as interfaces mudam.
Poucos dias após o anúncio da Anthropic, o Google também entrou na briga do uso de computadores baseados em IA, apresentando Jarvisuma oferta projetada para automatizar tarefas como pesquisa e compras dentro o Navegador Chrome com a ajuda da empresa Gêmeos 2.0 LLM.
Na mesma época, OpenAI supostamente revelou que estava trabalhando em uma capacidade semelhante desde fevereiro do ano passado.
A aquisição da Sky e sua integração ao ChatGPT, segundo analista principal da Forrester Charlie Daié um passo significativo da OpenAI para ganhar uma fatia considerável do mercado nascente, mas em evolução, de automação baseada em IA, impulsionado por IA agente.
É provável que a OpenAI comercialize casos de uso que envolvam automatização de fluxos de trabalho em aplicativos, assistência de codificação e integração com ferramentas de colaboração para aumentar a produtividade, disse Dai, acrescentando que a empresa está visando o macOS, pois é standard entre desenvolvedores e profissionais criativos, proporcionando-lhe uma base de clientes considerável.
A integração da Sky ao ChatGPT não é o único produto que a OpenAI possui como parte de sua presença no macOS.
Na semana passada, lançou o ChatGPT Atlas – um navegador com ChatGPT integrado – projetado para automatizar tarefas como reservas diretamente na janela do navegador, ecoando Jarvis do Google.
Espera-se que a OpenAI lance Atlas para Home windows, iOS e Android no futuro. A Microsoft, parceira próxima da OpenAI, introduziu recursos semelhantes para Home windows por meio do modo Copilot em seu navegador Edge.