Todos na IA estão falando sobre Manus. Nós o colocamos à prova.


Desde que o agente do normal AI Manus foi lançado na semana passada, ele se espalhou on -line como o Wildfire. E também não apenas na China, onde foi desenvolvido pelo efeito Butterfly Startup Butterfly, com sede em Wuhan. Ele entrou na conversa international, com vozes influentes da tecnologia, incluindo o co-fundador do Twitter, Jack Dorsey e abraçando Victor Mustar, líder de produto, elogiando seu desempenho. Alguns até o apelidaram de “o segundo Deepseek”Fazendo comparações com o modelo de IA anterior que pegou a indústria de surpresa – tanto por suas capacidades inesperadas quanto sua origem.

Manus afirma ser o primeiro agente geral de IA do mundo-liderando vários modelos de IA (como o Claude de 3,5 sonetos do Anthropic e versões ajustadas finas do QWEN de código aberto do Alibaba) e vários agentes operacionais de forma independente para atuarem autonomamente em uma ampla gama de tarefas. (Isso é diferente dos chatbots da IA, incluindo Deepseek, baseado em uma única família de modelos de idiomas e são projetados principalmente para interações conversacionais.)

Apesar de todo o hype, muito poucas pessoas tiveram an opportunity de usá -lo. Atualmente, menos de 1% dos usuários na lista de espera receberam um código de convite. (Não está claro quantas pessoas estão nesta lista de espera, mas, com uma sensação de quanto interesse existe, o canal de discórdia de Manus tem mais de 186.000 membros.)

MIT Expertise Overview foi capaz de obter acesso ao Manus e, quando dei um check drive, descobri que o uso de ele parece colaborar com um estagiário altamente inteligente e eficiente: embora ocasionalmente não tenha entendimento do que é solicitado a fazer, faz com que as suposições incorretas ou que possam melhorar os cantos para serem fornecidos por tarefas que explicam claramente, e podem melhorar os cantos. Por fim, é promissor, mas não perfeito.

Todos na IA estão falando sobre Manus. Nós o colocamos à prova.

Assim como o produto anterior da empresa -mãe, um assistente de IA chamado Monica que foi lançado em 2023, Manus é destinado a um público international. O inglês é definido como o idioma padrão e seu design é limpo e minimalista.

Para entrar, um usuário deve inserir um código de convite válido. Em seguida, o sistema direciona os usuários para uma página de destino que se assemelha a os de ChatGPT ou Deepseek, com sessões históricas exibidas em uma coluna esquerda e uma caixa de entrada de bate-papo no centro. A página de destino também apresenta tarefas de amostra com curadoria da empresa – distribuindo o desenvolvimento da estratégia de negócios até o aprendizado interativo e as sessões personalizadas de meditação de áudio.

Como outras ferramentas Agentic AI baseadas em raciocínio, como ChatGPT DeePresearch, o Manus é capaz de dividir tarefas em etapas e navegar autonomamente na Net para obter as informações necessárias para concluir as tarefas. O que o diferencia é a janela “Manus’s Pc”, que permite que os usuários não apenas observem o que o agente está fazendo, mas também intervém em qualquer momento.

Para testá-lo, eu encarreguei o Manus com três tarefas: (1) compilar uma lista de repórteres notáveis ​​que cobrem a China Tech, (2) pesquisam listagens de propriedades de dois quartos na cidade de Nova York e (3) nomear possíveis candidatos para Inovadores com menos de 35 anosuma lista criada por MIT Expertise Overview todos os anos.

Aqui está como isso aconteceu:

Tarefa 1: A primeira lista de repórteres que Manus me deu continha apenas cinco nomes, com cinco “menções honrosas” abaixo deles. Percebi que ele listou o trabalho notável de alguns jornalistas, enquanto não outros. Perguntei a Manus por que isso fez isso. A razão pela qual ele ofereceu foi hilariamente simples: ficou preguiçoso. Foi “parcialmente devido a restrições de tempo enquanto tentava agilizar o processo de pesquisa”, disse -me o agente. Quando insisti em consistência e rigor, Manus respondeu com uma lista abrangente de 30 jornalistas, observando sua saída atual e listando um trabalho notável. (Fiquei feliz em ver que fiz o corte, junto com muitos de meus amados colegas.)

Fiquei impressionado que fui capaz de fazer sugestões de nível superior para mudanças, da mesma forma que alguém faria com um estagiário ou assistente da vida actual, e que ele respondeu em espécie. E, embora inicialmente ignorasse as mudanças no standing do empregador de alguns jornalistas, quando pedi para revisitar alguns resultados, rapidamente os corrigiu. Outro bom recurso: a saída period obtain como um arquivo Phrase ou Excel, facilitando a edição ou o compartilhamento com outras pessoas.

Manus atingiu um obstáculo, ao acessar os artigos de notícias dos jornalistas por trás dos paywalls; Frequentemente encontrava blocos Captcha. Como pude acompanhar passo a passo, eu poderia facilmente assumir o controle para concluí -los, embora muitos websites de mídia ainda bloqueassem a ferramenta devido a atividades suspeitas. Vejo potencial para grandes melhorias aqui – e seria útil se uma versão futura do Manus pudesse pedir ajuda proativamente quando encontrar esse tipo de restrição.

Tarefa 2: Para a busca de apartamentos, dei a Manus um conjunto complexo de critérios, incluindo um orçamento e parâmetros para uma cozinha espaçosa, espaço ao ar livre, acesso ao centro de Manhattan e uma grande estação de trem a uma caminhada de sete minutos. Manus inicialmente interpretou requisitos vagos como “algum tipo de acesso ao ar livre” muito literalmente, excluindo completamente propriedades sem um terraço privado ou acesso à varanda. No entanto, após mais orientações e esclarecimentos, foi capaz de compilar uma lista mais ampla e útil, dando recomendações em camadas e pontos de bala.

A saída closing parecia direta de Wirecuttercontendo legendas como “Melhor Geral”, “Melhor Valor” e “Opção de Luxo”. Essa tarefa (incluindo a ida e volta) levou menos de meia hora-muito mais rápido do que compilar a lista de jornalistas (que levou pouco mais de uma hora), provavelmente porque as listagens de propriedades estão mais abertas e bem estruturadas on-line.

Tarefa 3: Esse period o maior escopo: pedi a Manus para nomear 50 pessoas para os inovadores deste ano, com menos de 35 anos. Produzir esta lista é um empreendimento enorme e normalmente recebemos centenas de indicações todos os anos. Então, eu estava curioso para ver como Manus poderia se sair. Ele divulgou a tarefa em etapas, incluindo a revisão de listas anteriores para entender os critérios de seleção, criar uma estratégia de pesquisa para identificar candidatos, compilar nomes e garantir uma seleção diversificada de candidatos de todo o mundo.

O desenvolvimento de uma estratégia de pesquisa foi a parte mais demorada para Manus. Embora não tenha descrito explicitamente sua abordagem, a janela do computador do Manus revelou que o agente rolando rapidamente por websites de prestigiadas universidades de pesquisa, anúncios de prêmios de tecnologia e artigos de notícias. No entanto, ele encontrou novamente obstáculos ao tentar acessar trabalhos acadêmicos e conteúdo de mídia de paywall.

Depois de três horas vasculhando a Web – durante qual Manus (compreensivelmente) me perguntou várias vezes se eu poderia restringir a pesquisa – só conseguiu me dar três candidatos com perfis completos de fundo. Quando o pressionei novamente para fornecer uma lista completa de 50 nomes, ele finalmente gerou um, mas certas instituições e campos acadêmicos estavam fortemente tremendous -representados, refletindo um processo de pesquisa incompleto. Depois que apontei o problema e pedi para encontrar cinco candidatos da China, ele conseguiu compilar uma sólida lista de cinco nomes, embora os resultados tenham se inclinado para os queridinhos da mídia chinesa. Por fim, tive que desistir depois que o sistema alertou que o desempenho de Manus poderia diminuir se eu continuasse inserindo muito texto.

Minha avaliação: Geral, Eu achei o Manus uma ferramenta altamente intuitiva adequada para usuários com ou sem codificação de fundo. Em duas das três tarefas, ele forneceu melhores resultados do que quando eu apresentava as mesmas tarefas para chatgpt deepresearch, embora demorasse significativamente mais para concluí -las. Manus parece mais adequado para tarefas analíticas que exigem uma extensa pesquisa na Web aberta, mas têm um escopo limitado. Em outras palavras, é melhor manter os tipos de coisas que um estagiário humano qualificado poderia fazer durante um dia de trabalho.

Ainda assim, nem tudo é suave. Manus pode sofrer de acidentes frequentes e instabilidade do sistema e pode lutar quando solicitado a processar grandes pedaços de texto. A mensagem “Devido à alta carga atual de serviço, as tarefas não podem ser criadas. Por favor, tente novamente em alguns minutos ”, apareceu na tela algumas vezes ao iniciar novas solicitações e, ocasionalmente, o computador de Manus congelou em uma determinada página por um longo período de tempo.

Tem uma taxa de falha mais alta do que o chatgpt deepresearch – um problema que a equipe está abordando, de acordo com ao principal cientista de Manus Ji. Dito isto, mídia chinesa 36kr Relata que o custo por tarefa de Manus é de cerca de US $ 2, que é apenas um décimo do custo da DeePresearch. Se a equipe do Manus fortalecer sua infraestrutura de servidor, posso ver a ferramenta se tornando uma escolha preferida para usuários individuais, principalmente profissionais de colarinho branco, desenvolvedores independentes e pequenas equipes.

Finalmente, acho que é realmente valioso que o processo de trabalho de Manus pareça mais transparente e colaborativo. Ele faz perguntas ativamente ao longo do caminho e mantém as principais instruções como “conhecimento” em sua memória para uso futuro, permitindo uma experiência agêntica facilmente personalizável. Também é muito bom que cada sessão seja repetível e compartilhável.

Espero continuar usando o Manus para todos os tipos de tarefas, tanto em minhas vidas pessoais quanto profissionais. Embora eu não tenha certeza de que as comparações com a Deepseek estão certas, isso serve como evidência adicional de que as empresas de IA chinesas não estão apenas seguindo os passos de seus colegas ocidentais. Eles não estão apenas inovando nos modelos básicos, mas moldando ativamente a adoção de agentes autônomos de IA à sua maneira.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *