Manus: la prima IA agente generale al mondo può davvero sostituire l'utente?

Il 6 marzo 2023, la startup cinese Manus AI ha svelato una nuova intelligenza artificiale chiamata Manus, definita come la “prima IA agente generale al mondo”. Questo strumento, caratterizzato dall’essere open-source, ha catturato l’attenzione di esperti e appassionati del settore grazie a una presentazione che promette di trasformare il nostro modo di interagire con la tecnologia.

Un video dimostrativo e una serie di casi d’uso pubblicati sul sito web della startup hanno mostrato le capacità di Manus in scenari complessi. Tra i vari esempi, Manus è in grado di:

Pianificare un viaggio di due mesi in Australia, Nuova Zelanda e Argentina, presentando un itinerario dettagliato in una pagina HTML navigabile.
Esaminare curricula di candidati per posizioni nel campo informatico, fornendo un’analisi approfondita delle loro competenze.
Cercare immobili a New York in base a criteri come la sicurezza, la qualità delle scuole e il budget disponibile.

A differenza di altri strumenti simili, come Deep Research di OpenAI e Google, Manus sembra vantare una maggiore agilità nella gestione delle richieste degli utenti. Mostra anche la propria navigazione sul web, un aspetto che ricorda il funzionamento di Operator, l’agente IA di OpenAI progettato per interagire con i siti web. Questo elemento di trasparenza nella navigazione è un punto di forza che distingue Manus da molte altre soluzioni disponibili.

Origine del nome e ambizioni

Il nome “Manus” trae origine dal motto latino “Mens et Manus”, che significa “Mente e Mano”, motto emblematico del Massachusetts Institute of Technology (MIT). Questo collegamento con un’istituzione così prestigiosa sottolinea l’ambizione della startup nella creazione di un’intelligenza artificiale avanzata.

Nonostante l’entusiasmo iniziale, gli sviluppatori di Manus AI hanno avvertito gli utenti che si tratta ancora di un prodotto in fase di anteprima. Le segnalazioni degli utenti indicano la presenza di vari problemi, come messaggi di errore, loop infiniti e difficoltà nel reperire informazioni, che dovrebbero essere facilmente accessibili online. Situazioni come il crash nell’acquisto di voli o nel prenotare pasti sono state riportate da chi ha avuto accesso all’anteprima.

Sfide e limitazioni

Questi problemi non sono sorprendenti, considerando che Manus è una tecnologia basata su deep learning transformer, che, essendo intrinsecamente probabilistica, può presentare imprecisioni, soprattutto quando si tratta di argomenti complessi. Attualmente, Manus utilizza un’architettura multi-agente che impiega diversi modelli di intelligenza artificiale per eseguire compiti complessi. Durante una discussione su X, il cofondatore di Manus AI, Yichao ‘Peak’ Ji, ha spiegato che il sistema è dotato di vari strumenti integrati, inclusi Claude 3.5 Sonnet e modelli Qwen fine-tuned, insieme a diversi moduli ausiliari come Stainer-32B-preview, utilizzati per la pianificazione.

Quando un utente interagisce con Manus, comunica con un “agente esecutore” (executor agent), il quale è responsabile dell’esecuzione diretta dei comandi. Tuttavia, questo agente non ha accesso diretto ai dettagli degli altri agenti coinvolti nel sistema, come quelli dedicati alla pianificazione o alla raccolta di conoscenze. Questo approccio presenta due vantaggi principali: ottimizza la memoria contestuale, riducendo il carico di token elaborati dal modello principale, e garantisce una maggiore sicurezza e modularità, separando l’esecuzione dalle fasi di pianificazione e acquisizione di conoscenze.

Prospettive future

Sebbene Manus possa apparire promettente, è importante sottolineare che non è ancora un prodotto rivoluzionario. Ad esempio, è possibile pianificare un itinerario complesso anche utilizzando strumenti come Deep Research di OpenAI, che ha dimostrato di essere capace di generare itinerari dettagliati, incluse pagine HTML navigabili. Tuttavia, la vera sfida rimane la verifica della correttezza delle informazioni fornite. Anche se gli utenti sono spesso colpiti dalla presentazione visiva e dalle informazioni create in modo rapido, è fondamentale considerare l’affidabilità e la precisione di queste informazioni.

La comunità tecnologica continua a seguire con attenzione gli sviluppi di Manus, tra entusiasmo e scetticismo. Il potenziale di un’IA che possa effettivamente operare come un agente generale è intrigante e potrebbe segnare un passo significativo nella direzione di una maggiore automazione e assistenza personalizzata. Tuttavia, si dovrà attendere di vedere come Manus evolverà e supererà le attuali limitazioni, sebbene le promesse iniziali siano senza dubbio stimolanti per il futuro dell’intelligenza artificiale. Con il continuo progresso nel campo dell’IA e l’emergere di nuove tecnologie, Manus potrebbe rappresentare una delle tante innovazioni nel panorama in costante cambiamento dell’intelligenza artificiale.