Publicato il 15 ottobre 2023
Apple ha presentato al pubblico la nuova gamma di iPhone. La quindicesima generazione dello smartphone arriverà sugli scaffali accompagnata dal sistema operativo iOS 17, le cui specifiche sono già note dal WWDC di giugno.
Tanto nel keynote quanto nella conferenza dedicata agli sviluppatori Apple ha sottolineato l’adozione di tecnologie, materiali e soluzioni di ultima generazione a livello hardware e software, con un’importante eccezione.
L’Intelligenza Artificiale generativa è stata la grande assente nelle nuove funzionalità di Siri, l’assistente vocale presente a bordo dei prodotti Apple dal 2011.
Quest’ultima ora interviene se chiamata per nome, senza bisogno di pronunciare il caratteristico “Ehi Siri", e accoglie più richieste contemporaneamente – ma i suoi limiti più grandi non sono ancora stati risolti.
In effetti molti utenti trovano che, dopo anni dalla sua introduzione, l’assistente vocale Apple sia rimasto indietro rispetto ai tempi. Questo svantaggio, inoltre, è percepito come tale non solo nei confronti dei competitor, ma anche e soprattutto rispetto ai Large Language Models come GPT-4, il modello alla base di ChatGPT.
Per comprendere al meglio i motivi dello svantaggio competitivo – vero o apparente che sia – di Apple nella corsa all’Intelligenza Artificiale, è opportuno fare un passo indietro, ricordando innanzitutto la differenza tra chatbot e assistenti virtuali.
Mentre entrambi i servizi sono progettati per favorire l’interazione diretta con gli utenti, i chatbot sono principalmente orientati alle conversazioni testuali, mentre gli assistenti virtuali come Siri sono progettati per eseguire una vasta gamma di azioni, basate sull’ecosistema di appartenenza, a partire da comandi vocali.
Nell’era del Web 2.0, un botta-e-risposta verbale con una voce sintetizzata e addestrata su un vasto database, in grado di elencare le funzionalità del nuovo iPhone, istruirci con nozioni di cultura generale e raccontare barzellette, rappresentava un’esperienza di gran lunga superiore a quella fornita dai rigidi chatbot di prima generazione.
Le altre grandi multinazionali del mondo tech non hanno tardato a cavalcare l’onda del successo di Siri, dando vita ai loro assistenti virtuali: ricordiamo innanzitutto Google Assistant e Alexa, l’assistente a bordo dei prodotti Amazon, ma anche di soluzioni proprietarie come Bixby, l’assistente virtuale di Samsung.
Nel corso del tempo Google Assistant, presente a bordo degli smartphone e tablet Android più recenti, si è arricchito con le funzionalità del celebre motore di ricerca, mentre Alexa “anima” le ricerche vocali sul marketplace di Amazon e le funzionalità di domotica di milioni di case in tutto il mondo.
Una sorte meno fortunata è toccata invece a Cortana, l’assistente virtuale di Microsoft che animava i PC Windows: recentemente l’app dedicata è stata abbandonata dallo stesso produttore a bordo dei dispositivi Windows 11, in vista di una futura integrazione con il chatbot AI Copilot.
Siri, capostipite dei moderni assistenti virtuali, continua a sopravvivere, ma è rimasta indietro: l’assistente vocale più longevo tra quelli prodotti dai “big” della tecnologia ha ormai alle spalle ben 12 anni di storia, costellati da ben pochi progressi significativi nell’esperienza utente.
ciL’Intelligenza Artificiale ha cambiato le carte in gioco per l’intero mondo della tecnologia: il settore degli agenti conversazionali non fa affatto eccezione.
All’interno dell’ondata innovativa causata dall’Intelligenza Artificiale generativa troviamo in una posizione di spicco i Large Language Models, o modelli linguistici di grandi dimensioni.
Come sappiamo bene in Neosperience, si tratta di una vera e propria rivoluzione, che permette ai chatbot di raggiungere capacità conversazionali e livelli di comprensione del linguaggio naturale impensabili fino a pochi mesi fa.
I chatbot arricchiti da una forma conversazionale di AI, come GPT-4, aprono la strada a innumerevoli scenari applicativi, sia in ambito personale sia in ambito enterprise.
I chatbot AI sono ormai ovunque: dall’utilizzo quotidiano di ChatGPT, capace anche nella sua versione gratuita di restituire output testuali facilmente rielaborabili e utilizzabili tanto sul lavoro quanto nella vita di tutti i giorni, fino alle applicazioni dell’Intelligenza Artificiale nell’ambito della Customer Experience, questi strumenti hanno contribuito ad alzare di molto l’asticella delle aspettative degli utenti.
Nel panorama degli assistenti conversazionali gli assistenti virtuali come Siri e Alexa hanno apparentemente già perso l’occasione perfetta per mantenere la loro rilevanza nei confronti del grande pubblico.
Come già anticipato, l’era degli assistenti virtuali tradizionali sembra essere ormai giunta al tramonto: i chatbot AI hanno cambiato completamente le carte in tavola e la rivoluzione dei Virtual Agent, capaci di portare la dimensione conversazionale su tutt’altro livello, è ormai alle porte.
Come ricorda un recente approfondimento del New York Times sul tema, gli assistenti virtuali sono poco al passo con le nuove generazioni, bonariamente scherniti nei talk show del sabato sera e in generale utilizzati con un certo grado di frustrazione. In altre parole, per usare l’espressione dell’amministratore delegato di Microsoft Satya Nadella, sono “stupidi come un sasso”.
Nonostante i loro evidenti limiti, tuttavia, Siri, Google Assistant e Alexa giocano ancora un ruolo importante nelle vite di molti.
Che sia per pura abitudine, per la loro intuitività o per questioni di accessibilità digitale, la partita degli assistenti virtuali non è ancora del tutto persa – e un’integrazione con l’AI, per quanto tardiva, può aiutarli a ribaltare il risultato.
Torniamo allora brevemente al paragrafo di apertura di questo articolo. A fine 2023 l’Intelligenza Artificiale generativa ormai è letteralmente e metaforicamente ovunque si parli di tecnologia… tranne, apparentemente, all’interno dell’assistente virtuale Apple. E per buoni motivi.
Una delle principali sfide affrontate da Siri è stata la sua architettura di base, ritenuta a detta degli stessi sviluppatori ingombrante e non facilmente adattabile. L'aggiunta o la modifica di funzioni e termini nel suo database, che contiene un vasto elenco di parole in quasi una ventina di lingue, è un'operazione che può richiedere settimane o addirittura mesi.
Questa lentezza contrasta con la capacità di altri sistemi di Intelligenza Artificiale, come appunto i Large Language Models, di generare risposte in tempo reale senza dipendere da risposte predefinite.
L’architettura alla base dei chatbot AI è infatti progettata per generare testo in risposta agli input ricevuti; a differenza di Siri, che si appoggia a un database esterno, i chatbot come ChatGPT generano le risposte in base al contesto fornito dall'input.
Mentre Siri si concentra su compiti specifici e interazioni funzionali all'interno dell'ecosistema Apple, comunicando solo superficialmente con il resto del Web, i chatbot conversazionali puntano a offrire risposte il più possibile dettagliate e coerenti, almeno dal punto di vista linguistico, su una vasta gamma di argomenti.
Il futuro di Siri rimane dunque un’incognita: nonostante le sue difficoltà architetturali e i ritardi nell'aggiunta di nuove funzioni, Apple non ha ancora cessato di investire nella sua evoluzione.
Gli ingegneri della società di Cupertino, inclusi quelli del team dedicato allo sviluppo di Siri, sono consci di questo svantaggio e stanno esplorando da tempo nuove possibilità di integrazione tra la struttura originale di Siri e le tecnologie di generazione di linguaggio, in modo da portarsi in futuro al passo con le esigenze degli utenti.
L’atteggiamento di Apple nei confronti dell’Intelligenza Artificiale è di cauto ottimismo. Laddove altre aziende hanno partecipato fin da subito all’entusiasmo per l’AI generativa, in una recente conferenza sui dati di bilancio il CEO di Apple Tim Cook ha sottolineato la necessità di procedere con prudenza nell’adozione di tecnologie ancora caratterizzate da grandi controversie.
Apple, d’altronde, integra già da anni l’Intelligenza Artificiale e il Machine Learning all’interno dei propri dispositivi, dalla fotografia computazionale al monitoraggio dei dati relativi a salute e benessere, passando per il rilevamento degli incidenti e, a partire da iOS 17, un correttore automatico completamente riprogettato dal punto di vista linguistico.
Insomma, almeno per i prossimi anni Apple sembra intenzionata, almeno per i prossimi anni, a proseguire su questo utilizzo “discreto” dell’Intelligenza Artificiale, senza proporre altre applicazioni consumer-oriented specificamente legate a questo tipo di tecnologia. Ma non è detto che lo scenario non si evolva in futuro.
Se gli assistenti virtuali come Siri vogliono recuperare terreno, sembra inevitabile – e alquanto urgente – provvedere all'integrazione con l’Intelligenza Artificiale generativa. La strada per raggiungere questo risultato, come abbiamo visto, è però complessa, costellata di controversie e ostacoli tecnici.
Da un lato, mentre il mondo della tecnologia si precipita in una corsa sfrenata all’utilizzo di questi strumenti, Apple preferisce diversificare i suoi sforzi e procedere con cautela, integrando forme consolidate di Intelligenza Artificiale laddove davvero servono, al di là dei trend del momento.
Dall’altro, per aziende come OpenAI, c'è una crescente pressione per stabilire una presenza dominante nel settore prima che giganti come Amazon, Google e la stessa Apple consolidino ulteriormente le loro posizioni sullo sviluppo uscendo dalla fase ancora embrionale di ricerca e sviluppo.
La recente partnership di OpenAI con Microsoft lancia d’altronde un segnale importante: il futuro risiede nelle collaborazioni tra i “padri fondatori” della tecnologia e i protagonisti del Web del futuro. In questo scacchiere tecnologico ogni mossa è cruciale, ma nella corsa all’Intelligenza Artificiale sarà l’unione a fare la forza.