Alexa, Siri, Cortana, Bixby e Google Home sono gli “assistenti vocali” di casa: sono arrivati da pochi anni, ma hanno subito conquistato il mercato. Rispondono ai nostri ordini ed eseguono piccole e grandi mansioni al posto nostro. Non sono esenti da errori, ma migliorano continuamente. 

Gli assistenti vocali sono sempre più diffusi, negli uffici e nelle nostre case. Non sono perfetti, ma con l’arrivo dell’Intelligenza Artificiale (AI) la loro qualità è diventata sempre più performante. 

Ultimamente, si sono registrati diversi disagi da parte degli utenti che non riescono, in certe situazioni, a dettare con precisione i loro messaggi (specialmente per istruzioni con la nostra voce che riguardano il timer e la sveglia). Per fortuna, i “bug” sono stati sistemati e i comandi in linguaggio naturale sono sempre di più compresi dall’assistente vocale di Google. 

La sfida del linguaggio naturale 

Questi miglioramenti derivano da una riprogettazione completa del sistema utilizzato dall’Assistente per la comprensione del linguaggio naturale. Amarnag Subramanya, un famoso ingegnere di Google che guida i team NLU e Conversational AI su Google Assistant, ha dichiarato che, dopo questi miglioramenti, le conversazioni molto più naturali tra noi umani e i nostri aiutanti non umani. 

“Attualmente, quando le persone vogliono parlare con qualsiasi assistente digitale, pensano a due cose: cosa voglio che venga fatto e come dovrei formulare il mio comando per farlo”, dice Subramanya. “Penso che sia molto innaturale. C’è un enorme carico cognitivo quando le persone parlano con gli assistenti digitali; la conversazione naturale può essere un modo in cui il carico cognitivo va via” 

Rendere le conversazioni con l’assistente più naturali significa migliorare la sua risoluzione di riferimento e la sua capacità di collegare una frase a un’entità specifica. Ad esempio, se diciamo: “Imposta un timer per 10 minuti” e poi diciamo “Modificalo in 12 minuti”, un assistente vocale deve capire e risolvere ciò a cui fai riferimento. 

L’algoritmo BERT 

I nuovi modelli NLU (Natural Language Understanding, in inglese) sono sviluppati dalla tecnologia di apprendimento automatico, in particolare rappresentazioni di encoder bidirezionali dai trasformatori o BERT. Google ha rivelato questa tecnica nel 2018 e l’ha applicata prima al motore di ricerca. La prima tecnologia di comprensione del linguaggio veniva utilizzata per decostruire ogni parola in una frase da sola, ma il BERT elabora la relazione tra tutte le parole nella frase, migliorando notevolmente la capacità di identificare il contesto. 

Un esempio di come BERT ha migliorato la ricerca si è applicato quando provate a cercare “Parcheggio in collina senza cordoli”. Prima, i risultati contenevano ancora “colline con cordoli”. Dopo che BERT è stato abilitato, le ricerche su Google hanno offerto un sito Web che consigliava ai conducenti di puntare le ruote sul lato della strada. 

Tuttavia, BERT non è stato esente da problemi. Studi di ricercatori di Google hanno dimostrato che al modello sono associate frasi riferite a disabilità con linguaggio negativo , spingendo l’azienda a essere più attenta con i progetti di elaborazione del linguaggio naturale. 

Per le funzioni rapide arriva Guacamole 

Comunque, in un percorso di rinnovamento, che ha di recente coinvolto anche Google Maps, il colosso di Mountain View punta a semplificare l’esperienza con il suo Assistente Vocale anche attraverso all’utilizzo di alcune scorciatoie. La nuovissima funzione, si chiama “Guacamole”, permette infatti di eseguire dei comandi rapidi senza la necessità di attivare l’Assistente Vocale con la keyword “Ok Google”. 

Questa feature presentata nell’ultimo APK dell’Assistente Google, porta dunque all’attivazione delle cosiddette shortcut e la descrizione della pagina recita testualmente “Salta la parola -Ok, Google- per alcune attività veloci”. Gli scenari di utilizzo saranno molto probabilmente i più comuni in ambiente domestico, come ad esempio l’arresto di un timer o di una sveglia recitando semplicemente il comando “stop” oppure la risposta a una chiamata in arrivo. Al momento però la funzione è  in fase di test, ma presto questa comoda feature arriverà a una fase di distribuzione pubblica e dunque sui nostri smartphone in maniera stabile. 

Comments are closed.