La rivoluzione vocale alla base del successo dei contenuti audio

Dal 2011 ad oggi sono tante le novità audio e c’è chi dice che siamo solo all’inizio

Quella che ormai è in atto da qualche tempo è una vera e propria rivoluzione vocale, che sta rivalutando l’utilizzo della voce anche nella tecnologia.

Un esempio sono le numerose novità da Spotify Hi-Fi a Tiktok che vuole entrare nel mondo dei podcast.

Ma prima ancora, un esempio di ciò probabilmente arriva da Siri, che ha fatto il suo debutto su iPhone4S, e che ha introdotto il comando vocale per utilizzare il cellulare senza digitare nessun tasto.
Da quel lontano 2011 le cose sono cambiate, e hanno fatto diventare la voce un mezzo attivo.

Prima, infatti, era la macchina che comunicava con noi, non si instaurava uno scambio, ma era solo un ascolto passivo. E poi c’è stata la svolta.

Ovviamente, ci sono esempi precedenti, che però rimangono legati al contenuto visivo, come le videochiamate, soprattutto tramite le app Messenger e Skype. Si trattava comunque di comunicazione e scambio tra esseri umani, quindi non può essere riconducibile a ciò che si sta verificando attualmente, ora che la voce ha assunto un valore molto diverso.

2011, anno della svolta per la comunicazione vocale

L’anno zero, stabilito nel 2011, è stato sicuramente favorito anche dall’avvento del Web 2.0, che ha reso più semplice e possibile la iperconnettività. Da qui, infatti, con una connessione continuativa, sono cambiate le nostre abitudini e comportamenti in rete.

Non solo Siri, dunque, anche se rimarrà sempre il primo esempio, ma anche Echo, il primo assistente vocale fisico nato nel 2014, e Alexa che ormai è presente nelle case di utenti di tutto il mondo.

E due anni dopo è arrivato Whatsapp, che ha aperto la possibilità di inviare non solo messaggi scritti, ma anche messaggi vocali istantanei, cambiando così il modo di comunicare. Nonostante qualcuno fosse scettico su questa modalità di messaggistica, in realtà ha attecchito, perché la voce è in grado di restituire all’ascoltatore le giuste emozioni, che nei messaggi scritti possono essere equivocate.

Via libera alla voce, dunque, che resiste anche all’introduzione periodica di nuove emoji e che è capace di trasmettere empatia, descrivere sentimenti e raccontare storie proponendole con il giusto contenitore.

L’avvento dei nuovi format audio

Ma Whatsapp è stato solo il preludio a quanto successo dopo, quando abbiamo assistito alla creazione di nuovi format, a partire dai podcast, che inizialmente venivano semplicemente associati a programmi radiofonici con una marcia in più, perché maggiormente veloci ed immediati.

Poi sono arrivati gli audiolibri, un format nel quale nessuno credeva, poiché considerati incapaci di sostituire la lettura di un libro. Ma sfogliare le pagine non sempre viene considerato indispensabile, e ancora una volta la voce sa donare qualcosa che le parole scritte non danno: una narrazione capace di creare atmosfere suggestive e comunicare le giuste intenzioni dell’autore, per far scaturire le emozioni più vere.

Anche Clubhouse può entrare nel novero dei format vocali più rilevanti degli ultimi anni, anche se la sua potenza, o meglio, il suo potenziale, si è esaurito nel giro di un anno. Quella che sembrava un’idea brillante, infatti, non ha saputo rinnovarsi e stare al passo con social già conosciuti e utilizzati a livello internazionale.

Sulle ceneri di Clubhouse, ad esempio, Twitter ha proposto, nel 2021, gli Spaces, ovvero chatroom vocali che riprendono lo stile e le intenzioni di Clubhouse, trovando una buona quota di consensi.

La speech recognition come supporto per chi ha disabilità

La tecnologia si rivela utile non solo per essere sempre al passo coi tempi e sperimentare nuove tecniche di comunicazione, ma anche per supportare chi ha disabilità.

Parliamo della speech recognition, ad esempio, che permette di riconoscere un messaggio vocale e trascriverlo, e quindi di abbattere barriere comunicative, ad esempio per i non udenti.

Se la tecnologia è in grado di garantire accessibilità, estendendosi alla vita quotidiana rendendola più semplice e fruibile, significa che funziona ed è in grado di fornire un servizio, oltre che permettere di essere sempre connessi.

In quest’ottica, l’Università dell’Illinois ha avviato una collaborazione con colossi del settore, come Amazon, Apple, Google, Meta e Microsoft, per dare vita al progetto Speech Accessibility, che ha come obiettivo quello di migliorare il riconoscimento vocale per gli utenti con disabilità.

Pensiamo alla SLA, al Parkinson, alla paralisi cerebrale e ad altre condizioni che potrebbero limitare le capacità comunicative degli utenti: l’innovazione e la tecnologia aiutano coloro che soffrono di queste malattie a rimanere connessi con il mondo e soprattutto a comunicare con i loro cari. Semplicemente, non esiste motivazione migliore per continuare su questa strada e sperare in continui progressi della tecnologia.

Verso un futuro sempre più vocale

Per quanto riguarda la vita quotidiana, il futuro è già qui e ci permette di migliorare sia la nostra produttività sia il nostro tempo libero. Ottimizzare è spesso la parola più saliente, nelle nostre giornate frenetiche, quindi perché non lasciarsi guidare dalla tecnologia per raggiungere i propri target?

Basta pensare alla possibilità di avviare tramite comando vocale una ricerca, pronunciando le parole chiave, oppure far diventare la propria abitazione ancora più smart. Con una parola si possono spegnere o accendere le luci di casa, avviare la lavastoviglie, regolare il termostato e molto altro.

Ciò che manca, ad oggi, è riuscire a far comprendere alle macchine le sfumature della voce, e questa potrebbe essere una sfida: inventare una tecnologia ancora più all’avanguardia che riesca ad interpretare gli stati d’animo dell’utente.
Ovviamente c’è chi storce il naso e pensa che ciò sia impossibile, ma gli scettici ci sono sempre, ed erano gli stessi che non credevano ai messaggi vocali e al successo degli audiolibri, e sappiamo com’è finita…