Scrivere digitale nel 2022: cosa cambia con gli Smart Speaker

Comandi Alexa Speaker

Diversi anni fa pubblicai un post dedicato alla scrittura per smartphone, la brevità era al centro, bisognava scrivere pezzi facili da leggere su piccoli schermi, per un tempo limitato, magari durante gli spostamenti. Quella tendenza non è cambiata, ma creare contenuti che si adattino ai nuovi media significa concepire testi per interfacce non più soltanto grafiche ma conversazionali.

Gli assistenti vocali hanno avuto uno sviluppo incredibile e sono entrati ormai a far parte della tecnologia di consumo quotidiano. In quanto autori non si può sottovalutare il fatto che qualsiasi cosa stiamo producendo, un gioco, un racconto, un intero libro sarà disponibile per la lettura su dispositivi integrati di funzioni vocali. Io stessa ho comprato un piccolo Echo dot pensando di usarlo per ascoltare la radio, invece ho finito per chiedere ad Alexa tutto ciò che prima cercavo sullo smartphone, giocare a Escape Room, persino ascoltare l’ultimo ebook acquistato su Kindle quando non ho avuto tempo per sedermi a leggerlo.

Certo gli assistenti vocali sono capacissimi di trovare risposte pertinenti e comprendere il contesto di una ricerca, grazie al lavoro degli sviluppatori che creano delle vere proprie sceneggiature seguendo il cosiddetto happy path, il percorso ideale che dovrebbe prendere una conversazione per soddisfare le richieste di un utente. Questi possono includere messaggi di benvenuto, flussi di dialogo differenti in base a intenti ed espressioni (utterance), infine messaggi di uscita.

interfaccia di lavoro di Voiceflow

Ciò che ne esce fuori è qualcosa di molto simile agli schemi utilizzati per le storie interattive, e in effetti in questi casi l’utente è direttamente coinvolto, non clicca più su uno schermo, ma utilizza le parole per attivare una skill, risponde a delle domande per arrivare al contenuto che desidera (c’è A e c’è B. Cosa vuoi fare?).

Audiolibri con narrazione automatica

Diverso è il caso della lettura ad alta voce di un libro, lì siamo completamente passivi, è facile che la mente segua i suoi propri percorsi distraendosi dall’ascolto, inoltre le voci artificiali fanno presto a diventare monotone. Allo stesso tempo non possiamo ignorare che esiste anche questa modalità di lettura e sapete perché?

Il settore dell’audiolibro è quello che sta registrando la crescita più significativa sul mercato, ma i costi di produzione sono ancora molto alti, specie per gli indipendenti che non possono permettersi di mettere su uno studio o ingaggiare dei narratori. La sola alternativa sono i software di sintesi vocale: Google ha già attivato la conversione automatica per i libri in lingua inglese; Speechki può produrre audiolibri per un minimo di cinquecento dollari e averli pronti per la pubblicazione in soli due giorni lavorativi, e sfida a riconoscere la differenza tra voce artificiale e umana.

Narratori e voci artificiali a confronto

Non sono semplici software di text-to-speech questi, ma potrebbero dare ulteriore impulso al loro sviluppo. Nel frattempo, da scrittori potremmo chiederci se non sia il caso di tenere in considerazione il fatto che i lettori abbiano nelle loro case anche degli smart speaker su cui ascoltare le nostre storie e crearle di conseguenza, insomma lavorare proprio come quei progettisti con i loro happy path.

Personalmente ho fatto un piccolo esperimento per riuscire a portare gli estratti degli Ebook in Adozione su Alexa. Ho utilizzato Lovo.ai per convertire il testo in voce, si possono scegliere da una libreria le voci di narratori in base ai possibili scenari, ben presto però mi sono accorta che i contenuti avevano bisogno di un editing appropriato allo scopo.

Scrivere pensando al formato audio

Innanzitutto il programma Blueprint per creare Flash Card Skill non consente di caricare audio superiori ai cinque minuti, dunque ho dovuto ridurre la lunghezza del testo limitandomi ai tratti sufficienti per comprendere il contesto in cui si svolge la scena.
Poi, la voce artificiale chiude le frase con la stessa identica intonazione, una specie di cantilena, perciò ho lavorato sulla punteggiatura per dare ritmo alla narrazione tenendo conto della sacra legge per cui le frasi lunghe rallentano l’azione mentre le frasi più brevi l’accelerano.
Infine ho eliminato i dialoghi perché Lovo non consente l’utilizzo di due voci alternate e non essendoci incisi tra le battute era difficile capire chi diceva cosa.

Malgrado, scambiando qualche email, un consulente Speechki mi abbia detto che non è importante il come è scritto un testo per la conversione, questi sono i principali problemi che ho dovuto affrontare per passare da testo a voce, per audio di due o tre minuti al massimo. Ma anche in ambienti più sofisticati il passaggio non è così immediato solo perché esiste la tecnologia; è ancora una scrittura ben pensata a creare una completa immersione.

C’è un interessante video di Jon Ingold di Inklestudios che spiega come creare dialoghi credibili in un ambito di gioco e lo fa prendendo spunto da una scena di Blade Runner, dunque un film che non richiede allo spettatore alcuno sforzo di immaginazione. Ma cosa succede se alla stessa scena sottraiamo i personaggi in carne e ossa?

Inkestudio masterclass estratto

Il rischio è quello di un calo immediato della tensione, che poi è ciò che ci tiene immersi in una storia. Se non possiamo vederla sui volti dei protagonisti dobbiamo crearla con le parole, esattamente come per un libro?

No, come abbiamo visto le interfacce conversazionali richiedono un ritmo diverso. La difficoltà essenziale sta nel riuscire a raccontare una storia completa mentre si ottengono le informazioni giuste nel modo più conciso possibile. Come sostiene la game writer Susan O’connor: “Quando una sceneggiatura lascia le cose giuste non dette, il pubblico riempie gli spazi vuoti. Vengono coinvolti nella storia. Co-creano la narrazione”.

Che nel contesto di un’interfaccia conversazionale può significare:

  • tenere conto dell’ambientazione e del rapporto tra i personaggi per rendere credibili i dialoghi, attraverso quei sottintesi che persone con una base di esperienze condivise nel mondo reale utilizzerebbero;
  • con le dovute misure, senza scadere nel luogo comune, fare ricorso a metafore che aiutino a semplificare concetti ed eliminare descrizioni fin troppo minuziose;
  • sfruttare i dettagli sensoriali per creare immagini vivide. Mai come in questo caso il lettore ha bisogno di vedere, sentire e vivere il mondo della storia.

Provate anche voi a far leggere il vostro testo, magari un piccolo racconto, da un assistente vocale e ditemi se non diventa subito chiaro quali passaggi potrebbero essere tagliati via, è anche un ottimo esercizio di editing.

Per approfondire

“Pendolare in bottiglia”, dal libro ad Alexa

Pensi che possa essere utile a un amico? Condividi!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Potrebbe interessarti anche:

Unisciti agli Scrittori dell'Era Digitale

eBook & Media Kit

Scopri i segreti per lanciarti alla grande con il tuo libro online, 25 pagine e schemi da usare subito per:

  • prepararti a pubblicare al meglio
  • trovare i tuoi lettori sul Web
  • ottenere attenzione e recensioni