articolo originariamente pubblicato su AF Digitale – aprile 2011
Negli ultimi anni, gli schermi HD di grandi dimensioni sono diventati accessibili ai più e si sono diffusi capillarmente. Nonostante la loro crescita dimensionale, l’integrabilità estetica e funzionale dei flat screen è aumentata significativamente.
Grazie alle tecnologie LED, infatti, lo schermo ha raggiunto spessori trascurabili, diventando un oggetto di design da ammirare nel proprio soggiorno di casa. Anche l’impianto audio è sottoposto a simili pressioni, ma arranca in questo obiettivo di integrabilità. Cerchiamo di capire perché.
Diversi gradi di immersività
In generale, i mezzi video e audio hanno natura e caratteristiche profondamente diverse, soprattutto in termini di invasività, pervasività e immersività. Con invasività si intende il grado di impedimento funzionale dell’utente derivante dal suo coinvolgimento sensoriale.
Mi spiego meglio: il mezzo video è per sua natura invasivo perché la sua fruizione impedisce all’utente di svolgere agevolmente altre attività. Diversamente, l’audio è poco invasivo perché l’ascolto non preclude altre attività (ascoltiamo musica mentre guidiamo, cuciniamo, o facciamo jogging).
La pervasività, invece, descrive il grado di “fruibilità geografica” del mezzo (audio o video) considerato. Il rendering video, quindi, non è pervasivo perché è fruibile solo in condizioni di visibilità ottica, quindi possiamo godercelo da un’area piuttosto limitata.
Al contrario, il rendering audio non ha particolari vincoli perché l’ascolto è possibile anche in presenza di ostacoli interposti. Ovviamente esistono posizioni privilegiate in cui la scena acustica viene riprodotta con particolare fedeltà, ma spostarci da queste non preclude un ascolto di qualità.
L’immersività descrive quanto il rendering (audio o video) è in grado di ricreare nell’utente la sensazione di essere presente nella scena (acustica o visiva) resa. Per quanto riguarda il mezzo video, l’immersività è tanto maggiore quanto più grande è l’angolo visivo da cui si osserva lo schermo. Questo angolo visivo, però, dipende dalla risoluzione dello schermo.
Nel caso di schermi HD (1920×1020 pixel) la distanza ottimale di osservazione minima è circa 2 volte e mezza la diagonale dello schermo (distanza minima per non “vedere i pixel”), corrispondente a un angolo visivo di circa 30 gradi.
Chiaramente il grado di immersività che ne consegue è molto limitato. Per arrivare a angoli visivi che impegnino anche la nostra visione periferica occorre esporsi a formati IMAX o superiori, che portano l’angolo visivo a superare i 100-120 gradi, ma queste tecnologie sono ovviamente fuori portata per un uso domestico.
Audio e video Complementari
Contrariamente al caso video, l’audio consente facilmente di raggiungere un grado elevato di immersività anche solo con i sistemi multicanale disponibili oggi. Con un buon sistema multicanale, infatti, possiamo ricreare la sensazione di essere presenti nella scena acustica attraverso una corretta riproduzione delle direzioni di arrivo del suono. Risultati significativamente migliori si potranno raggiungere nel futuro con tecniche di rendering audio 3D.
Riassumendo, su tutti e tre i fronti percettivi (invasività, pervasività e immersività) il rendering audio e il rendering video offrono prestazioni totalmente complementari. Questi tre aspetti giustificano la diversità nelle tendenze evolutive dell’audio e del video.
La scarsa immersività del mezzo video, infatti, è un problema difficilmente superabile, se non sfruttando aspetti percettivi “cross-modali”. Il mezzo audio, per sua natura immersivo, tende infatti a compensare la scarsa immersività indotta dal mezzo video. Questa sinergia fra audio e video è molto importante e si spinge oltre la sola immersività. Per questa ragione è importante promuovere una forte differenziazione evolutiva dei sistemi di rendering audio e video.
Se all’audio risulta facile stimolare il senso di presenza, è bene che i sistemi di rendering audio si concentrino su questo. Se il video non può prescindere da un livello elevato di invasività, è bene che lo faccia con altissima resa visiva (alto range dinamico, alta risoluzione, resa 3D), magari valorizzato da un design accattivante. Sistemi audio che favoriscono l’immersività sono per loro natura spazialmente distribuiti. L’utente, infatti, deve avere la sensazione di essere posto in mezzo alla scena acustica. Il multicanale, ad esempio, consente una corretta riproduzione delle direzioni d’arrivo del suono.
I futuri formati di rendering audio 3D consentiranno anche di ricreare nell’ascoltatore l’esatta percezione della posizione spaziale e dell’orientamento di tutte le sorgenti acustiche rese dal sistema. Tanto maggiore è il flusso informativo associato alla scena acustica che si vuole trasmettere all’utente, tanto maggiore è il numero di emettitori da distribuire nello spazio.
Con l’aumentare del numero di emettitori, ovviamente, cresce la complessità dell’installazione del sistema di rendering audio, che risulta quindi difficilmente integrabile in un ambiente domestico. Siamo quindi di fronte a un dilemma tecnologico: i sistemi di rendering audio hanno bisogno di evolvere verso la distribuzione spaziale, ma la tecnologia di oggi non ce lo consente.
Soundbar, una soluzione possibile
Una parziale e timida soluzione al problema è offerta dalle soundbar, che sono schiere di piccoli altoparlanti montati su una singola struttura compatta che ben si abbina per spessori e forme all’estetica degli schermi di grandi dimensioni.
Le soundbar più recenti sono in grado di sfruttare le mura domestiche come specchi acustici per ricreare una certa spazialità nel suono prodotto. Attraverso elaborazione di fase sono in grado di proiettare fasci acustici fortemente direzionali e farli rimbalzare sui muri di casa una o due volte per dare allo spettatore la sensazione che il suono provenga da direzioni diverse da quella in cui è posizionata la soundbar (laterali e posteriori).
In qualche modo, quindi, le soundbar mirano all’immersività acustica pur rimanendo spazialmente compatte. Purtroppo, però, la soundbar è più “intrusiva” di quanto non ci sia dato di credere, perché richiede ampie superfici riflettenti (muri liberi) in posizioni prescritte per creare un suono sorround. Non essendo capaci di adattarsi alle geometrie sempre diverse degli ambienti domestici, pongono seri vincoli di integrabilità nell’arredamento di casa.
Una soluzione più avveniristica l’ho discussa nell’articolo “il salto quantico”, pensando a una distribuzione spaziale di piccoli proiettori acustici (mini-soundbar) capaci di adattarsi e sfruttare la geometria casuale dei riflettori acustici disponibili nell’ambiente (pareti, ante dei mobili, finestre, soffitto, pavimento) per creare una sistema di rendering audio distribuito composto sia dalle soundbar fisicamente presenti nell’ambiente, sia dalle soundbar “immagine” (quelle cioè che appaiono virtualmente “dall’altra parte” degli specchi acustici).
Tutta questione d’immagine
Proprio poche settimane fa il laboratorio di Sound and Music Computing, del Politecnico di Milano, nell’ambito del progetto Europeo SCENIC da me coordinato, ha realizzato e dimostrato il primo sistema di rendering audio capace di sfruttare le pareti esistenti per abbattere le riverberazioni reali dell’ambiente e per creare una scena acustica immersiva usando sia soundbar reali che soundbar “immagine”.
In pratica, siamo di fronte al primo sistema composto da una distribuzione spaziale di proiettori acustici in cui contribuiscono sia i proiettori fisici che quelli “immagine”. Si tratta di una soluzione che raggiunge un duplice obiettivo: sfruttare gli specchi acustici casualmente presenti nell’ambiente per ridurre pesantemente il numero di emettori fisici da distribuire nello spazio, e nel contempo ridurre l’impatto dell’acustica ambientale, che solitamente tende a ridurre la qualità del rendering.
La fattibilità di questo nuovo approccio, finalmente dimostrata in un ambiente reale, crea la necessità di nuove evoluzioni tecnologiche. Rimane infatti il problema di come realizzare questi proiettori acustici in modo tale che si possano facilmente inserire e integrare nell’ambiente. Dobbiamo quindi porci il problema di quali siano i dispositivi e le tecnologie abilitanti per la prossima generazione di sistemi audio distribuiti.
Chiariamo anzitutto quali sono gli ingredienti necessari per l’audio distribuito. Per esplorare l’ambiente alla ricerca di specchi acustici e caratterizzarne le geometrie e le caratteristiche riflettive occorre disporre di schiere compatte che integrano molti microfoni di piccole dimensioni. Se usassimo tecnologie convenzionali, dovremmo far uso di costose schede audio multicanale in grado di alimentare i microfoni e digitalizzarne i segnali in modo sincrono.
Fortunatamente esistono già oggi tecnologie molto promettenti che consentono di realizzare schiere di microfoni a bassissimo costo in grado di produrre flussi di dati digitali già multiplexati. Da oltre anno ST Microelectronics sta lavorando, col nostro supporto, alla realizzazione dei primi prototipi di schiere integrate di microfoni MEMS (MicroElectroMechanical Systems). I microfoni MEMS sono ormai diffusissimi sul mercato, soprattutto dei telefoni cellulari, grazie all’elevato rapporto prestazioni/prezzo, alle dimensioni ridotte, e al fatto che integrano al loro interno un sistema di conversione analogico-digitale del segnale acquisito.
Collaborando con noi (anche nell’ambito del progetto SCENIC), il laboratorio Advanced Systems Technologies di ST ha già realizzato con successo una prima schiera di 8 microfoni che integra un sistema di sincronizzazione e multiplexing dei vari flussi digitali prodotti dai singoli microfoni. Lo stesso laboratorio sta attualmente lavorando a schiere con geometrie più complesse, utilizzanti un numero di microfoni significativamente più elevato (16, 24, 32). Stiamo attualmente sperimentando schiere integrate di microfoni MEMS digitali per la caratterizzazione ambientale e il sensing distribuito.
Sul fronte del rendering audio la situazione è estremamente interessante ma, nel contempo, molto più incerta.
Quando l’altoparlante diventa micro
Da qualche anno, infatti, si parla molto dei micro-altoparlanti CMOS-MEMS, perché promettono di rovesciare completamente le regole su cui si basano gli emettitori acustici tradizionali. Molto sinteticamente, questi altoparlanti presentano membrane in movimento di dimensioni estremamente ridotte (dell’ordine del millimetro quadrato o anche meno), in grado di produrre segnali digitali “binari” (la membrana può infatti assumere due sole posizioni possibili).
Individualmente, quindi, questi “speaklets” possono solo produrre dei “click”. D’altro canto, un utilizzo simultaneo e coordinato di moltissimi microaltoparlanti di questo tipo, è in grado di produrre forme d’onda molto più complesse e articolate, con efficienze senza precedenti.
Questo tipo di tecnologia, ovviamente, ha suscitato l’interesse delle aziende produttrici di grandi schermi LCD (soprattutto coreane e giapponesi), poiché offrono una via d’uscita al problema dell’integrazione di altoparlanti negli schermi LED ultrasottili. Guardando però a un futuro meno prossimo, questa tecnologia appare particolarmente allettante per il rendering audio distribuito.
Possiamo infatti immaginare una nuova generazione di proiettori acustici composti da “un mare” di microaltoparlanti digitali, realizzabile con spessori estremamente ridotti. Questi proiettori acustici potrebbero facilmente integrarsi in modo non intrusivo nelle ante dei mobili, o in altri elementi d’arredo.
Purtroppo, però, la tecnologia CMOS-MEMS è ancora molto acerba, quindi non ha ancora prodotto i risultati sperati. La qualità dei segnali è ancora molto limitata, quindi c’è ancora molto da fare per rendere questi sistemi adatti a un uso high-end. Mi riprometto quindi di tornare sull’argomento MEMS per raccontarvi come funzionano questi sistemi e discutere miti e realtà di questa tecnologia emergente.
© 2019, MBEditore – TPFF srl. Riproduzione riservata.