Acustica 08

La voce

Dopo esserci occupati degli strumenti, dedichiamo questo approfondimento alla voce, unico strumento in cui non si ricorre a qualcosa di esterno e di grande interesse perché riunisce sia l'aspetto musicale che quello della comunicazione linguistica.
Di solito non ci si pensa, ma il linguaggio ha una particolarità unica: è una forma di comunicazione completamente basata sul timbro. Infatti, sebbene di solito nel parlato ci sia anche una modulazione dell'altezza, essa può essere totalmente eliminata senza compromettere la comprensione.
Inoltre, come mostreremo, il nostro sistema percettivo è talmente specializzato nella decodifica del parlato che quest'ultimo può essere assogettato a manipolazioni che distruggerebbero il senso di qualsiasi altra forma di comunicazione, pur rimanendo intelleggibile.
Infine, l'apparato vocale è l'unico caso di cassa armonica di forma variabile che conosciamo.

Le corde vocali

Senza entrare in particolari fisiologici, le corde vocali sono due lamelle che vengono messe in vibrazione dal passaggio dell'aria. Non essendo particolarmente morbide, la loro vibrazione è di tipo impulsivo. Producono, cioè, una serie di 'toc' molto ravvicinati seguiti da un spazio vuoto.
Tale spazio viene poi riempito dalla risonanza del tratto vocale. In figura potete vedere le onde relative a una voce maschile (sopra) e femminile (sotto) che dicono la vocale aaaa.

Come si vede, le due onde sono simili, a parte l'ovvia differenza in frequenza della voce femminile, più alta.
In entrambi i casi, infatti, si vede l'impulso iniziale seguito dalla risonanza che, in pratica, è una piccola serie di echi generati dal tratto vocale che agisce come cassa armonica.
Ciò significa che, nei suoni tenuti, le corde vocali, da sole, non sono in grado di produrre timbri diversi, ma solo altezze diverse.
Il loro timbro è praticamente sempre identico per ciascun individuo e in generale corrisponde a quello di un'onda impulsiva il cui spettro tende alla lunga serie di armonici visibile nella figura qui sotto.

Questo, in linea di massima, è lo spettro che avrebbero le corde vocali private del tratto di risonanza.
Bisogna ricordare, poi, che non sempre le corde vocali entrano in azione. La maggior parte delle consonanti è prodotta mediante rumori generati dal passaggio dell'aria in un tratto vocale opportunamente configurato dalla posizione della mandibola, della lingua e delle labbra.
In questa sede ci occuperemo principalmente delle vocali, sia perché sono più interessanti didatticamente dal punto di vista timbrico, sia perché sono quelle su cui articola il canto classico.

I suoni vocalizzati

Intanto bisogna ricordare che le vocali sono ben più di 5. Nelle varie forme aperte, chiuse, mezze-aperte, mezze-chiuse, la lingua inglese ne conta da 10 a 14 che potete trovare qui.
L'italiano ha un doppio accento - grave e acuto - solo sulla [e] e sulla [o], ma, se si considerano anche i dialetti, si arriva facilmente alla decina.
La generazione delle vocali avviene nel modo seguente.
Il tratto vocale, che va dalle corde fino alle labbra, costituisce una vera e propria cassa armonica che filtra il suono prodotto dalle corde generando fino a 5 formanti, con le stesse modalità che abbiamo visto nel capitolo dedicato al timbro.
La particolarità della voce risiede nel fatto che, in questo caso, la forma della cassa armonica può essere cambiata per generare tutte le vocali. Ogni suono vocalizzato ha una propria caratteristica configurazione di formanti e quello che cambia da una vocale all'altra è solo questa configurazione.
Questa tabella riporta la posizione dei primi 3 formanti (F1, F2, F3) per alcune vocali della lingua inglese parlata nell'uomo, la donna e il bambino.


Formant
heed
head
had
hod
haw'd
who'd
Men
F1
270
530
660
730
570
300

F2
2290
1840
1720
1090
840
870

F3
3010
2480
2410
2440
2410
2240
Women
F1
310
610
860
850
590
370

F2
2790
2330
2050
1220
920
950

F3
3310
2990
2850
2810
2710
2670
Children
F1
370
690
1010
1030
680
430

F2
3200
2610
2320
1370
1060
1170

F3
3730
3570
3320
3170
3180
3260

Qui, invece, trovate anche i grafici dei formanti di un parlatore canadese maschio.
Come vedete confrontando i grafici con questa tabella, fra vari parlatori della stessa lingua, possono esistere differenze nella posizione dei formanti che, però, almeno per i primi tre, sono minime. I primi tre formanti, infatti, sono quelli che assicurano la compensibilità della vocale, mentre i successivi hanno solo un effetto di colore.
In questa pagina, invece, potete trovare i formanti delle vocali cantate per vari tipi di voce, ognuno con relativa ampiezza e estensione di banda.

Ora passiamo ad alcuni esempi sonori relativi alla vocale /a/ cantata da voci maschili. In questo esempio sentite il suono prima dell'applicazione dei formanti e dopo. Notate che prima non assomiglia affatto a una /a/:

 

In questo secondo esempio sentite 4 coppie di suoni, tutte prima e dopo i formanti. Sentite come, nonostante il suono originale cambi, applicando i formanti si ottiene sempre una 'a', sia pure con un colore diverso

Il linguaggio parlato

Il nostro apparato percettivo è particolarmente specializzato nella comprensione del parlato. Centinaia di migliaia di anni di evoluzione hanno costruito un sistema in grado di estrarre il significato da una serie di segnali anche se sono stati sottoposti a deformazioni estreme.
Notate che buona parte di queste manipolazioni sono elettroniche, quindi i risultati sono molto  lontani da qualsiasi sonorità naturale che potrebbe essere conosciuta dal nostro sistema percettivo. Si tratta di esperienze acustiche nuove che, nonostante questo, non mettono in crisi il sistema.

Gli esempi si basano sulla voce di Dylan Thomas che recita il primo verso di una sua poesia:


DYLAN THOMAS ORIGINALE


Tutte le frequenze delle componenti sono state spostate verso l'alto di 50 Hz. In tal modo il suono da armonico diventa inarmonico. Nonostante questo, il testo rimane comprensibile:

E' stato estratto l'inviluppo del segnale e le frequenze delle componenti sono state espanse verso l'alto in modo proporzionale all'ampiezza del suono. La voce ha assunto un andamento innaturale:

Filtraggio altamente selettivo su 100 Hz e armonici. In pratica sono state cancellate tutte le parziali lontane dagli armonici di 100 Hz. La voce diventa fissa sulla stessa altezza:

Spostamento totale delle componenti su una griglia di note predefinita, basata sul modo maggiore (sin) e sul minore armonico (dx):

               

Queste esperienze sono un'ulteriore prova della raffinatezza del sistema percettivo umano.