Tertium Auris Blog

vocal analysis and sound experimentation

suono glottico

L’elevata pressione sottoglottica può essere considerata veramente deleteria se associata ad emissione in registro modale (pieno) con tempo di contatto delle pieghe vocali superiore al 50% e posizione elevata della laringe.
Le pressioni sottoglottiche influenzano:

  • la vibrazione delle CV per effetto Bernoulli

  • il timbro vocale, che viene determinato sicuramente dal filtraggio del vocal tract, ma anche dalla modalità di vibrazione delle CV, regolata dalle pressioni sottoglottiche e dai muscoli laringei

  • l’intensità

  • la portanza

  • indirettamente la F0 (frequenza fondamentale), controllata dai muscoli laringei, che aumentando o diminuendo la lunghezza e la tensione delle CV e quindi variando la superficie della glottide (spazio tra le CV) influiranno appunto sulla pressione sottostante

  • l’emissione in falsetto, dove sembra che i muscoli cricotiroideo e tiroaritenoideo non siano più sufficienti a controllare la F0

  • i tempi di contatto delle CV

  • la possibilità di emettere medesime frequenze con registri differenti

A questo punto risulta retoricamente evidente come il controllo della pressione sottoglottica sia fondamentale e necessario per la produzione vocale, e come esso sia in relazione al controllo diaframmatico. Infatti l’eccessiva e non controllata pressione sottoglottica dovuta ad uno scarso controllo diaframmatico può comportare un altissimo rischio patologico nonchè affaticamento vocale, del tipo

spingi giù e fuori il diaframma

che può favorire l’essere calante ed un vibrato ampio ed eccessivo (in ogni caso innaturale), ma anche del tipo

spingi in dentro e verso l’alto il diaframma

che al contrario può comportare una presunta compensativa chiusura della gola, intonazione crescente e vibrato caprile (anch’esso innaturale).

Anche la percezione di suono in maschera sembra sia correlata alla pressione fonatoria. Secondo l’americano Ingo Titze tale sensazione vibratoria, perchè questo è e nulla di più, diviene acusticamente percepibile sia dall’emettitore sia dall’ascoltatore in quanto non vera risonanza (appunto), ma come diminuzione della pressione fonatoria determinante un’effettiva conversione dell’energia aerodinamica in energia acustica.

Sappiamo che l’energia aerodinamica viene trasformata in energia acustica nella laringe. Diviene VOCE solamente dopo un complesso sistema di filtraggio ad opera del vocal tract e successiva emissione attraverso le labbra.
La fonazione vera e propria avviene esclusivamente a livello della glottide e riguarda il segnale alla sua sorgente; tutto il resto, da fonazione diventa articolazione e risonanza.

All’atto della fonazione il segnale risultante è di tipo

periodico complesso

Periodico in quanto ripete i suoi valori, la sua forma, ad intervalli uguali di tempo.
Complesso in quanto formato dalla somma algebrica di onde sinusoidali con rispettive frequenze e ampiezze.

by marco tonini using ESystem

Sarà quindi caratterizzato da una frequenza fondamentale F0 e da componenti definite armoniche in quanto con frequenza a multipli interi della F0. Quindi lo stesso segnale può divenire complesso aperiodico per irregolare vibrazione delle CV, con conseguente generazione di rumore; le componenti non saranno armoniche in quanto non più multipli della F0.

Vediamo ora la differenza tra segnale glottico, la sorgente, e la voce, dopo il vocal tract: ovviamente il primo avrà uno spettro più semplice per assenza di filtraggio da parte del tratto vocale, e sarà praticamente identico a prescindere dalle diverse vocali emesse – anche se con indagine EGG (elettroglottografia) si possono evidenziare minime variazioni – e le ampiezze delle componenti armoniche diminuiranno con l’aumentare della frequenza, dimostrando che il picco di energia si ottiene con frequenze basse:

  • nella parte alta della figura di destra notiamo uno spettro sonoro di sawtooth che dovrebbe simulare lo spettro di un suono vocale glottico, in quanto abbastanza somiglianti;

  • nella parte centrale della figura possiamo vedere i picchi delle prime tre formanti, posti rispettivamente a 500, 1500 e 2500 Hz, come previsto mediamente per un tratto vocale umano di adulto (circa 17 centimetri), che andranno ad agire come banco di filtri e a  strutturare timbricamente il suono vocale;

  • nella parte bassa della figura abbiamo il risultato acustico, ovvero il suono glottico filtrato, che ovviamente varierà a seconda del tipo di vocale emessa e quindi delle mutazioni delle cavità di risonanza del tratto vocale.

Un altro aspetto interessante del suono vocale alla sorgente è dato dalla differenza non perfettamente lineare in ampiezza della prima componente armonica in relazione alle seguenti; lo spettro, come già detto, risulta relativamente semplice, con riduzione progressiva dell’ampiezza delle componenti armoniche dalla 1° in poi  di 12 dB per ogni raddoppio della frequenza, e non è poco. Quindi già la seconda componente armonica sarà a  -12 dB, la quarta a -24 dB e così via.

Ecco a riguardo un interessante articolo da www.ncvs.orgNational Center for Voice and Speech/Division of The Denver Center for the Performing Arts and a Center at The University of Iowa:


[...]

Spectral slope influences the timbre of the sound, just as waveform shape does, as described above. A spectral slope of around 6 dB/octave, the least severe slope in the graph, results in stronger high frequencies, which yield a more ‘brassy’ or strident sound. The middle slope depicted, 12 dB/octave, is that of a normal vocal quality. The most extreme slope shown, 18 dB/octave, would result in a more ‘fluty’ sound; it has stronger low frequencies, as compared to the higher ones, which rapidly drop off in strength.

La frequenza fondamentale F0 è determinata dall’attività di apertura-chiusura della glottide, ed è variabile mediamente in funzione di sesso ed età. Ecco qui sotto un elenco delle frequenze fondamentali (ovviamente in Hertz), dai primi anni di vita all’adolescenza, proposte da Wilson alla fine delgli anni ’70 nel suo Voice disorders in children:

D.K. Wilson - classificazione delle frequenze fondamentali

 

Questi valori si riferiscono alle frequenze producibili esclusivamente alla sorgente, per cui a prescindere da ciò che si pronuncia di fatto, dato che il tatto vocale influenza solo ampiezza e fase delle componenti armoniche, mentre il segnale prodotto delle corde vocali può variare in frequenza e/o in ampiezza, e ciò può dipendere dalla pressione sottoglottica, nonchè dalla lunghezza, tensione e modalità di vibrazione delle stesse.

Alla nascita le corde vocali misurano circa 5 millimetri, per poi allungarsi fino ai 15/22 mm. nell’uomo e ai 12/17 mm. nella donna. Si può notare come nei primi anni non vi siano condiderevoli differenze; la posizione laringea e la massa cordale difatti sono molto simili tra i due sessi, così come la lunghezza delle pieghe vocali. Una cosiddetta voce bianca, ovvero voce di bambino/a che non ha ancora raggiunto la pubertà, non presenta infatti particolari differienziazioni acustiche tra maschio e femmina, presentando simili dimensioni del tratto vocale e delle corde vocali. Il termine bianca, un tempo utilizzato per la voce degli eunuchi, starebbe ad indicare la purezza e il candore giovanile.

Con l’età questi parametri varieranno determinando la struttura timbrica del suono vocale. Infatti abbiamo già osservato come la diversa conformazione assunta dal tratto vocale, a cui anche le diverse posizioni della laringe concorrono, determina appunto diverse frequenze di risonanza.

A tal fine ricordo l’esistenza dell’applicazione per windows VTDemo, di cui ho già parlato qui, mediante la quale possiamo analizzare gli effetti vocalici ottenuti andando a variare tutta una serie di modelli articolatori, compresi il basculamento della cartilagine cricoide (atteggiamento tipico del pianto) e la pressione sottoglottica.

 

 

 

 

 

.