Malcangi - Informatica applicata al suono OCR.pdf

December 11, 2016 | Author: jopa | Category: N/A
Share Embed Donate


Short Description

Download Malcangi - Informatica applicata al suono OCR.pdf...

Description

al Suono

Altri libri della collana: M. Malcangi - “Elaborazione Numerica del segnale - Digital Signal Processing: teoria e pratica”

k

Informatica Applicata al Suono Indice

ì. 2. 3.

4. 5. 6. 7. 8. 9.

10. 11. 12.

.............................................................. 5 Fondamenti di acustica........................... 7 Fondamenti di psicoacustica................... 25 Digitalizzazione del suono....................... 47 Analisi del suono....................................... 65 Modifica del suono................ 99 Sintesi del suono........................................ 137 Analisi e sintesi della voce............ .......... 161 Compressione del suono......................... 175 Spazializzazione del suono...................... 195 Architetture DSP per l’audio..................

205

Bibliografia ................................................

241

Prof. Mario Malcangi malcangi@dico. unimi. it

Prefazione Il contenuto di questo corso è il risultato della sintesi di numerose argomentazioni, distribuite su altrettanto numerose pubblicazioni, relative alle molteplici discipline che concorrono alla della problematica dell’elaborazione dell’informazione del segnale audio (suono): matematica, teoria dei segnali, acustica e psicoacustica, teoria dei sistemi, elaborazione numerica dei segnali, architetture speciali di elaborazione del segnale numerico, ecc. Rimando quindi ai riferimenti in bibliografia per un approfondimento relativo ai fondamenti delle suddette tematiche di base. L’obiettivo del corso è di offrire allo studente le conoscenze necessarie e sufficienti per affrontare la progettazione di applicazioni audio digitali (incluse le applicazioni vocali) con un approccio di natura sistemistica, avvalendosi delle conoscenze informatiche, nonché delle necessarie conoscenze matematiche e fisiche di base. Algoritmi e modelli di elaborazione del segnale sono una importante componente di conoscenza di base per chi deve affrontare lo studio dell’audio digitale. Queste conoscenze devono essere completate sia dal punto di vista della specificità della natura dell’audio digitale, sia esplorando le problematiche implementative. Lo studio delle architetture di calcolo orientate aH’elaborazione numerica del segnale (DSP) è un’altra importante componente di conoscenza di questo corso. L’audio digitale implica un’attività di elaborazione numerica del segnale molto intensiva e conseguentemente, la scelta della giusta architettura di calcolo numerico per realizzare una specifica applicazione è una conoscenza che lo studente deve avere per essere preparato a soddisfare le richieste applicative dell’industria dell’audio digitale.

;

\ i

' ■

Introduzione

00101001010001 00101001001010 00101000100101 01010001011101 10010100010010

Prof. Mario Malcangi malcangi@flico. unimUt 27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

Introduzione La tecnologia audio originariamente è di natura analogica, in quanto analogica è la natura del suono e dei suoi meccanismi naturali di produzione. La variazione di tensione elettrica che viene prodotta in uscita da un microfono non è altro che un’analogia elettronica della variazione di pressione delParia che caratterizza il suono che raggiunge il microfono medesimo. La tecnologia audio analogica, pur avendo raggiunto livelli di qualità sufficienti a soddisfare le esigenze applicative professionali e di consumo, ha evidenziato notevoli limiti applicativi, soprattutto nell’integrazione con altre tecnologie come la comunicazione o l’automazione. La degradazione del segnale audio, ad esempio, non può _ess.ere_adeguatamente controllata ne! dominio analogico,, quindi la comunicazione dell’informazione audio diventa problematica con le grandi distanze. La tecnologia audio digitale, grazie all’applicazione delle metodologie di elaborazione numerica dell’informazione, ha consentito di superare queste limitazioni intrinseche dell’elaborazione analogica del segnale audio, aprendo un ventaglio di applicazioni virtualmente illimitato. Le applicazioni della tecnologia audio digitale sono numerose e sempre più diffuse in un cotesto ove la tecnologia dell’informazione mette a disposizione piattaforme di computing sempre più potenti e adatte a soddisfare esigenze applicative emergenti come l’audio su Internet, le interfaccie uomo-macchina avanzate, i sistemi multimedia, i dispositivi di comunicazione portatili, ecc.

Per approfondimenti: [Watkinson 01].

;r,i

.

-N. ^ V,

• « M * Ju w p W - Jp « * * p »»W1« *1»«' a ia * 1Ï" ■' ÍIV

•'

°

Fondamenti di acustica

27/01/2004 •

Copyright 2002-2003 Prof. Mario Malcangi

7

I suoni si manifestarla sotto forma di fenomeno acustico (meccanico). Tale fenomeno è determinato dalla vibrazione ^ corpi nell*aria. II suono è il risultato della modifica dello stato di equilibrio dello stato gassoso (aria) che caratterizza un ambiente (aperto o chiuso). I principi di acustica descrivono la natura e le caratteristiche del suono relativamente alle generazione e alla propagazione nello spazio. La conoscenza di tali principi consente di modellizzare sistemi di produzione sintetica del suono intesa a simulare la generazione di suoni naturali (per esempio un sistema di sintesi vocale) oppure di progettare strumenti per la produzione di suoni non naturali (per esempio un pianoforte). Sempre grazie alla conoscenza dei principi di acustica, è l’effetto di propagazione del suono nello spa naturali (ad esempi lleco) in ambienti ove il fenomeno non può manifestarsi neturalmente, oppure progettare sistemi che consentono di produrre effetti di spazializzazione non ottenibili in natura. Per approfondimenti: [Olson 67]

Fondamenti di acustica Natura del suono

27/01/2004

8

Copyright 2002-2003 Prof. Mario Malcangi

Il suono è il fenomeno di compressione e rarefazione che determina un’azione co (ad esempio l’aria). Il suono è anche la dalla percezione del fenomeno di compressione e rarefazione dell’aria in prossimità dell’organo uditivo. Il suono viene prodotto quando un oggetto meccanico si mette in movimento determinando una modifica dello stato di quiete degli ambienti gassosi, fluidi o liquidi in cui è immerso. In natura i suoni vengono prodotti da fenomeni tipici dell’ambiente (ad esempio le foglie che messe in movimento dal vento urtano tra loro e strisciano sul terreno). I suoni possono essere anche prodotti da sistemi artificiali creati dall’unomo (ad esempio il suono prodotto da un motore di automobile). Gli strumenti sono ip iù importanti sistemi di produzione di suoni artificiali in quanto •consentono di controllare in maniera quasi completa tutti i parametri acustici. —

— rn i

minin mi mi

mi

■ ■ , ,, ,i— m*M»**niit1fr'r‘

l'Il H»' ni

m ijn iiifHi i i t ninÉM ni r i

-

■ fl

'''

I suoni sono parte integrante dell’ambiente entro cui viviamo, in parte graditi (voce, m usica,...), in parte utili (campanello, sirena, ecc.), in parte sgraditi (rumori). L’aspetto più importante del suono è la sua natura di segnale, cioè di informazione acustica. L’informazione che caratterizza il suono è codificata nella cosiddetta onda sonora. L’onda sonora è il mezzo di trasporto dell’informazione acustica e consiste di di compressione e di rarefazione del mezzo trasmissivo in cui si propaga. Le infinite modalità di conformazione dell’onda sonora consentono le altrettanto infinite possibilità di produzione dei suoni.

Fondamenti di acustica Parametri fisici del suono

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

Velocità di propagazione del suono

Il suono si propaga in un gas (ad esempio nell’aria) a una definita velocità. Lunghezza d ’onda e velocità di propagazione

La velocità di propagazione di un’onda sonora può essere derivata dalla lunghezza d’onda e dalla frequenza. La lunghezza d’onda di un suono è la distanza che il suono percorre per completare un ciclo completo di compressione e rarefazione. La frequenza è il numero di cicli al secondo che si osservano in un punto determinato dello spazio (ad esempio il punto di ascolto). I suoni si propagano a velocità differenti se caratterizzati da frequenze differenti. Intensità sonora

L’onda sonora trasporta energia. Tale energia viene chiamata “intensità sonora”. L’intensità di un campo sonoro è l’energia trasmessa per unità di tempo in una specifica direzione attraverso un’area unitaria normale a questa direzione. DeciBel

Il suono ha una gamma di potenza o di intensità cosi ampia che risulta conveniente utilizzare una scala di misura condensata. Il Bel è l’unità base di suddivisione di una scala logaritmica che rappresenta il rapporto tra due differenti misure. Il deciBel (dB) è un decimo di Bel.

Fondamenti di acustica Effetti della propagazione del suono

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

10

La velocità del suono nell’aria dipende fondamentalmente dalla pressione, dalla temperatura e dalla densità del gas entro cui si propaga. Data la natura fisica complessa dei gas e dei solidi, il suono è soggetto a più o meno rilevanti effetti di distorsione dell’informazione originaria che trasporta, tanto che al punto di ascolto può essere percepita una informazione anche molto differente da quella originata alla sorgente. Il suono è un processo di compressione e rarefazione del gas in cui si propaga (che da ora in poi per semplicità chiamiamo aria). La compressione delfaria porta al suo riscaldamento, mentre la rarefazione delfaria porta al suo raffreddamento. Dato che la velocità di propagazione del suono nell’aria dipende dalla temperatura dell’aria stessa, ne deriva un effetto di autodistorsione dal suono provocato dalla fase di compressione che porta ad un aumento di velocità e alla fase di rarefazione che porta ad una diminuzione della velocità. Ne consegue una distorsione della forma d’onda del suono, tanto maggiore quanto maggiore è la sua intensità. Questo fenomeno di distorsione si complica ulteriormente in rapporto alla complessità del suono. Le alte frequenze hanno una velocità leggermente superiore a quella delle basse frequenze, quindi a lunga distanza si manifesta un fenomeno di distorsione del rapporto di fase tra le componenti frequenziali, che porta conseguentemente ad una distorsione della forma d’onda. I fenomeni di distorsione dell’informazione audio dovute alla propagazione del suono nell’aria, dal punto di vista strettamente della catena audio sono rigorosamente da evitare. Dal punto di vista della percezione uditiva sono invece una importante componente informativa che consente alla persona di dedurre informazioni di natura spaziale. Ad esempio, il fatto che un applauso in una sala da concerto venga percepito come un crepitio, è dovuto alla distorsione della forma d’onda del suono determinata dal rapporto velocità/intesità. Un altro effetto è quello della percezione della distanza della sorgente fornita proprio dalla distorsione di fase.

Fondamenti di acustica Potenza e Intensità in dB

27/01/2004 •

Copyright 2002-2003 Prof. Mario Malcangi

11

Potenza e intensità sonora sono parametri con una gamma di variabilità

estremamente ampia (approssimativamente 1:1.000.000 relativamente alla percezione uditiva). La rappresentazione in dB consente di comprimere la dinamica numerica della misura in maniera tale da rendere più semplice la realizzazione della strumentazione di misura e della rappresentazione grafica del suono (VU-meters, equalizzatori grafici, ecc.). La percezione uditiva del suono è di natura logaritmica, relativamente al livello di pressione sonora (SPL). Allo scopo di mettere in relazione la percezione uditiva con le misure audio del livello del segnale audio misurato dalle apparecchiature, è stata adottata per una misura logaritmica chiamata deciBel (dB).

La misura dell’intensità può essere rappresentata in modalità relativa, adimensionale e non lineare.

L’adimensionalità si ottiene mettendo in rapporto due misure omogenee tra loro (cioè misurate con la stessa unità di misura). La relatività si ottiene rapportando una misura generica ad una misura di riferimento (ad esempio la massimma o la minima intensità udibile). La non linearità si ottiene applicando una trasformazione non lineare (non proporzionale) alla misura. Nel caso della misura in dB si utilizza la trasformazione logaritmica in quanto di natura logaritmica è la percezione dell’intensità.

Fondamenti di acustica DeciBel

Attenuazione

Amplificazione

EquaLfzzazione

0dB

+12

-6

+30

+6

-6dB = x 0.5

+24

0dB

+18

-6

+12

-24

-12

+6

-30

-18

0dB

-12

+ 6dB = x 2

-18

27/01/2004

12

Copyright 2002-2003 Prof. Mario Malcangi

La misura in deciBel (dB) è la più importante tra le misure audio non lineari, relative e adimensionali. La trasformazione non lineare si ottiene tramite applicazione della funzione logaritmo base 10. La misura in dB può essere facilmente ricondotta alla misura lineare considerando che il raddoppio di una misura è pari a +3 dB se questa riguarda la potenza (P) oppure pari a + 6 dB se questa riguarda l’intensità (V). Viceversa, il dimezzamento di una misura è pari a -3 dB se questa riguarda la potenza, oppure pari a -6 dB se questa riguarda l’intensità. Nella strumentazione elettronica che tratta segnali (amplificatori, registratori, filtri, ecc.), la misura dell’intensità del segnale viene rappresentata in dB. E’ importante osservare che 0 dB non significa intensità nulla, ma intensità pari al riferimento. La misura in dB è relativa al riferimento e conseguentemente si caratterizzano le differenti scale di misura dell’intensità (o della potenza): -v -

M[| —

I

I

a

99

^

9_

L

w



i

•Amplificazione: è una scala di ampiezza in dB prevalentemente positiva; 0 dB

ha il significato di nessuna amplificazione; •Attenuazione: è una scala di ampiezza in dB prevalentemente negativa; 0 dB ha

il significato di nessuna attenuazione; •Equalizzazione: è una scala di ampiezza in dB sia positiva che negativa; 0 db ha

il significato di segnale non equalizzato;

Fondamenti di acustica Decibel (cont.) Sistema con perdita

Sistema con guadagno

+6 dB

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

13

Il riferimento nella misura in dB è implicito ma non omissibile, cioè deve essere comunque noto a chi utilizza tale misura. In alcuni casi in cui il riferimento è standard, questo viene evidenziato in modo che sia noto comunque. Riferimento pari a 1 milliWatt su 600 Ohm: dB(m) Riferimento pari a 1 Watt: dB(W) Nelle misure audio, a differenza di quelle telecom (nel cui ambito è stata definita la misura in dB), non vi è un’impedenza di riferimento non esist, quindi la misura della potnza non ha senso. Conseguentemente i segnali audio vengono misurati in tensione (Volts), utilizzando come riferimento 0,775 Volts, quindi le misure vengono espresse in dB(u). I sistemi audio possono operare sul segnale audio in ingresso in maniera neutra (senza perdita, cioè senza attenuazione), oppure con perdita o guadagno. segnale audio in uscita cumula tutti questi effetti in forma Quando il segnale audio è misurato in dB, allora le perdite o i guadagni sul segnale di ingresso vengono calcolati in termini additivi (in conseguenza della proprità dei logaritmi: log (AxB) 0 log(A)+log(B)).

Fondamenti di acustica Misure acustiche

Prof. Mario Malcangi

Le misure acustiche sono intese alla valutazione quantitativa del livello di pressione sonora (SPL). La misura viene eseguita in dB utilizzando come riferimento la pressione 0,00002 Pascals rms. In questo caso la misura in dB viene identificata come dB(SPL). Quando le misure acustiche riguardano l’impressione soggettiva della percezione dell’intensità sonora (per esempio nelle misure di qualificazione dei livelli di inquinamento acustico), allora si utilizza un filtro di ponderazione prima di eseguire le misure. Il filtro di ponderazione riproduce la risposta in frequenza dell’orecchio umano (tipicamente più sensibile alle frequenze medie). Il filtraggio di ponderazione più comune è quello cosiddetto “a pesatura A” (A-weighting), da cui deriva il termine dB(A). Quando per le misure si utilizzano apparecchiature che possono evidenziare perdita di intensità per inserzione (insertion loss), allora è necessario eseguire la calibrazione della catena di misura eseguendo il cosiddetto “audio level metering”. L’aggiustamento della catena di misura viene eseguito in modo che il segnale audio non subisca né perdita, ne guadagno nell’attraversamento. Dato che è difficile che un sistema si comporti uniformemente a tutte le frequenze, viene eseguita la calibrazione della catena di misura in modo tale che applicato in ingresso un tono puro a 1000 Hz con intensità pari a 0 dB(u), questo risulti in uscita sempre a 0 dB(u), cioè senza perdita. IVU (Volume Unit) meters sono gli strumenti di misura più comuni presenti sulle apparecchiature audio (ad esempio i registratori a nastro magnetico) che consentono di valutare visivamente se il segnale di ingresso arriva all’apparecchiatura senza perdita (o guadagno). Questi non sono altro che voltmetri per corrente alternata (AC) con risposta logaritmica. La risposta logaritmica comporta che la deflessione dell’indicatore (ago, barra, ecc.) sia proporzionale al volume percepito. La posizione 0 dB di un VU meter indica la condizione di assenza di perdita per inserzione, quindi la condizione ottimale di misura.

Fondamenti di acustica Tono puro

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

15

Il suono più semplice è il cosiddetto tono puro. Questo è un suono caratterizzato da un’unica frequenza, quella determinata dalla durata di una completa oscillazione (periodo). Il tono puro non esiste come tale in natura. C’è un solo strumento, il diapason, capace di produrre un tono quasi puro. La forma d’onda del tono puro coincide con la funzione trigonometrica Asen(a), cioè, la forma d’onda che si otterrebbe riportando su un piano cartesiano la proiezione di un punto che mota a velocità costante su una circonferenza di raggio A. La velocità di rotazione co=a/t determina la frequenza di ripetizione del ciclo oscillatorio (numero di periodi al secondo), considerando che co=2rtf. Il tono puro può essere prodotto artificialmente da qualsiasi strumento capace di generare una funzione sinusoidale. Il più comune degli strumenti è l’oscillatore sinusoidale elettronico. Il tono puro o sinusoidale ha un’importanza fondamentale nello studio dell’acustica in quanto contiene in se stesso un’informazione frequenziale unica. Per esempio, il tono puro a 1000 Hz di una specifica intensità (0 dB(u)) viene utilizzato per calibrare la catena di registrazione o di misura fonica,

I segnali audio trasportano informazioni che possono essere visualizzate in forma diretta o indiretta nel tempo o in alternativa nel dominio della frequenza. Sia nel dominio temporale, sia nel dominio frequenziale, le informazioni del segnale audio sono le stesse, cambia solo la forma di rappresentazione. Si definisce forma d’onda la variazione di ampiezza nel tempo caratteristica del fenomeno acustico. Quella sinusoidale è ad esempio la forma d’onda caratteristica del tono puro. •L’oscillogramma è la rappresentazione grafica della forma d’onda nel dominio del tempo. •Lo spettrogramma è la rappresentazione grafica della forma d’onda nel dominio delle frequenze. 2F m ax Il

Il campionamento di un segnale porta alla perdita delle informazioni che hanno frequenza superiore a quella del processo di campionamento medesimo. Il campionatore deve operare ad una frequenza superiore al doppio (almeno) della frequenza massima del segnale per preservare tutte le informazioni di frequenza del segnale oggetto di campionamento. II teorema del campionamento garantisce la corretta rappresentazione deirinform azione frequenziale del segnale, ma non quella d’ampiezza e di fase.

Per garantire una adeguata rappresentazione dell’informazione di ampiezza e di fase bisogna sovracampionare, cioè campionare a frequenze superiori, anche molto superiori, rispetto a quella della frequenza massima del segnale.

Digitalizzazione del suono Teorema del Campionamento

La non corretta esecuzione del processo di campionamento porta ad un insidioso effetto di distorsione dell’informazione chiamato “aliasing”. Le frequenze di segnale oltre la metà della frequenza di campionamento vengono distorte in conseguenza del processo di campionamento. La distorsione (aliasing) consiste in un effetto di rallentamento delle frequenze presenti oltre la frequenza massima stabilita dal teorema del campionamento. L’aliasing è conseguenza del sottocampionamento delle componenti armoniche del segnale che superano la metà della frequenza di campionamento. La frequenza alias è paria alla differenza tra il valore della frequenza di campionamento e il valore della frequenza reale: falias fs- f reale Concluso il processo di campionamento, le frequenze distorte non sono più distinguibili da quelle non distorte e quindi il campionamento del segnale in tal caso non è reversibile.

Digitalizzazione del suono Evitare (’aliasing

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

57

I segnali reali sono a banda infinita, ma nella pratica vengono considerati a banda limita. Quando si realizza un’applicazione di elaborazione del segnale audio, si focalizza l’attenzione sull’informazione di segnale significativa per

quella specifica applicazione. Per esempio, la voce è un segnale audio (banda fino a 20000 Hz), ma di fatto l’informazione necessaria al 1’intellegibilità del parlato è limitata alla banda fino a 3000 Hz. Un sistema di campionamento dovrebbe utilizzare una frequenza di campionamento molto superiore a 4000 Hz (maggiore del doppio della frequenza massima di segnale). Campionare a 8000 Hz (come di fatto avviene nella telefonia digitale) è sufficiente. 8000 Hz è una frequenza di campionamento abbastanza superiore al doppio della frequenza massima di segnale vocale, in accordo con il teorema del campionamento. Rispettare il teorema del campionamento garantisce la corretta rappresentazione delle frequenze fino a quella massima di segnale, ma nulla garantisce in merito alle frequenze superiori a quella massima. Poiché il campionatore non sopprime le frequenze oltre quella massima ma, purtroppo, le distorce (rallentandole), è necessario limitare la banda del segnale da campionare alla frequenza massima utile. Tale limitazione di banda si ottiene tramite filtraggio passa-basso, detto anche filtraggio anti-aliasing, in quanto previene il fenomeno di distorsione frequenziale (aliasing) conseguente al campionamento.

Digitalizzazione del suono Evitare ¡’aliasing (cont.)

27/01/2004

Copyright 2002-2003 Prof. Mario MalcangiIl

58

Il fenomeno dell’aliasing frequenziale durante il processo di campionamento è dovuto al fatto che la banda del segnale campionato viene replicata infinite volte. Ogni replica della banda di segnale, ovvero del suo spettro, ha come riferimento tutti i multipli interi della frequenza di campionamento. La banda base gravita intorno alla frequenza zero. Le altre bande sono collocate sui multipli interi della frequenza di campionamento, cioè Fs, 2FS, 3FS, 4FS,... e sono una perfetta replica di quella base. Le repliche della banda base possono sovrapporsi ad essa e alle altre. E’ proprio questa sovrapposizione che produce il fenomeno delFaliasing. Le frequenze delle bande superiori a quella base si ritrovano di fatto in banda base per sovrapposizione, quindi producono distorsione frequenzaiale (armonica). Il punto di separazione tra le bande multiple è proprio la metà della frequenza di campionamento. ^)

Se il segnale a banda estesa viene limitato entro una frequenza massima non superiore alla metà della frequenza di campionamento, allora la sovrapposizione tra la banda base e le bande replicate non avviene e quindi non vi è aliasing.

Digitalizzazione del suono Quantizzazione hold

1

I

[

I

"•

i

i

i

a!

1 1 1 1

3••

l

i 0

!•ê

i

i

i : I ;

;

I

r

:

1

1 «

; i

f

I[ 1 f !I; i

! 1 2 2 3 3 3 2 2 2 2 l

i

]

2 bit

27/01/2004

!«• :• ! lè ft•

9

i • • : i ; • • ft

2 2 = 4 livelli di quantizzazione

Copyright 2002-2003 Prof. Mario Malcangi*Il

Il segnale campionato (PCM), per essere trattato da un elaboratore numerico (computer), necessita di essere sottoposto ad un processo di quantizzazione. L’ampiezza dei campioni del segnale sono infatti valori a precisione infinita (rappresentabile cioè con numeri reali), mentre il calcolatore è in grado di rappresentare solo numeri a precisione finita (anche se elevata). La quantizzazione è il processo che consente di passare dalla precisione infinita alla precisione finita (numero finito di cifre) nella rappresentazione numerica. Questo processo implica perdita di informazione. La perdita d’informazione si manifesta sotto forma di rumore. fi campionamento consente di fissare l’ampiezza del segnale in istanti discreti di tempo (istanti di campionamento). La digitalizzazione del segnale (quantizzazione) consiste nel trasformare in numeri (binari) a precisione finita il valore (a precisione infinita) dell’ampiezza di ogni campione Il numero di cifre binarie (bit) utilizzato per quantizzare numericamente l’ampiezza di ogni campione determina il numero di livelli di quantizzazione. Per eseguire l’operazione di quantizzazione, l’ampiezza del campione deve essere mantenuta costante per tutto il tempo necessario al completamento del processo di quantizzazione. Ciò viene ottenuto aggiungendo al campionatore un elemento di memoria analogica, il condensatore. Questo, quando l’interruttore del campionatore è chiuso, memorizza l’ampiezza del campione corrente. Quando l’interruttore si apre, il condensatore mette a disposizione del quantizzatore tale informazione in maniera stabile, fino al successivo campionamento. Il quantizzatore inizia il processo di quantizzazione dopo il tempo di campionamento e deve completarlo prima che termini l’intervallo di campionamento. Il campionatore, insieme al condensatore, realizza un sistema di campionamento e tenuta, da cui il nome Sample&Hold.

Digitalizzazione del suono Errore di quantizzazione Errore di

SQNR m SQNR dB B

27/01/2004

=

6.5

rapporto Segnale/Rumore di quantizzazione deciBel numero di bit utilizzali per quantizzare

Copyright 2002-2003 Prof. Mario Malcangi

60

informazione rappresentazione di valori reali con un numero finito di cifre. La quantizzazione produce determinato ampiezza a altro segnale (rumore) che si somma linearmente al segnale rumore di quantizzazione è di natura statistica (rumore bianco) quindi non separabile dal segnale quantizzato. rumore numerica. Per ogni cifra binaria utilizzata quantizzazione si produce un miglioramento di 6 dB del rapporto segnale/rumore di quantizzazione. il rumore di quantizzazione non è eliminabile, può essere solo minimizzato. Per ogni applicazione va stabilita la quantità minima di cifre che garantisce l’inefficacia del rumore di quantizzazione sull’informazione contenuta nel segnale. 4

'

V?

v

Per esempio, la musica è un segnale audio, quindi l’informazione in essa contenuta è percepita attraverso il sistema uditivo. Il sistema uditivo ha una sensibilità media che in termini di rapporto segnale/rumore è stimata in circa 90 dB (consente di distinguere un rumore in presenza di segnale quando il segnale ha un’ampiezza circa 65000 volte superiore a quella del rumore). Ciò significa che, un rumore con un’ampiezza 90 dB inferiore a quella del segnale non è percepibile (effetto mascheramento). Quindi, se il rapporto segnale/rumore di quantizzazione (SQNR) prodotto nella digitalizzazione della musica è superiore a 90 dB, il rumore di quantizzazione di fatto non è rilevante in quanto non percepibile. Nell’esempio specifico, sono sufficienti 16 bit (6 x 16 = 96dB) di quantizzazione per garantire un rapporto segnale/rumore non peggiore di quello tipico dei sistemi audio analogici.

Digitalizzazione del suono Rapporto segnale/rumore di quantizzazione

SQNR = 20 logl0

A -= 2 0 ì o g . - f - - = 20 log,0V = 205 log,02 = 20x0.301 s 65

2"

%

B

27/01/2004

A

: num ero di bit di quantizzazione

2D: num ero di livelli di quantizzazione

Copyright 2002-2003 Prof. Mario Malcangi

61

Il rapporto segnale/rumore di quantizzazione (SQNR), calcolato in dB viene determinato rapportando la massima escursione di segnale (segnale picco-picco) alla massima ampiezza di rumore (Q). La massima ampiezza di rumore Q è legata al numero di bit di codifica utilizzato e all’ampiezza picco-picco:

Q = V 2B Il numero di bit di quantizzazione determina la quantità di livelli di quantizzazione applicati alla gamma di ampiezza picco-picco.

Il rapporto segnaie/rumore di quantizzazione (SQNR) viene determinato rapportando la massima dinamica di segnale alla massima dinamica di rumore. Il rumore di quantizzazione è a dinamica costante. La massima dinamica del rumore è infatti determinata dal rapporto tra la massima dinamica del segnale e il numero di livelli di quantizzazione (2B). Il segnale può essere a dinamica variabile. Ciò implica che il SQNR calcolato nella condizione di massima dinamica del segnale non sia effettivamente tale quando il segnale riduce la sua dinamica. Per esempio, supponiamo di scegliere di quantizzare con 16 bit un segnale audio per garantire un SQNR di 96 dB. Se il segnale dimezza la sua dinamica, il SQNR teorico di 96 dB diventa un SQNR reale di 90 dB: il bit più significativo dei 16 bit di quantizzazione non viene mai utilizzato, quindi la quantizzazione reale è a 15 bit. Poiché ogni bit porta un contributo di +6dB per il SQNR, la perdita di un bit comporta un contributo di -6dB. Se il segnale si porta a un quarto della dinamica, vengono persi 2 bit di quantizzazione, quindi 12 dB per il SQNR, e così via. 4

V•

|

La quantizzazione non lineare consente di evitare che le piccole dinamiche siano quantizzate con un numero di bit inadeguato rispetto alle specifiche applicative. La suddivisione in livelli di quantizzazione della gamma dinamica non è lineare (di solito logaritmica), tale cioè da assegnare una maggiore quantità di livelli di quantizzazione ai bassi livelli di dinamica e una minor quantità agli alti livelli di dinamica. Per esempio, per un segnale che varia in ampiezza tra -HO e -10, di 16 bit di quantizzazione, si può assegnarne 1 bit per la quantizzazione del segnale che varia tra +10 e +5 (-10 e -5) e 15 bit di quantizzazione per i segnali che variano tra +5 e -5; successivamente si può assegnare 1 bit di quantizzazione per i segnali che variano tra +5 e +2,5 (-5 e -2,5) e 14 bit di quantizzazione per i segnali che variano tra +2,5 e -2,5; e così via fino ad assegnare tutti i bit di quantizzazione disponibili.

.

.

.

. -

’ ' i

.

w

Analisi del suono

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

65

L’analisi del suono consente di entrare nella microstnittura informativa del suono per ottenerne la sua rappresentazione analitica. Le componenti informative del segnale, misurate tramite le tecniche di analisi, sono la base di conoscenza che consente di estrapolare modelli per la modifica dell’informazione acustica e per la sua sintesi. Quella di Fourier è la più importante delle tecniche di analisi frequenziale del segnale audio, sia per la vicinanza al modello percettivo del suono, sia anche per la relativa semplicità del modello matematico che ne consente una facile e immediata aDDlicazione di natura numerica. La conoscenza del modello armonica corretta messa in opera, per evitare di generare insidiosi artefatti che inquinano la misura dell’informazione di segnale. La variabilità dinamica del segnale audio, sia quello musicale che quello vocale, impone l’adeguamento delle condizioni stazionarie di validità dell’analisi armonica di Fourier alla dinamica del segnale audio. L’analisi armonica di Fourier a tempo breve è un esempio di adattamento dinamico di un modello di analisi stazionario, quale è quello dell’analisi armonica di Fourier. Altre tecniche di analisi sono proposte per l’estrazione delle caratteristiche informative del segnale audio allo scopo di ottenere una estrazione mirata di specifiche informazioni (ad esempio le formanti fonetiche), oppure per maggiormente avvicinarsi al modello fisico del suono. Per approfondimenti: [Malcangi 03]

Analisi del suono Componente frequenziale

I segnali audio, anche quando si tratta di suoni, difficilmente sono modellizzabili con una funzione matematica. Le trasformate sono un potente strumento matematico che consente di ottenere un modello di rappresentazione dell’informazione di segnale che ne semplifica la trattazione. La semplificazione consiste soprattutto nella individuazione di funzioni matematiche elementari (segnali elementari) che, combinati in forma lineare, consentono di rappresentare una funzione complessa (segnale complesso). La trasformata di Fourier consente di rappresentare un segnale qualsiasi come somma lineare di segnali sinusoidali. I segnali elementari per la trasformata di Fourier sono i segnali sinusoidali, detti anche, componenti frequenziali del segnale, cioè in campo audio, i toni puri.

Analisi del suono

Secondo la teoria dell’analisi armonica di Fourier, i segnali complessi possono essere scomposti in una serie di segnali elementari sinusoidali, di varia ampiezza, frequenza e fase. Questa scomposizione è unica e quindi utilizzabile per codificare l’informazione di segnale in un altro dominio diverso da quello temporale, il dominio frequenziale.

Analisi del suono Struttura frequenziale

27/01/2004

Copyright 2002-2003 Prof. Mario MalcangiIl

68

Il tono puro (sinusoidale) è il caso più semplice di informazione audio in quanto caratterizzata da una singola frequenza (in accordo con il modello percettivo e con la teoria dell’analisi frequenziale di Fourier). Qualsiasi altro suono che non abbia le caratteristiche informative del tono puro viene definito complesso, in quanto costituito dalla somma di più toni puri.

Analisi del suono Struttura frequenziale

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

69

Il suono complesso, in accordo con la teoria dell’analisi armonica di Fourier, è sempre scomponibile in termini di toni puri, ognuno di ampiezza, frequenza e fase differente. In particolare, se il tono complesso è periodico, le componenti frequenziali esistono solo in corrispondenza dei multipli della frequenza fondamentale determinata dal periodo di ripetizione della forma d’onda del tono complesso.

Analisi del suono Struttura frequenziale

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

70

Si definisce prim a armonica (fondamentale) il tono puro caratterizzato da un periodo uguale a quello di ripetizione del tono complesso. La seconda armonica ha frequenza doppia della prima, la terza tripla della prima, ecc. La prima armonica in un tono periodico è sempre presente. Le armoniche successive possono anche non essere presenti in corrispondenza di tutti i multipli della frequenza fondamentale.

Il modello frequenziale è fondamentale per la descrizione analitica della natura dell’informazione del suono. Grazie al modello frequenziale è possibile ottenere una descrizione analitica del suono che consente di trattare l’informazione audio per realizzare applicazioni come la compressione, la trasmissione, la spazializzazione, la sintesi e il riconoscimento automatico. Il modello temporale e il modello frequenziale del suono sono strettamente legati tra loro dal sistema delle trasformate. In particolare, la trasformata di Fourier consente di ottenere un modello di rappresentazione in frequenza del suono particolarmente vicino al modello percettivo (psicoacustico).

La rappresentazione cosiddetta “spettro” deriva dall’analisi armonica del tono complesso. Ogni componente armonica del suono viene riportata su un piano cartesiano ampiezza-frequenza. In questa rappresentazione grafica ogni componente armonica del suono viene rappresentata da un segmento verticale (linea spettrale) di ampiezza pari all’ampiezza massima (positiva) della componente stessa. La posizione sull’asse frequenziale è pari all’inverso del periodo della componente.

Analisi del suono Spettro di alcuni suoni

impulso

tono puro

> t

t

treno di impulsi

i m i .

-----► t

t

-11

impulso di durata finita rumore

A

A

> t

x

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

73

Ogni suono ha la sua propria struttura armonica. Tale struttura armonica (spettro frequenziale) rappresenta completamente il suono stesso, evidenziando soprattutto le caratteristiche frequenziali. Il tono puro per definizione ha uno spettro costituito da una sola linea spettrale (per definizione), e ha una forma d’onda di natura sinusoidale. Il suono determinato dall’onda quadra ha una struttura frequenziale caratterizzata dalla fondamentale e da una serie (teoricamente infinita) di componenti frequenziali di ampiezza decrescente al crescere della frequenza. Un caso particolare di suono è il rumore bianco. Questo è un suono caratterizzato da una forma d’onda la cui ampiezza varia in modo completamente casuale (a distribuzione statistica uniforme). Lo spettro corrispondente è altrettanto casuale nella sua composizione armonica (in ampiezza e in frequenza). Il termine rumore è conseguenza del fatto che questo suono nella maggior parte dei casi è indesiderato. Un altro suono particolare è l’impulso (click). Questo è un suono di durata infinitesima e ampiezza finita. Lo spettro di questo suono è altrettanto particolare in quanto contiene tutte le componenti frequenziali a tutte le frequenze a partire da zero e con ampiezza costante. Una variante dell’impulso è il treno di impulsi, cioè una ripetizione periodica di impulsi. Lo spetto corrispondente è un treno di armoniche distanziate tra loro in maniera uniforme. Una ulteriore variante dell’impulso è l’impulso di durata finita. Lo spettro corrispondente è la funzione sen(x)/x.

Analisi del suono Esempi di spettri di segnale vocale

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

L’analisi frequenziale del segnale è una tecnica che consente di ottenere la distribuzione deH’ampiezza e della fase delle componenti sinusoidali in funzione della frequenza. Il risultato dell’analisi frequenziale è lo spettro di ampiezza e di fase. Lo spettro del segnale consente di ottenere informazioni quantitativamente precise circa la struttura frequenziale del segnale, non evidenziabile nella rappresentazione temporale del segnale, sia grafica che matematica. Ad esempio, una vocale “O” si distingue nettamente da una vocale “E” se si osserva lo spettro frequenziale di ampiezza. I picchi dello spettro indicano la dominanza a tali frequenze. La differente posizione e ampiezza dei principali picchi connota una vocale rispetto ad un’altra. Mentre il segnale vocale nel dominio temporale è apparentemente molto variabile, nel dominio frequenziale risulta molto stabile, ovviamente per la stessa informazione. Ad esempio, vocalizzando una “E” in tutte le maniere possibili (cupa, brillante, rauca, interrogativa, esclamativa, imperativa, ecc.) notiamo una significativa variabilità dell’oscillogramma ma una sostanziale stabilità dello spettrogramma.

Analisi del suono Alcune formule utili A sin( Piano complesso

cat + )~ a cos( + sin( cat) Coordinate polari e cartesiane

Z^are

A

A)

A=V a + b 2

M M J. 2

a - - A sin (j)

= tan

1

— a

b = A cos (/)

Formula di Eulero Ini = Immaginario Re = Reale

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

75

L’informazione elementare codificata dalle componenti sinusoidali è l’ampiezza dell’oscillazione ad una specifica frequenza e la relativa fase. La rappresentazione della componente sinusoidale, che consente di costruire lo spettro di ampiezza e di fase, è dunque la seguente: A(t)= A sin(cdt+(j)())=Asin(27i:f+(j)0)

La trasformata di Fourier consente di rappresentare un segnale complesso in termini di combinazione di segnali elementari, i segnali sinusoidali. Essendo un algoritmo matematico, non usa rappresentare il segnale sinusoidale nella sua natura fisica, bensì nella forma matematica. La trasformata di Fourier calcola la componente frequenziale sinusoidale come un punto del piano dei numeri complessi, quindi in termini di “parte reale” e “parte immaginaria”. Da questa rappresentazione cartesiana della componente sinusoidale è necessario passare alla rappresentazione polare, evidenziando modulo (ampiezza) e fase della componente sinusoidale.

/\n a n si uci suuiiu I* Fourier: Serie e Trasformata “

Serie di Fourier

••--- ---- ^

.

Trasformata di Fourier

+CO

Diretta -foc

x (i)=

I k

-

~

X ( a ) = ^ x (t)e-Ja,dt

oo

-00

T

-

H—

Inversa

ck

=

— | x ( t ) e ~ J(kr'¥ ) d t T

1 +00

i

x (t)

2

T

=

— «o

27/01/2004

=

=

\ x ( c o ) e jm‘da) —00

— : periodo

a

>

=

/o Copyright 2002-2003 Prof. Mario Malcangi

76

Il punto di partenza per l’analisi dei segnali è la serie di Fourier. Questa, consente di calcolare la serie dei coefficienti di ampiezza delle componenti armoniche di un segnale di natura continua e periodica. I segnali periodici si caratterizzano per una forma d’onda che si ripete, sempre uguale a se stessa, per tutto il tempo di esistenza del segnale. Ad esempio, il segnale sinusoidale è un segnale periodico. Per i segnali reali, l’analisi armonica di Fourier non è applicabile in quanto i segnali reali non sono perfettamente periodici (la periodicità è un’astrazione matematica). Inoltre, l’elaborazione numerica del segnale riguarda i segnali discreti (campionati). La serie di Fourier ha comunque un equivalente, chiamata trasformata di Fourier, applicabile ai segnali di natura non periodica. La trasformata di Fourier è infatti un’estensione della serie di Fourier considerando il periodo di oscillazione del segnale di durata infinita. La trasformata di Fourier consente di calcolare le ampiezze delle componenti armoniche del segnale, non necessariamente periodico, a tutte le frequenze, da zero fino a infinito.

T

DTFT: Trasformata Tempo Discreto di Fourier Trasformata Continua di Fourier

Trasformata Tempo Discreto di Fourier

D iretta

D iretta

A— -H x >

- t- 3 0

X (a t)= jx ( t) e - J*‘dt

(co) = X

X

— OO

— OU

In v ersa

&

Inversa

— s /

---------------------

x (t) =

* (» )

=

d - J . X ( a ì e ‘~ d ( a )

¡X - 0 0

-H »

x(rì)=

Y Jx ( t ) S ( t n =

co = 2izf 27/01/2004

- o o

t-nTs

Copyright 2002-2003 Prof. Mario Malcangi*Il

77

Sia la serie che la trasformata di Fourier operano su segnali continui. Cosa succede se il segnale è a tempo discreto, cioè campionato? Un segnale x(t) campionato è rappresentabile come sequenza x(n) di campioni derivata dal processo di campionamento, quindi è rappresentabile come combinazione lineare di impulsi unitari 5(t-nTs) modulati in ampiezza dalla sequenza x(n), cioè: x(t) = 2 x(t)8(t-nTs) La trasformata di Fourier è quindi applicabile anche a un segnale tempo discreto x(n). Il modello di trasformata che ne deriva è detta DTFT, cioè Trasformata Tempo Discreto di Fourier. Questa somiglia alla trasformata di Fourier, tranne che nella versione diretta esegue la sommatoria al posto dell’integrale, come conseguenza della natura discreta del segnale x(n). Lo spettro X(co) è comunque continuo e conseguentemente la trasformata inversa DTFT utilizza l’integrale e non la sommatoria. La trasformata DTFT è quindi applicabile nei sistemi campionati (ad esempio i sistemi CCD), consentendo l’applicazione dell’analisi frequenziale di Fourier in sistemi discreti ma non numerici, i sistemi tempo discreti.

Analisi del suono DFT: Trasformata Discreta di Fourier Trasformata Tempo Discreto di Fourier

Trasformata Discreta di Fourier

D iretta N- 1

D iretta +O0

X ( k ) = YJx (n )e

2

Inversa 1 //_]

J2nkn x(n)~ J^X(k)e N

| X (co)eJ,md (cu)

N

K -n

n co-27tf 27/01/2004

to V•J • • N*

= >

In v ersa = —

0 V*

II

-00

N

1

n=0

X (co) = Y, x ( n ) e ~ Jùm

x(n)

7

-=o

= 0 ,1 ,2 ,...,

N - \

t~ n T s

Copyright 2002-2003 Prof. Mario Malcangi

78

La trasformata di Fourier opera su segnali continui, con operatori matematici continui e produce risultati continui. La natura discreta e finita del computer non consente l’implementazione dell’analisi frequenziale sotto tali condizioni. La trasformata di Fourier tempo discreto (DTFT) in parte risolve questo problema in quanto capace di trattare i segnali campionati, quindi è un buon punto di partenza per pervenire alla versione discreta della trasformata di Fourier (DFT). Per passare dalla DTFT alla DFT sono necessari due passaggi, uno che limita il numero di campioni oggetto di trasformazione da infinito a N e un altro che discretizza la variabile frequenza co. Eseguendo queste trasformazioni si ottiene la trasformata discreta di Fourier (DFT), un modello matematico discreto per l’analisi frequenziale del segnale, idoneo a essere implementato su computer, in particolare sui digitai signal processor (DSP) per applicazioni real-time di natura embedded. v

J

E’ interessante osservare che la discretizzazione della trasformata di Fourier impone un’artificiosa periodicità del segnale. La DFT opera su una sequenza finita N di campioni del segnale prelevati da una sequenza infinita o di lunghezza superiore. Ciò implica una forzatura sulla natura del segnale, che, come si vedrà in seguito, comporterà degli artefatti nei risultati di analisi e delle opportune strategie di minimizzazione di tali artefatti (finestratura).

Analisi del suono DFT: notazione

27/01/2004-

Copyright 2002-2003 Prof. Mario Malcangi

79

La DFT consente di rappresentare i segnali discreti (campionati) con una semplice sommatoria di prodotti. Si tratta quindi di un algoritmo di

elaborazione numerica molto semplice dal punto di vista della struttura di calcolo (facile da codificare in termini di programmazione), ma estremamente intensivo dal punto di vista computazionale (difficile da eseguire in tempo reale). Per esempio, per analizzare un secondo di segnale vocale campionato a 8000 Hz, con la DFT è necessario eseguire, tra le altre operazioni, almeno 8000 x 8000 = 64.000.000 di moltiplicazioni e somme in un secondo !!! Considerando la moltiplicazione e somma una sola istruzione (come è per i DSP), sarebbe necessaria una potenza di calcolo di oltre 64 MIPS (Milioni di Istruzioni Per Secondo) solo per eseguire la DFT in tempo reale !!!

Analisi del suono D F T : c o d ific a

avi,A' .liiicilff khiVWiM ,• W

m i

t r i i i W

.f l it /

Ir iîT , HI* rUiH t

HiRV|IliWlM

T O ;,)

4»d' ***' - - ’u .itili • f o r ( i= 0 ; i < N - l ; i-H-)

m

*«ItiM »•% *"! m a r ngiX... M i" p

m

m

t

» si i

11!

K :fl ; ■r ..• -||| J : -

li,--u ìli' X R Ü ) = X R ( j) + x ( i) * c o s ( 3 .1 4 1 5 9 * I * J /N ) /( N /2 ) ; .1

1

I MW* I *

f



_Ll ”t*J 1*1f e

ti: ih

■ 1 ;V '- ■ :(;.i -nil1 I,;,VI|,n;¡JiM|l*

ìO .

III ff

' *) .

(iF ì,;r

►tri r. t i .lia I M| | | *4

».»

X I ( j ) = X I ( j) + x ( i) * s in ( 3 .1 4 1 5 9 * I * J /N ) /( N /2 ) ;

IH 1 V r

t "1fr.,

llllY !» !

l” ! 1 »I • ♦H *M I l

1

I'

♦ I

1 .1

M

»

% h

I • . I i .

•* »

i l i » ' I» 1 , 1 1 !

min'1!

i 1*'., i'.'LLr;H

Mm!« .,! M •I’ìmi'Un‘.| *v '|l H»' ivJlèlf P itti Jclrii f o r ( i= 0 ; i < N / 2 - l ;i + + ) T. f o r ( j= 0 ; j< N - l;i- H - ) m *iM

Il

I liti

DFT inversa

t

• 4«

*’»

\y 11

! '■ i i m .

imhi *

i l\ Il |.nl.Ui.l'lr *

rv .«Mi à i r

FUI

.

•I

I

II«111

{

V | VM

I4

éâ

â (fté1•I

I .

x ( j) = x ( j) + X R ( i) * c o s ( 3 .1 4 1 5 9 * I * J /N ) + X I ( i) * s in ( 3 .1 4 1 5 9 * I * J /N ) ; }

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

80

La codifica della DFT è abbastanza semplice in quanto consiste di un ciclo per il calcolo della singola componente frequenziale inserito in un altro ciclo che indicizza tutte le possibili frequenze. La DFT inversa è altrettanto semplice in termini di codifica.

Analisi del suono Trasformata Veloce di Fourier (FFT)lI*

La trasformata veloce di Fourier (Fast Fourier Transform, FFT) è una versione ottimizzata ed efficiente della trasformata discreta di Fourier (DFT) per il calcolo dello spettro del suono eseguendo un numero inferiore di calcoli. Il concetto fondamentale su cui si basa la velocità della FFT è che una DFT può essere scomposta in DFT applicate a porzioni di segnale inferiori. Il numero di calcoli eseguito da una DFT partizionata in DFT di ridotte dimensioni è inferiore a quello dell’equivalente DFT non partizionata. L’applicazione esaustiva della scoposizione della DFT in DFT di minore dimensione e l’applicazione estensiva di proprietà intrinseche come ad esempio la simmetria, portano alla formulazione di un modello di calcolo veloce ed efficiente della trasformata di Fourier discreta, chiamato FFT. Se una DFT richiede un tempo di calcolo proporzionale al quadrato del numero di campioni corrispondenti alla finestra di segnale da analizzare, la FFT è proporzionale al numero di campioni moltiplicato il logaritmo (base 2) di tale numero.

1

Analisi del suono Codifica della trasformata Veloce di Fourier (FFT) FFT(À, M, N) complex A(N)> U, W, T

{

PI - 3.141592653889793

N-Z**M

1

for (L - 1; L < M; L++)

NV2-N /2

LE - 2"*L

N M l-N -l

LEI = LE/2

J-l >

U- (1,0;0,0)

for (I«l; icN M l; I++)

W =>eomplcx(cn»(Pl/LEl), *ln((PT/LE1))

{ if ( I < J )

— ► for (J » 1; J < LEI; J++)

{ T=A(J)

— ► for (I - J; T< N; I - I+LE)

A(J) - A(I) A(I)**T

B it R eversing

l

Passo

K = NV2

}

IP “ I + LEI

Butterfly

T » A(IP) * U

Gruppo

A(IP) - A(I) - T

while (K < J)

A(I) = A(I) + T

{ J = J-K

u =u * w

K = K/2

}

) J =J +K

}

>» Copyright 2002-2003 Prof. Mario Malcangi

27/01/2004

82

algoritmo della trasformata veloce di Fourier di quattro nuclei di calcolo. Il bit-reversing è un’operazione preliminare di scombinazione (scrambling) dei dati di infatti efficientemente i calcoli. Questo ordinamento consiste nell’indicizzare i dati (campioni di numerica invertendo termine campioni Indice lineare

Indice bit-reversed

0

000

000

0

1

001

100

4 V

2

010

010

2

3

Oli

110

6

4

100

001

1

5

101

101

5

6

110

011

3

7

111

111

7

Gli altri tre nuclei di calcolo rappresentano l’effettivo calcolo della trasformata veloce di Fourier, basata su una doppia iterazione (Passo e Gruppo) che ingloba una terza iterazione, cioè il nucleo di calcolo (FFT kernel) chiamato Butterfly.

La periodicità (perfetta) della forma d’onda è un concetto astratto in quanto non è possibile produrre un suono assolutamente stabile in termini di frequenza e di ampiezza. Il tono puro (sinusoidale) è quindi un modello teorico.

Analisi del suono Finestratura: quasi periodicità Ampiezza

Tempo

Ripetizione della forma d’onda con variazioni di ampiezza e frequenza Copyright 2002-2003 Prof. Mario Malcangi

27/01/2004

'

84

9

La quasi periodicità è una caratteristica dei suoni generati dalla maggior parte forma ripetitività tali per cui vi sono piccole variazioni del periodo di oscillazione e forma sostanzialmente stazionario. O L JL

W A A A W A t / J L

m

u

u

i

v

^

x

*

^

- -------- ^

--------- --------

~

-------------- ----------------------------------------------------------

r

Analisi del suono Finestratura: ipotesi di stazionarietà

Per eseguire l’analisi del suono è necessario disporre di un segmento temporale del suono più o meno ampio. L ’ampiezza temporale di tale segmento è significativa relativamente alla precisione stessa dell’analisi. L’analisi del suono si basa sull’ipotesi di stazionarietà dello spettro. L’ipotesi di stazionarietà implica che lo spettro del suono sia stabile (statico). Questa ipotesi implica che la forma d’onda sia perfettamente periodica con durata del periodo pari alla durata del segmento considerato. Poiché ciò non è vero in assoluto in quanto è plausibile solo la quasi periodicità, ne consegue che il suono oggetto di analisi può essere più o meno differente rispetto a quello originario.

Analisi del suono Finestratura: periodicità indotta

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

86

La finestratura del suono finalizzata all’analisi implica artefatti che possono produrre risultati di analisi anche molto differenti da quelli reali. La distorsione delle informazioni frequenziali conseguenti alla finestratura viene determinata ( tt segnale audio per derivare il segmento una forma d’onda che porta quindi ad una

Analisi del suono Finestratura: prodotto e convoluzione

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

87

L’analisi del segnale può essere applicata solo ad una porzione limitata di suono. L’operazione di estrazione di una porzione limitata di suono implica un’operazione di finestratura. L’operazione di finestratura applicata ad un suono corrisponde al prodotto tra il suono da analizzare e un suono particolare con forma d’onda rettangolare di ampiezza minima nulla (0) e di ampiezza massima unitaria (1). Questo suono (finestra) è un impulso unitario di durata finita, quindi con funzione spettro sen(x)/x. Il prodotto nel dominio del tempo corrisponde alla convoluzione nel dominio delle frequenze. Lo spettro della finestra si propaga quindi su ognuna delle componenti ffequenziale del suono finestrato, producendo uno spettro risultate fatto non di impulsi di frequenza come ci si aspetterebbe in accordo con l’analisi armonica di Fourier, ma di una serie di campane in corrispondenza degli impulsi di frequenza, cioè la combinazione dello spettro del segnale con quello della finestra.

Analisi del suono Finestratura: campana e ripple

Dominio temporale

27/01/2004

inio frequenziale

Copyright 2002-2003 Profi Mario Malcangi

88

La finestratura di una porzione di suono produce implicitamente sullo spettro reale ima serie di artefatti di cui i più rilevanti sono la dilatazione a campana dell ’impulso frequenziale e la serie di oscillazioni laterali (ripples) che affiancano la campana principale. Il primo ripple, dopo la campana si presenta, dal punto di vista spettrale, come una rilevante distorsione armonica. La larghezza della campana porta invece al mascheramento delle componenti frequenziali effettive del segnale molto prossime e di piccola ampiezza rispetto ad altre componenti di grande ampiezza. La tecnica di finestratura (windowing) è finalizzata a minimizzare queste distorsioni armoniche

Opportune funzioni di finestratura possono minimizzare i ripple e restringere le campane prodotte dall’azione di finestratura. Si tratta delle cosiddette finestre “cosenate”, caratterizzate fondamentalmente da una ampiezza quasi nulla in corrispondenza degli estremi e un’ampiezza unitaria al centro. L’ampiezza quasi nulla agli estremi serve a minimizzare il drastico effetto di troncamento implicato dalla finestra rettangolare. Le finestre cosenate consentono di ridurre la larghezza della campana e di ridurre l’ampiezza del primo ripple, in modo da migliorare il rapporto segnale/rumore tra la componente frequenziale e il rumore costituito dai ripple. Lo svantaggio è quello che il segnale in prossimità degli estremi della finestra è fortemente attenuato, quindi sarà scarsamente rappresentato nello spettro.

La risoluzione frequenziale dipende dalla dimensione temporale della finestra di analisi. In particolare, la risoluzione frequenziale è inversamente proporzionale alla dimensione temporale della finestra di analisi. La minima frequenza misurabile è F = 1/T, ove T è la dimensione temporale della finestra di analisi. Le altre frequenze misurabili sono solo tutti i multipli interi della frequenza minima, fino ovviamente alla frequenza massima prevista dal teorema del campionamento (metà della frequenza di campionamento).

Analisi del suono Modello stazionario

»«••••••••••

27/01/2004

t

• *••• *• • • • • *«•

Copyright 2002-2003 Prof. Mario Malcangi

91

L’analisi frequenziale del suono è di natura stazionaria. Ciò implica che lo spettro risultante si riferisce a tutta la porzione di segnale inclusa nella finestra. Se una componente armonica del suono varia in ampiezza e posizione frequenziale, questa non può essere misurata in termini analitici in quanto non esiste alcun riferimento temporale relativamente a ognuna delle componenti.

Analisi del suono Modello stazionario a tempo breve

(«> • • • • • • M • « r * * t u a l l l t i l

I •a M M »

W /*

il

»

27/01/2004

*» •

III

•ft « V

Copyright 2002-2003 Prof. Mario Malcangi

92

Per applicare la tecnica di analisi frequenziale del suono è necessario determinare gli intervalli di tempo in cui il suono è stazionario (quasi stazionario). La finestra di analisi non deve superare il massimo intervallo di stazionarietà del suono, in modo da poter considerare lo spettro risultante corrispondente ad una porzione di suono stazionario.

Analisi del suono Analisi dinamica

»* »* % »*

///• * #

V M 4Y *

ÌVAVW *

l l ' v



•77f H f * . > V * *

k A /M £ ,tA ÌM iA l

.

'

fi T

r

ft t fit t lifc

27/01/2004-

Copyright 2002-2003 Prof. Mario Malcangi

93

L’analisi a finestre (stazionarie) del suono porta ad una rappresentazione dello spettro in funzione anche del tempo, producendo una rappresentazione tridimensionale. La dimensione temporale tiene conto della successione nel tempo delle finestre applicate al suono.

è

Analisi del suono Sonogramma

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

La rappresentazione tridimensionale dello spettro può essere effettuata su due dimensioni quantitative (tempo-frequenza) più una terza dimensione qualitativa (ampiezza). Si tratta del sonogramma. L’ampiezza della componente frequenziale viene rappresentata in termini di scala di colori (scala di grigio).

r

Analisi del suono Esempio: suono armonico (violoncello)

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi*Il

95

Il suono di violoncello è di natura armonica, cioè la frequenza delle sue componenti spettrali sono multipli interi della frequenza fondamentale. Ciò è conseguenza della natura della sorgente, la corda vibrante. La corda vibrante produce una suono caratterizzato da una frequenza fondamentale e una successione armonica di frequenze con ampiezza decrescente rispetto alla fondamentale, quindi molto simile al suono con forma d’onda a dente di sega. Il suono prodotto dalla corda vibrante viene modificato dalla caratteristica risonante della tavola e cassa armonica dello strumento, portando così alla determinazione del timbro dello strumento. La modalità di eccitazione della corda porta ad una continua variabilità della forma d’onda, quindi dello spettro. In particolare, la fase di attacco è un elemento connotante del timbro. L’analisi del suono di uno strumento armonico, come ad esempio il violoncello, può riguardare le caratteristiche timbriche stazionarie al fine di determinare la caratterizzazione frequenziale. In tal caso di estrae una porzione del segnale audio nella fase stazionaria (tenuta). Le fasi di attacco e di decadimento dell’oscillazione non sono significative nella determinazione della caratteristica timbrica dello strumento di base dello strumento (caratteristiche di risonanza), anche se sono significative per caratterizzare la modalità di eccitazione della sorgente (corda). L’analisi frequenziale delle fasi di attacco e di decadimento richiede una tecnica di analisi frequenziale a tempo breve (short-term Fourier analysis), in modo da poter ben rappresentare le informazioni spettrali variabili nel tempo.

Analisi del suono Esempio: suono inarmonico (tamburo)

0

Onda stazionaria

0 -

0

t(ms)

0.152

0.155

0.161

0.158

0.164

0 dB “I

Spettro stazionario

0 27/01/2004

1.25

2.5

3.75

5.0

6.25

f (kHz)

Copyright 2002-2003 Prof. Mario Malcangi

96

inarmonica vibrante) produce una componente fondamentale di frequenza abbastanza bassa e armonico fondamentale e di ampiezza decrescente. In questo caso le fasi di attacco, tenuta e decadimento sono difficilmente categorizzabili. La forma d’onda è continuamente variabile, quindi, quali porzione del suono di tamburo viene analizzata, lo spettro ottenuto non è r a n n r e s e n ta tiv o d e lla n a tu r a timbrica dello strumento.

Modifica del suono

27/01 /2004

Copyright 2002-2003 Prof. Mario Malcangi

99

Modificare un suono può essere necessario per vari motivi: per eliminare del rumore, per simulare un effetto ambiente, per amplificarlo, per identificare infonnazioni nascoste, ecc. L’analisi frequenziale consente di ottenere le necessarie infonnazioni per consentire azioni di modifica. Il filtraggio è la tecnica fondamentale di modifica della struttura informativa (frequenziale) del suono operando nel dominio temporale. Per approfondimenti: [Malcangi 03]

Modifica del suono Natura filtrante dei sistemi

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

Il filtraggio è un operazione di elaborazione del segnale che consente di modificare lo spettro di un segnale qualsiasi in maniera mirata. Tutti i sistemi producono sul segnale trattato un’azione di filtraggio.

Possiamo dire che il filtraggio è un funzionamento intrinseco dei sistemi, di natura passiva quando non è desiderato (ad esempio per gli amplificatori), oppure di natura attiva quando è desiderata (ad esempio i filtri veri e propri). Quanto detto sopra evidenzia che il filtraggio è allo stesso tempo uno strumento di elaborazione del segnale e un comportamento dei sistemi. Da ciò si deduce che è possibile utilizzare la natura filtrante di un sistema per correggere l’azione filtrante di un altro sistema. Perché un sistema si comporta da filtro?

Qualsiasi segnale che attraversa un sistema (ingresso/uscita) subisce un’azione di ritardo che dipende dalla natura dei componenti presenti in tale sistema. Il ritardo non è altro che un differimento nel tempo del segnale. Se il segnale entra in un sistema all’istante t, all’uscita del sistema possiamo osservare un effetto conseguente solo dopo un certo intervallo di tempo. L’effetto del ritardo, applicato ad un segnale variabile nel tempo, produce effetti differenti a seconda della velocità di variazione del segnale. Poiché ogni segnale comiesso, secondo la teoria di Fourier, è composto da segnali elementari sinusoidali di varia frequenza ampiezza e fase, il ritardo produce un effetto differenziato su ognuna delle componenti frequenziali, portando così alla modifica della struttura ffequenziale del segnale, quindi alla modifica dell’informazione di segnale.

Modifica del suono Natura filtrante dei sistemi (cont.)

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

101

Il ritardo del segnale implica un fenomeno combinatorio che può amplificare una componente frequenziale (aumento di ampiezza) oppure attenuarla. Ad esempio, un semplice sistema che combina il segnale diretto con quello ritardato di un certo intervallo di tempo, è un filtro in quanto amplifica le componenti a bassa frequenza e attenua quelle ad alta frequenza. In particolare, alle basse frequenze l’efFetto del ritardo produce un effetto di amplificazione del segnale di ingresso in quanto al nodo di somma pervengono due segnali quasi identici, la cui somma produce un segnale di ampiezza circa doppia rispetto a quello di ingresso (amplificazione). Alle alte frequenze il segnale di uscita è di ampiezza inferiore a quello di ingresso e, in particolare quando il ritardo è pari alla metà del periodo della componente frequenziale, al nodo di somma sono presenti il segnale diretto e il suo equivalente in completa opposizione d’onda, determinando un segnale di uscita di ampiezza nulla. Il filtro dell’esempio cancella le frequenze con periodo multiplo del doppio del ritardo di sistema. In generale, questo sistema ha una caratteristica di filtraggio che da 0 alla frequenza 1/(2KR) modifica lo spettro del segnale in ingresso in maniera progressiva fino ad annullare l’ampiezza della componente di frequenza l/(2kR).

Modifica del suono Natura filtrante dei sistemi (cont.) Cosine Comb

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

Si definisce funzione di trasferimento l’azione di un sistema sul segnale di ingresso per determinare il segnale di uscita. A parte il caso dell’amplificatore ideale, tutti gli altri sistemi si caratterizzano con un’azione di modifica dell’ampiezza in modo selettivo rispetto alla frequenza. La funzione di trasferimento rappresenta completamente la natura filtrante dei sistemi. Nel primo esempio il segnale viene combinato con il segnale diretto. La funzione di trasferimento evidenzia una natura filtrante di tipo “elimina banda” multiplo, con frequenza centrale eliminata pari a (K+0.5/R). Nel secondo esempio il segnale viene combinato con il segnale diretto. La funzione di trasferimento evidenzia una natura filtrante di tipo “elimina banda” multiplo, con frequenza centrale eliminata pari a (K/R).

••

Modifica del suono Uso del dominio frequenziale

L’informazione nei segnali è nella struttura frequenziale. Quando tale struttura si modifica, si modifica l’informazione contenuta nel segnale. La struttura frequenziale del segnale può essere modificata variando selettivamente l’ampiezza (ed eventualmente la fase) di ogni componente. Questa variazione equivale alla variazione d’ampiezza che produce un amplificatore che processa un segnale. L’amplificatore amplifica, per definizione, tutte le componenti frequenziali del segnale in uguale misura e quindi non modifica rinformazione del segnale solo in termini di volume. . Quando del segnale sono modificate le componenti frequenziali in maniera differenziata, allora non si parla di amplificazione, bensì di filtraggio. Tutti i sistemi hanno caratteristiche filtranti (anche se modeste). Ad esempio, un canale trasmissivo (il doppino telefonico) si comporta come un filtro in quanto modifica la struttura ffequanziale del segnale che Tattraversa. Dal punto di vista temporale il filtraggio produce una modifica della forma d’onda, mentre dal punto di vista frequenziale produce una modifica dello spettro.

Modifica del suono Modifica della struttura frequenziale del suono

R

V,(t)

vu

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

104

Il filtraggio dei segnali continui (analogici) si ottiene tramite sistemi elettronici basati su componenti di natura capacitiva e/o induttiva. Questi componenti elettronici si differenziano dagli altri (ad esempio le resistenze) in quanto dotati di “memoria”. Il condensatore è ad esempio un sistema elettronico che può memorizzare un’informazione sotto forma di carica elettrica. Inoltre, questi componenti elettronici hanno un comportamento selettivo dipendente dal tempo (quindi dalla frequenza). Grazie a queste proprietà, opportuni circuiti elettronici basati su condensatori e induttori consentono di realizzare i cosiddetti filtri. Un segnale che attraversa un filtro è modificato nella sua struttura frequenziale. I filtri sono utilizzati per modificare appositamente la struttura frequenziale del segnale allo scopo di elaborare l’informazione in esso contenuta. Ad esempio, i filtri sono utilizzati nell’elaborazione del segnale audio (musicale) per separare l’informazione a bassa frequenza da quella ad alta frequenza per realizzare i cosiddetti cross-over, ovvero il sistema che consente di ripartire correttamente il segnale tra altoparlanti a bassa frequenza (woofer) da quelli ad alta frequenza (tweeter).

Un filtro si caratterizza tramite la funzione di trasferimento. Questa descrive come l’ampiezza del segnale viene modificata in funzione della frequenza. La funzione di trasferimento si ottiene tramite uno studio in regime variabile, utilizzando la trasformata di Laplace e la trasformata di Fourier.

Il segnale quando attraversa un sistema subisce un’azione di modifica della struttura frequenziale, ovvero viene filtrato. La natura del filtraggio subito dal segnale è completamente descritta dalla funzione di trasferimento. La funzione di trasferimento è definita come rapporto tra segnale filtrato (segnale di uscita) e segnale prima del filtraggio (segnale di ingresso). Essendo il filtraggio un processo che agisce modificando le componenti frequenziali, la funzione di trasferimento è definita nel dominio delle frequenze, cioè come rapporto tra lo spettro del segnale filtrato (di uscita) e lo spettro del segnale non filtrato (di ingresso). La funzione di trasferimento descrive completamente il comportamento del filtro nella sue capacità di modifica selettiva delle frequenze del segnale e quindi è anche chiamata “risposta in frequenza”. La funzione di trasferimento del filtro, detta anche caratteristica, è rappresentata attraverso un diagramma descritto nel dominio delle frequenze. I parametri caratterizzanti un filtro sono tutti inclusi nella sua funzione di trasferimento: • Banda passante: è l’intervallo frequenziale entro cui le componenti frequenziali del segnale non sono modificate; • Banda attenuante: è l’intervallo frequenziale entro cui le componenti frequenziali del segnale sono modificate; •Frequenza di taglio: è la frequenza in cui avviene il passaggio tra banda passante e banda attenuante; •Pendenza della banda attenuante: è l’entità di attenuazione della banda attenuante;

I filtri possono essere caratterizzati da una funzione di trasferimento qualsiasi, ma nella pratica si utilizzano principalmente filtri con funzioni di trasferimento abbastanza semplici. • Passa basso: attenua le frequenze alte e lascia inalterate quelle basse •Passa alto: attenua le frequenze basse e lascia inalterate quelle alte •Passa banda: attenua le frequenze alte e basse al di fuori di una banda centrale

che lascia inalterata; •Elimina banda (notch): attenua le frequenze in una banda centrale, lasciando

inalterate quelle al di fuori di tale banda; •Filtro multibanda (pettine): si comporta come un filtro passa banda oppure

elimina banda multiplo; Un filtro con una funzione di trasferimento qualsiasi è ottenibile da una opportuna composizione lineare serie e/o parallelo di filtri di base.

Modifica del suono Filtri digitali y(n) = a0 x(n) + a 1 x(n-1) + a2 x(n-2)

x(n)

x(n)

x(n-1)

► T



ZT

x(n-2)

r a0 x(n)

a1 x(n-1)



a2 x(n-2)

< D a0x(n) +a1 x(n-1)

*y(n)

x(n) è il segnale di Ingresso campionato: x(0) a t = 0, x(1) a t = Ts, x(2) a t = 2 T s ... T s : periodo di campionamento = 1/F8 an = coefficenti del filtro

Z"1= ritardo unitario (restituisce in uscita il campione entrante dopo un periodo di campionamento)

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

108

I filtri digitali derivano dai filtri analogici in quanto è possibile emulare con i componenti digitali le stesse funzioni dei componenti analogici. La memoria digitale (numerica) consente di memorizzare i campioni del segnale per ottenere 1’elaborazione differita nel tempo, in accordo con il meccanismo di filtraggio. La moltiplicazione digitale (numerica) consente di modulare l’azione delle memorie in maniera da simulare la diversa capacità di memorizzazione di carica di condensatori di differente capacità. L’aspetto più attrattivo della realizzazione digitale dei filtri sta nella semplicità del modello algoritmico: si tratta di una semplice sommatoria di prodotti. Inoltre, la possibilità di rappresentare attraverso il firmware la struttura funzionale del filtro apre innumerevoli possibilità applicative, prima impossibili da realizzare con la componentistica analogica.

Modifica del suono Modello matematico dei filtri digitali

M

v -i

y(n) = Ya( j ) x( n y=o

+ 'Lb(k)y(n k =1

Risposta finita all’impulso FIR

Retroazione

Risposta infinita airimpulso IIR

27/01/2004

Copyright 2002-2003 Prof. Mario MalcangiI

109

La funzione di trasferimento dei filtri è calcolata attraverso un processo chiamato risposta in frequenza. La risposta in frequenza si ottiene computando lo spettro del segnale di uscita del filtro quando il segnale di ingresso è un impulso (risposta all’impulso). I filtri digitali, in base alla natura della risposta all’impulso, si classificano in due tipologie fondamentali: IIR e FIR. I filtri IIR (Infinite Impulse Response) derivano direttamente dal modello analogico. Si caratterizzano per la durata infinita del segnale di risposta all’impulso. I filtri FIR (Finite Impulse Response) non hanno un corrispettivo analogico, quindi sono realizzabili solo nel dominio digitale. La risposta all’impulso in questo caso è di durata finita.

Modifica del suono Modello grafico dei filtriI

I filtri possono essere rappresentati anche tramite schemi funzionali (grafici) che traducono in termini di blocchi di elaborazione di base il modello matematico discreto. La rappresentazione matematica è utile alla progettazione di natura firmware dell’algoritmo, soprattutto quando si utilizzano architetture di calcolo sequenziali o a limitato parallelismo interno. La rappresentazione matematica dell’algoritmo non evidenzia i parallelismi computazionali intrinseci dell’algoritmo. La rappresentazione grafica dell’algoritmo consente invece di evidenziare i parallelismi esecutivi e quindi, in una eventuale realizzazione hardware, di sfruttarli adeguatamente in modo da ottenere le migliori prestazioni esecutive possibili. Osservando ad esempio il modello grafico del filtro, si rileva 1’esistenza di parallelismi esecutivi sia nella componente diretta (componente FIR), sia in quella di retroazione. Tutti i prodotti tra i campioni e i coefficienti possono essere eseguiti in parallelo (contemporaneamente) se si dispone di tanti moltiplicatori indipendenti, quanti ne sono rappresentati nello schema funzionale del filtro, e di due sommatoli a ingressi multipli.

La convoluzione è un algoritmo matematico fondamentale per la realizzazione dei filtri. La convoluzione è anche fondamentale per capire il meccanismo del filtraggio. Prima di introdurre l’algoritmo della convoluzione, è necessario definire il concetto di “sistema lineare”. Un sistema lineare è un sistema che evidenzia tre importanti proprietà: omogeneità, additività e invarianza rispetto ai ritardi.

1 sistemi perfettamente lineari non esistono, né possono essere realizzati. Esistono però i sistemi “quasi lineari”, cioè con comportamento molto vicino a quello lineare, tanto da poter essere correttamente (utilmente) considerati lineari. I filtri FIR e IIR sono sistemi lineari. Per verificare se un sistema è lineare, è sufficiente verificare sperimentalmente che soddisfi le tre suddette condizioni. La condizione di omogeneità si verifica applicando in ingresso un segnale x(n) e misurando la corrispondente uscita y(n). Se applicando un segnale kx(n) l’uscita è ky(n), con k costante, allora il sistema ha la caratteristica di omogeneità.

Modifica del suono Natura lineare di un sistema (additività)

27/01 /2004

Copyright 2002-2003 Prof. Mario Malcangi

112

La condizione di additività si verifica applicando in ingresso un segnale x j(n) e misurando la corrispondente uscita y,(n), quindi applicando in ingresso un segnale x2(n) e misurando la corrispondente uscita y2(n). Se applicando un segnale somma (o differenza) di Xj(n) e x2(n) l’uscita è pari a y,(n)+y2(n) (y((n)y2(n)), allora il sistema ha la caratteristica di additività (sovrapposizione degli effetti).

Modifica del suono Natura lineare di un sistema (invarianza per i ritardi)

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

113

La condizione di invarianza per i ritardi si verifica applicando in ingresso un segnale x(n) e misurando la corrispondente uscita y(n). Se applicando un segnale x(n) ritardato di k campioni l’uscita è y(n) ritardata di k campioni, allora il sistema ha la caratteristica di invarianza per i ritardi.

Modifica del suono Funzione Delta (Segnale Impulso)

La funzione Delta (segnale impulso), ha una notevole importanza per lo studio e ampiezza 1 per una durata infinitesima all’istante t e ampiezza zero per qualsiasi altro istante di tempo. L’equivalente discreto x(n)=S(k) ha ampiezza 1 al k-esimo campione e zero per tutti gli altri campioni diversi da k. L’indice di campionamento k in corrispondenza del quale si manifesta l’ampiezza unitaria della funzione Delta identifica il ritardo. Ad esempio, 8(3) ha ampiezza 1 in corrispondenza del campione 3 e zero in corrispondenza di qualsiasi altro campione. L’impulso ha una importante proprietà nel dominio ffequenziale: il suo spettro è una costante di ampiezza unitaria. Dunque, il segnale impulso può essere utilizzato per studiare i sistemi lineari (i filtri lineari) in quanto si comporta come la costante 1 nell’algebra lineare: 1 x h = h.

Modifica del suono Scomposizione di un segnale qualsiasi in impulsi

Un segnale qualsiasi x(n) può essere scomposto in una composizione lineare di impulsi di opportuna ampiezza e ritardo. E’ esattamente quello che accade quando un segnale qualsiasi viene campionato. Moltiplicando un impulso 8(k) per ima costante m, si ottiene un impulso di ampiezza m. Poiché un segnale campionato x(n) è una sequenza di impulsi di ampiezza pari all’ampiezza del campione e di ritardo pari all’istante di campionamento, sommando insieme tanti impulsi modulati con 1’ampiezza dei campioni di x(n) ritardati dell’indice di campionamento, si ottiene x(n).

Modifica del suono Risposta alFimpulso

(n)

5

h(n)

T“ T >

n 5

(n) = [ , , , , , , , , 0

0

0

1

0

0

0

0

]

0

h(n) = [ , , , . ,- . ,- . ,- . , ,..., ] 0

27/01/2004

0

0

1

3

0

3

0

2

Copyright 2002-2003 Prof. Mario Malcangi

0

1

0

0

116

Ogni sistema che riceve in ingresso un segnale x(n) risponde in uscita con un segnale y(n). y(n) è il segnale x(n) modificato dalle caratteristiche funzionali del sistema. Quando un sistema riceve in ingresso un impulso S(n), questo risponde in uscita con una segnale h(n). Il segnale h(n) è la cosiddetta “risposta all’impulso”. Quando il sistema è lineare, la risposta all’impulso ha sempre la medesima forma d’onda a meno di un fattore di scala (omogeneità) e di ritardo (invarianza rispetto ai ritardi).

Modifica del suono Convoluzione: dominio del tempo 1-

Î

y(n-l)=x(l)*h(n)

1-

P 10

T I— r

+

T*

n

x(n) I

I

I

Iîn

10 îî 11 > * n

n

y(n)=x(n)*b(n)

n

y(n ) =

n

y(n-3)=x(3)*h(n)

y(n)

I►

î î►

x(rì)

10

T ri ' "*■ '

*h(rì) = V x{m)h{n —m)

n

m= 0 27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

117

Poiché un segnale qualsiasi x(n) è una combinazione lineare di impulsi modulati nel tempo e nei ritardi, l’uscita y(n) del sistema è la somma delle singole risposte all’impulso prodotte da ogni impulso che compone il segnale x(n) (principio di additi vità). Se h(n) è la risposta all’impulso unitario 5(0), h(n-m) è la risposta all’impulso unitario 8(m). Modulando 5(m) con l’ampiezza dell’m-esimo campione x(m) si ottiene la singola risposta x(m)h(n-m). La somma di tutte le singole risposte all’impulso produce l’uscita y(n). Questa sommatoria è la convoluzione, sinteticamente rappresentata da un asterisco (*). Un sistema (filtro) si caratterizza dunque tramite la risposta all’impulso. Quando riceve in ingresso un segnale, convolve questo per la risposta all’impulso che la caratterizza e produce in tal modo la relativa uscita.

Modifica del suono Convoluzione: dominio della frequenza

k

T— r >

A

X(k) o

t

------- ►

H(k)

1

—1—1 1 1►

- 1

k

Y(k)

27/01/2004

------- ►Y (k) H i —r

k

X(k)H (k)

Copyright 2002-2003 Prof. Mario Malcangi

118

Una importantissima proprietà della convoluzione è la seguente: il prodotto di convoluzione nel dominio del tempo corrisponde nel dominio frequenziale a un semplice prodotto aritmetico, e viceversa, cioè, il prodotto di convoluzione nel dominio frequenziale corrisponde nel dominio del tempo a un semplice prodotto aritmetico. Ciò significa che lo spettro X(k) del segnale di ingresso x(n) viene moltiplicato per lo spettro H(k) della risposta all’impulso h(n), producendo in tal modo lo spettro Y(k) del segnale di uscita y(n).

Uno dei principali vantaggi della convoluzione nel dominio delle frequenze è la possibilità di ottenere con estrema semplicità Foperazione inversa, la deconvoluzione. Poiché la convoluzione consente di ottenere il segnale di uscita y(n) quando sono noti il segnale di ingresso x(n) e la risposta all’impulso, la deconvoluzione consente di ottenere il segnale di ingresso x(n) che avrebbe prodotto il segnale di uscita y(n) se x(n) fosse applicato in ingresso ad un sistema con risposta all’impulso h(n). In certe applicazioni è noto il segnale di uscita e le caratteristiche del sistema che l’ha generato, ma non è noto il segnale di ingresso. Per ottenere il segnale originario x(n) è sufficiente eseguire la deconvoluzione, cioè il rapporto tra lo spettro del segnale y(n) e quello della risposta all’impulso h(n). La deconvoluzione è una specie di “macchina del tempo” in quanto consente di tornare ricostruire ;o Caruso. ! strumentazioni Purtroppo anni, quindi non è possibile eseguire una replica. La deconvoluzione non può resuscitare Caruso, ma può “resuscitarne”, o meglio ricostruirne, la voce originaria. Essendo ancora esistenti gli strumenti di registrazione originari, è possibile ottenere la funzione h(n) e quindi il suo spettro H(k). Il segnale registrato y(n) viene convertito in spettro Y(k). Tramite la deconvoluzione si ottiene X(k), cioè lo spettro del segnale originario x(n) che Caruso aveva prodotto quando fu registrato agli inizi del ‘900.

Modifica del suono Risposta in frequenza

Un’altra importante implicazione della convoluzione nel dominio delle frequenze è la cosiddetta “risposta in frequenza”. H(k), lo spettro della risposta all’impulso, è il rapporto tra lo spettro di uscita Y(k) e lo spettro di ingresso X(k). Se il segnale di ingresso è un impulso, il suo spettro è una costante (1). Ne consegue che H(k) è uguale a Y(k) quando in ingresso il sistema riceve un impulso, cioè, lo spettro della risposta all’impulso è la risposta in frequenza del sistema. La risposta in frequenza di un sistema descrive come il sistema modifica l’ampiezza (e la fase) di ogni componente spettrale del segnale di ingresso in corrispondenza di ogni frequenza.

Modifica del suono Filtraggio (dominio del tempo)

Il filtraggio è la modifica dell’ampiezza e della fase delle componenti frequenziali di un segnale. La convoluzione è un algoritmo che consente di realizzare il filtraggio. È sufficiente conoscere di un filtro la risposta all’impulso h(n). Il prodotto implementa il filtro.

La dimostrazione evidente del fatto che la convoluzione è di fatto un algoritmo di filtraggio è nel dominio delle frequenze. Qualsiasi componente frequenziale del segnale di ingresso viene modulata in accordo con la caratteristica della risposta in frequenza H(k), quindi il segnale di ingresso viene filtrato.

Modifica del suono Risposta finita all’impulso

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

123

Grazie all’algoritmo della convoluzione possiamo realizzare virtualmente qualsiasi tipo di filtro, basta conoscere del filtro che interessa realizzare la sua risposta all’impulso h(n). Se si tratta di un filtro esistente, ad esempio un filtro analogico che si vuole realizzare in digitale, è sufficiente fornire in ingresso a tale filtro un impulso e digitalizzarne la risposta. Questa è h(n), che inserita nel prodotto di convoluzione, consente di realizzare l’equivalente digitale del filtro analogico. Se invece vogliamo ottenere un filtro con una determinata risposta in frequenza, allora è sufficiente definire H(k) e calcolarne la trasformata di Fourier inversa per ottenere h(n), la risposta alPimpulso. Il filtro desiderato viene implementato tramite la convoluzione. La risposta all’impulso nei filtri è di durata infinita, cioè h(n) è una sequenza di lunghezza infinita. La conseguenza è che il calcolo della convoluzione è di durata infinita, quindi impossibile da realizzare in termini numerici, cioè con un sistema di calcolo discreto come il calcolatore numerico. La risposta all’impulso può essere considerata di durata finita comunque dopo un certo tempo, in quanto le variazioni di ampiezza diventano talmente piccole da essere trascurabili. Il filtri FIR (Finite Impulse Response) si basano sull’algoritmo della convoluzione nell’ipotesi di risposta all’impulso finita.

Modifica del suono Effetti della risposta finita all’impulso b(t)t

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

Rendere finita una risposta all’impulso infinita comporta delle conseguenze sulla natura della risposta in frequenza del filtro. Se di una risposta all’impulso infinita si ignora una parte, considerandola finita^ la risposta in frequenza reale evidenzia delle oscillazioni laterali (ripple) che la risposta in frequenza ideale non presentava. Ciò comporta che non vi è una perfetta corrispondenza alle specifiche funzionali del filtro e quindi la necessità di operare in modo da minimizzare gli scostamenti del comportamento reale rispetto a quello ideale.

Modifica del suono Esempio di restauro di segnale Segnale contaminato

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

125

Una delle più semplici applicazioni del filtraggio FIR è il “moving average”. Questo filtro consiste semplicemente della media di M campioni: y(n) = l/M[x(n)+x(n-l)+x(n-2)+ ... +x(n-M)] Anche se non evidente, la risposta all’impulso di questo filtro è h(n) = [1/M, 1/M, 1/M,..., 1/M], una sequenza di lunghezza M. Questo filtro è utile per la riduzione del rumore a larga banda, in particolare per la ricostruzione di segnali digitali che attraversano sistemi rumorosi. Computazionalmente il moving average è un filtro estremamente economico in quanto non contiene moltiplicazioni (tranne quella per il reciproco del numero di campioni mediato), quindi può essere implementato anche su processori CISC.

Modifica del suono Moving average: risposta in frequenza

La risposta in frequenza del filtro moving average è di natura passa-basso. I parametri del filtro, frequenza di taglio, pendenza, ecc., sono determinati dalla lunghezza della risposta all’impulso, cioè, in questo caso, dal numero di campioni mediato.

Modifica del suono W indowed-Sy nc

Per ottenere un filtro passa basso con le desiderate caratteristiche di risposta in frequenza si può partire dalla definizione della risposta in frequenza H(k) e quindi, tramite la trasformata inversa di Fourier, ottenere h(n) da inserire nel modello di filtraggio basato sulla convoluzione. La risposta in frequenza di un filtro ideale passa basso è una funzione H(k) che vale 1 fino alla frequenza di taglio e 0 dalla frequenza di taglio in poi (funzione impulso di durata finita). La trasformata inversa di Fourier di H(k) è h(n) = sen(x)/x, cioè la funzione sync.

Modifica del suono Windowed-Sync A

A Risposta all’impulso ideale

A

Finestra

X

+oo

o 00 0

o

t

A f Risposta all’impulso reale

o ^ |

1

1

o

o o

27/01/2004

t Copyright 2002-2003 Prof. Mario Malcangi

t

Risposta in frequenza reale

f

f 128

La funzione h(n) = sen(x)/x è di durata infinita e necessita di essere troncata. Il troncamento netto della risposta all’impulso provoca una modifica della risposta in frequenza ideale. Sia nella banda passante, sia in quella attenuante, compaiono dei ripple. La banda di transizione si estende. La pendenza aumenta. Agli estremi della banda di transizione vi sono delle sovraelongazioni.

Modifica del suono

T

Windowed-Sync A Risp osta al l’irapuJ Iso idei ile

F in estra

1

1

o

/\ /v , \ r V V

X

0

J

V

A

a

v



R isposta all’im pulso reale

R isposta in freq u en za reale

o 27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

129

Gli effetti del troncamento della risposta all’impulso possono essere minimizzati. Il troncamento di fatto è una operazione di finestratura. Come già osservato nell’analisi del segnale, la finestratura netta è il prodotto tra il segnale da limitare in durata e la funzione finestra rettangolare. Se la funzione finestra è progressiva e non netta come quella rettangolare, allora gli effetti del troncamento vengono minimizzati. •



Da ciò deriva il nome wìndowed-sync per questa tipologia di filtri passa basso.

Modifica del suono Windowed-Sync

Blackman : w{n) - 0.42 - 0.5cos(2;m./2Àf +1) + 0.08cos(4^7z/2M +1)

27/01 /2004

Copyright 2002-2003 Prof. Mario Malcangi

- M

1

n u f

I

' J

r

.1

'rtuniti t i ,

r . i i

I

r

a

"i

1 H[Ll' (i] 'rii/ ......

I.

V

f

'

* J

e * V 1 ' , ' M .11 4 .

(*T)

V

,/i I l i ài»

è l l l Y ! ” ; | r '

i M

- n

J

ï

M

ij»

1. 11r j ':ir

,

| f



'• •';jyr,ii..1

« -wj

ì

It

i ¡Ilo,:..il

1

«

i

è) U i l •

è

IM I

I

d r i l l i v *

ï

i i,

r y - \

-,

.K

' W f”

“* T

W ir I I

•»



1 1 .

i i

ï

L , i V

¡•ì*1' ir »1♦'*PnIM ¡'ltJi’ IIIIII ,9f*Tlllf* VUVi 'Ü

i l

^

m

i

l u

i

.

i

M | | |

m

f f f

a li

ï

.

»?

m r

-

3

m » t

-

4

T

,

f

. '* 1

;

i

J r ?

" ï *

II

l | f 11

H I*

Passato

è . « J l

i

feïS'âfei* ?■*$

4 II II

4

> :

14»-f

,

r , - 2

ï

a

*ifylHi*jV I

.

' i i f v ï.

1,41

•4

i

" . p .

■ • ] f

♦ ..



- n

n

1 f 4H‘ * H Mi •

a 'iliIU II] I

m

I

j

.

a li

t

ài ii

t I

-"MlpiV! •

» « ..." j'iif i-e :i'M

Mr.. viyii:.•

.

\ rftlL li ï f i\f\\ * ti

*

i l , "

z*

i | . i ,

••a

.|

J

1là

J

ï

. U . l u

p

/ J l F

i l j

:

r i i

(

W

111.i,i I ï I ».

.

ili . r 'i t i

P

p i u

I

»

V F.'JI '¡l|r **

»*

m

.Il I II ’ «i. \

ï



I

"

I

»



1

, i * S

i'

k !r,,. |i

a

,1 ’

Ritardi



ï m

i ï, Jllfflflri .i Vìi'I •(•. •.r *-'N I Vili li’il I

a

111.

il»

----►

¡ r

•» U r

Predizioni

ViiwbiÌT“♦ 27/01/2004

t i

«

*i.

Ih »»M'ini ï HHi Imj ,* * tf»i I 4* ï i». J i ]Im iì 11 4 , jil ¡ A h u f . W

Futuro ï

1nu* ,.uu f.. .‘lii'ifi.t

|J

' à i

ï '

11» »

r

»I

Rifilili® ex

S i

»



f ' M

V i !

.*

«I

J

e

'!

ï Mi WhM*.

V |

£

|li

3 » J I i l . 1 '

'

I

.

r ♦

1f '»

U t y

<

l i l U I

i

!

.4



nil : : 'id':rN“' .

'

4 . | | i

Ila

n, i l

I II

A,

I

Copyright 2002-2003 Prof. Mario Malcangi

132

Questo effetto di ritardo del segnale, per i sistemi digitali, cioè che trattano segnali campionati, il ritardo è un multiplo del tempo di campionamento Tc> quindi nTc, e conseguentemente l’esponenziale complesso nel dominio delle frequenze è e snTc. Considerando esTc= z, i termini z"n rappresentano i ritardi .-1 digitali (z_1 è il ritardo unitario, pari ad un intervallo di campionamento). Conseguentemente, i termini zn sono predizioni, cioè anticipi di presentazione in uscita.

I filtri IIR (Infinite Impulse Response) si caratterizzano per la durata infinita della risposta all’impulso. A differenza dei filtri FIR che richiedono il campionamento della risposta all’impulso, i filtri IIR producono la risposta all’impulso attraverso la retroazione. Questa caratteristica consente di ottenere, in forma numerica, la stessa funzionalità dei filtri analogici. La trasformata Z ed altri metodi matematici (ad esempio la trasformata Bilineare) consentono di modellizzare i filtri analogici per ottenerne l’equivalente modello IIR numerico. I filtri IIR hanno il vantaggio di essere molto compatti dal punto di vista computazionale e facilmente parametrizzabili rispetto ai filtri FIR. Per contro possono essere instabili, difficili da controllare in termini di aritmetica a virgola fissa, non controllabili nella fase e numericamente ingestibili se di ordine troppo elevati.

Modifica del suono Filtro Passa Basso —Primo ordine

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

1 3 4

Il più semplice dei filtri IIR è il filtro RC. Utilizzando la trasformata Z è possibile derivare l’equivalente numerico del filtro analogico RC.

Sintesi del suono

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

La sintesi del suono è alla base di numerose applicazioni di audio digitale, dalla realizzazione di strumenti musicali elettronici alla realizzazione di sistemi di sintesi automatica del parlato. Tutte le metodologie di base, analisi e filtraggio, concorrono alla implementazione delle principali tecniche di sintesi. Per approfondimenti: [Moorer 77], [Moorer 75a], [Moorer 75b].

Sintesi del suono Modellazione

x ( n T s) oppure

x(n),

N

< n < N

2 ?

n

e

l

T: perìodo di campionamento

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

138

La sintesi digitale dei suoni consiste nel generare la sequenza di numeri x(n) che un convertitore analogico-digitale produrrebbe in uscita se in ingresso ricevesse il suono che si intende sintetizzare. La sintesi digitale dei suoni può essere ottenuta nel dominio del tempo oppure nel dominio delle frequenze. Nel dominio del tempo la sintesi digitale del suono può essere realizzata tramite la rappresentazione matematica discreta del suono, oppure tramite un modello di generazione numerica dei campioni del suono da sintetizzare.

4

Il tono puro è un suono che, in accordo con il modello armonico di Fourier, è costituito da un’unica componente fìrequenziale, ovvero quella pari all’inverso del suo periodo di oscillazione. Ad esempio, un tono puro è quello prodotto dall’oscillazione di un diapason. Questo strumento analogico è uno dei pochissimi che è effettivamente in grado di generare un suono sinusoidale “quasi puro”. Il modello numerico del tono puro è derivabile da quello continuo, sostituendo alla variabile tempo continuo t la variabile tempo discreto (t = nTs ): A(t) = A • sin(27tF nTs + (p0) La sequenza N di campioni, equivalente a quella ottenibile campionando per NTS secondi un suono sinusoidale di ampiezza A, frequenza F, fase iniziale (p0, è ottenibile a controllo di programma come segue:

for (n=0; n *JMC Aderta» , Tvmò-5&-b»i G#riG*‘tìrtc«r r^hii tkw^ì sa^w

Data

*

J'TAO

MttMÌMS*

M OOA’inoX Copyright 2002-2003 Prof. Mario Malcangi

Motorola ha introdotto negli anni ’80 l’architettura DSP56000, un DSP monolitico a 24 bit fixed-point, studiato appositamente per l’implementazione efficiente di algoritmi di elaborazione numerica del segnale in tempo reale in banda audio (fino a 20 kHz). In particolare, questa architettura, basata sul modello computazionale Harvard, è stata ottimizzata per ottenere il massimo parallelismo esecutivo per uno stadio di calcolo dell’algoritmo di filtraggio FIR: ajX(n-i) Apparentemente si tratta di un semplice prodotto. In realtà nasconde numerose operazioni: •prodotto tra un coefficiente a., e un campione x(n-i) •accumulo con i prodotti (i-1)-esimi •fetch di un nuovo coefficiente e un nuovo campione per (i+l)-esimi prodotti •aggiornamento dei puntatori di accesso ai coefficienti e ai campioni •controllo del possibile overflow (aritmetica di saturazione) •controllo del possible underflow aritmetico •altre operazioni di controllo numerico (arrotondamento, scaling, ecc.).

Architetture DSP per l’audio Motorola DSP56300 (cont.) t i r Tnpi* TVnor

— HOU W w fiw *

ess»

hm

1 — 3C1 M o rto #

ki5lnic*ion 1024 24\ Peripheral Exp*h«fon Aree

Äc*Jrt*U

XAO

Ü a n o te H o o

U nii

FAB

S*XCh»JV*Ç<

¡1

iti

*>MA Unii

24-B lt SP3O3Ô0 Cor®

i -Cftcr.«

C o n t/ C f

C e n im i

Intorno*

Oft« 6m» seifen

EXT At

C>C#A

öen*****

iM *rrxx»y

:JP ro « « « ; ; v ,Z Ò > w , PtüäMm, Intsrrwl W~*k Dea** ■ !-* ►! Add.**» »Cs«««««

h$S£T ■ M fÉ

• »A A A * « . a

P IN IT 3 ÌM T

* Çâm £$K»

m o d S T r o o MOfXvTfiöfi

34 * :Î4 •*■5« '•

_______

•t/T l T Ì

n - * : . '

rSSzP aL Ì I v . U \

.DI

'W lfo f ^

k

A

M i1

T M



l'ì

NOP

Wl(l 1*

A

_____

■ 1

'

M

1

• figli ncuu’uqi,

IÙ*'rm T

T

HOT

«

DI

A4,*A7

fai!

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

231

Un filtro FIR, codificato per un’architettura VLIW C6000, richiede in totale 18 istruzioni, di cui 11 nel ciclo.

Architetture DSP per l’audio Texas Instrumets C6000 Codice

L’architettura VLIW C6000 esegue contemporaneamente 8 istruzioni semplici per volta. Ciò viene ottenuto estraendo ed assemblando pacchetti di 8 istruzioni da 32 bit in un’unica istruzione da 256 bit.

Architetture DSP per l’audio Texas Instrumets C6000

External Interface

Il bus istruzioni è quindi ampio 256 bit, rendendo così possibile il fetch di una istruzione VLIW con un solo accesso alla memoria di programma.

Architetture DSP per l’audio Texas Instrumets C6000

► 1

1

DMA

D (32)

y

EMIF

,D2

Serial Port

.MI .M2

Host Port

.LI

.L2

Boot Load

.S2

Timers

.DI Memoria Esterna «

I



.SI

Control Regs 27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

Pwr Down 234

Come nell’architettura Harvard, l’architettura C6000 tiene separata la memoria dati dalla memoria di programma.

Architetture DSP per l’audio Texas Instrumets C6000 Completamente Parallelo

Sequenziale

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

Una sequenza di programma può essere eseguita con totale parallelismo se vengono sfruttate opportunamente le risorse del processore. Una singola unità esecutiva impone una notevole limitazione al parallelismo quando sono da eseguire istruzioni che accedono alla stessa risorsa. Ad esempio, due somme di seguito non possono essere eseguite contemporaneamente in quanto entrambe richiedono l’ALU (.L unii), ma se si dispone di due ALU indipendenti (.LI e 1 ,2 ), allora è possibile eseguire in parallelo le due operazioni, quindi in metà tempo. L’esecuzione completamente parellela di 8 istruzioni in una architettura WLIV come quella C6000 equivale all’esecuzione di una sola istruzione di un’architettura Harvard o RISC.

Architetture DSP per l’audio STMicroelectronics Nomadik Timers

G PIO x76

Watchdog MART x2 MSP (AC97J2S.S P\)

MMMMàBfl Interrupt Controller Bridge Bridge

I2C x2 Color LCD Ctrl Display I/F

16 Channel DMA Ctrl

27/01/2004

BAM/ROM Secured

Audio Smart Accelerator

Video Smart Accelerator

Camera U f

Copyright 2002-2003 Prof. Mario Malcangi

236

La piattaforma multimédia-computing Nomadik di STMicroelectronics è un’architettura di elaborazione distribuita che utilizza processori di segnale specializzati e un processore RISC ARM926E-JS per supportare in maniera efficiente le applicazioni multimedia (audio-video). Il processore ARM926EJ-S svolge la funzione di CPU host per l’intera piattaforma di computing multimedia. Si tratta di una CPU RISC a 32 bit operante a 350 MHz in tecnologia CMOS 0,13 micron. Questo core include una memory management unit (MMU), 32 kbyte di cache istruzioni, 16 kbyte di cache dati, un moltiplicatore 16x32 bit per eseguire in un solo ciclo istruzione le operazioni MAC. L’istruzione MAC singolo ciclo, e una serie di altre estensioni DSP, consentono a questo processore RISC di eseguire abbastanza efficientemente anche algoritmi DSP di piccola e media complessità computazionale. La piattaforma Nomadik include due acceleratori computazionali di natura DSP, uno per la componente applicativa digitai audio, l’altra per la componente applicativa digitai video. L’acceleratore audio è un DSP completamente programmabile in C, mentre l’acceleratore video è una soluzione mista hardware-software. Questi acceleratori consentono di eseguire ad altissima velocità la generazione e la registrazione video consumando pochissima potenza elettrica, oltre a eseguire applicazioni come il content playback e la comunicazione audiovisiva bidirezionale. L’accesso alla memoria di questi acceleratori computazionali avviene tramite DMA, quindi non penalizzano l’operatività della CPU RISC.

Architetture DSP per l’audio STMicroelectronics Nomadik U l 1 I I •m 111 c u l l i

ai

!I t

Instruction

RAM

MMDSP+ Host Data Bus

Slave AHB

_____________________ _____________________________________

CCP/CCIR656 (Picture Post Processing)

(Video Codec Unit)

Video l/F

(Picture Input Formating)

Master AHB

fv

Accelerator Data Bus

u W Itf

27/01/2004-

Copyright 2002-2003 Prof. Mario Malcangi

237

La minimizzazione della memoria è l’obiettivo primario nella realizzazione del processore video. Nel caso del processore video integrato nella piattaforma Nomadik si utilizzano solo 48 kbyte di memoria interna SRAM per il tramegrabbing e la finestra di ricerca, contro i 1200 kbyte richiesti normalmente. Oltre alla data RAM, il processore video dispone della istruction RAM e del core VLIW MMDSP+ (Multi-Media DSP Plus) operante a 200 MHz, con un solo ciclo di clock per istruzione e doppia modalità computazionale (fixed-point a 16/24 bit e floating-point a 32 bit). Operatori hardwired vengono utilizzati congiuntamente al core MMDSP+ per garantire le prestazioni di elaborazione digitale dell’informazione video in termini deterministici.

Architetture D SP per l’audio STMicroelectronics Nomadik

Slave AHB

ARM DMA

l/F

.......

. . . . I . l l i l ,

XD Bus DMA

l-Cache DMA

Master AHB 238

L’acceleratore audio integra MMDSP+. Questo esegue le funzioni codificate in una libreria digitai audio software (MP3, MIDI, SRS, WOW, ecc.).

Architetture DSP per l’audio STMicroelectronics Nomadik iu .A lJ tr-

Parlphorab

Accelerator*

te Driver« Tkt ’■

Physical

«HI

Physical Drivers

1 im a s r ir iT i

v .v .

M C U Cora ' *- ¡J ■f],f »¿¿I ! [Irti-

» peripherals

Common

«ulti media

pertetberefa

Btfr * •

feliii 27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

239

STMicroelectronics e Texas Instruments hanno attuato una iniziativa congiunta per la creazione di uno standard di interfaccia hardware e software chiamata OMAPI (Open Mobile Application Processor Interface). Questa interfaccia viene adottata dalla piattaforma Nomadik allo scopo di facilitare nello sviluppo di applicazioni audio/video di natura mobile, quindi con stringenti requisiti di compattezza dell’applicazione finale. Questo standard di interfaccia consente di mappare la parte hardware attraverso uno strato di astrazione software in modo che l’applicazione finale non debba eseguire chiamate dirette ad uno specifico sistema operativo.

27/01/2004

Copyright 2002-2003 Prof. Mario Malcangi

241

[AA.W . 96] Standards in Computer Generated Music, multiplatform mixed mode CDROM (Macintosh, Windows, Unix + CD-DA tracks), G. Haus & L Pighi Editors, IEEE Computer Society Press, 1996. [Abramowitz 65] Abramowitz - “Handbook of mathematical functions”, Dover Publications, New York, 1965. [Jayant 97] N. Jayant - “Signal Compression: Coding of speech, audio, text, image and video”, World Scientific Publishing, Singapore, 1997. [Malcangi 03] M. Malcangi - “Elaborazione Numerica del Segnale - Digital Signal Processing: teoria e pratica”, Ed. Libreria CLUP, Milano 2003. [Moorer 75a] J. A. M oorer- “On the segmentation and analysis of continuous musical sound by digital computer”, Standford University, report number STAN-M-3. [Moorer 75b] J. A. Moorer - “The synthesis of complex audio spectra by means of discrete summation formulae”, Standford University, report number STAN-M-5. [Moorer 77] A. Moorer - “Signal Processing aspects of computer music - A survey”, Computer Music Journal, February, 1977. [Olson 67] H. F. Olson - “Music, physics and engineering”, Dover Publications, New York, 1967. [O’Shaughnessy 87] D. O’Shaughnessy - “Speech sommunication - Human and machine”, Addison-Wesley, Reading (MA), 1987. [Watkinson 01] J. Watkinson - “The art of digital audio”, Focal Press, Oxford (MA), 2001.

Mario Malcangi (www.dico.unimi.it), laureato in Ingegneria Elettronica presso il Politecnico di Milano, è docente presso il DICo (Dipartimento di Informatica e Comunicazione) delPIJniversità degli Studi di Milano (www.dico.ummi.it), Dal 1980 è attivo nella ricerca finalizzata a IP applicazióne della metodologia delPelaborazione numerica del segnale (digitai signal processing) in ambito industriale, con particolare attenzione all’audio e alla voce. Negli anni ’90 ha esteso l’attività di ricerca alle metodologie sofi computing (reti neurali, logica fiizzy e algoritmi genetici) per affrontare problematiche di natura non lineare, soprattutto per applicazioni di riconoscimento di pattern. Campi di competenza sono Paudio digitale, P.elaborazione del segnale vocale e la biometrica. E’ responsabile del laboratorio DSP&RTS (Digital Signal Processing & Real-Time Systems www.dsp-rts.dico.unimi.it) e delle attività digitai audio del LIM (Laboratorio di Informatica Musicale - www.lim.dico.unimi.it) pesso il DICo delPUniversità degli Studi di Milano. E’ docente del corso di “'Informatica Applicata al Suono” presso PUniversità degli Studi di Milano e del corso “Elaborazione Numerica del Sgnale” presso l'Università degli Studi di Milano Bicocca. E' autore di vari libri, pubblicazioni, articoli scientifici e di numerosi articoli tecnici sulla teoria e pratica delPelaborazione numerica del segnale e della comunicazione digitale. T -

^

«»•









• •*

1

A

A

euro 14,00

9 788870 9 0 6 5 9 2

« f

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF