Artikulacija Percepcija i Analiza Govornog Signala

February 28, 2017 | Author: Александра Ж. Вукосављевић | Category: N/A

Share Embed Donate

Report this link

Short Description

Artikulacija...

Description

Artikulacija, percepcija i analiza govornog signala Prof. dr Vlado Delić FTN Novi Sad 27.10.2013.

Značaj govora i čula sluha • Glas bolje izražava (a uho oseća) – smisao i značenje – pol, starost, raspoloženje

• Alternative: – pantomima, pismo...

• Uloge u životu čoveka – opstanak: čuje zvuk sa svih strana, čak i kad spava – sporazumevanje: govor, muzika, sirena TEDxNoviSad, December 3rd, 2011

smišljanje poruke tekst

Šta će da kaže?

jezički kod prozodija

Kako će da kaže?

nervno-mišićna aktivnost artikulacija Način izgovora

emitovanje glasa (vokalni trakt)

shvatanje poruke Niz reči = rečenice semantika

jezički kod Niz fonema = reči

sintaksa

mehaničko-nervna transdukcija Razlikovanje fonema

pomeraji spektralna bazilarne analiza membrane

Jačina i visina tona

zvučna pobuda (pluća i glasnice) GOVORNIK

SLUŠALAC

Govorna komunikacija artikulatorna fonetika

auditorna fonetika

akustička fonetika ASR i TTS ::: Govorni signal

4

Agenda 1. Stvaranje (artikulacija) i slušanje (percepcija) govora – modelovanje procesa izgovaranja i slušanja – karakteristike po kojima se razlikuju glasovi • osnova za ASR, kodovanje i dr. obrade govornog signala

2. Reprezentacije govornog signala – talasni oblik s(t) (obiman, redundantan, varijabilan) – spektrogram s(t,f) (bolji, ali i dalje jako varijabilan)

3. Snimanje govora i merenje razumljivosti – izbor i postavke mikrofona za snimanje govora – objektivne i subjektivne mere kvaliteta govornog signala

ASR i TTS ::: Govorni signal

5

Artikulatorna fonetika

Motivacija: • Modelovanje produkcije govora  razumevanje strukture govornog signala  projektovanje algoritama za obradu govornog signala Proces artikulacije govora: • Pluća pokrenu vazdušnu struju kroz vokalni trakt • Oscilacije vazduha se prenose kroz niz povezanih otvora i šupljina, nailaze na različite oblike komora i prepreka – specifična je konfiguracija i pokreti organa vokalnog trakta za svaki glas – vrši se (ko)artikulacija niza glasova

ASR i TTS ::: Govorni signal

6

Uticaj delova VT i uha na zvuk VT je niz cevi i šupljina; i slušni kanal je kao cev • Posmatrajmo zvuk od ulaza u jednu cev – Da li je talasni front na ulazu u slušni kanal ravan ili sferni? – Kako se menja zvučni pritisak u prostoru i vremenu? • progresivni zvučni talas

– Šta ako je cev zatvorena sa druge strane? • progresivni i reflektovani zvučni talas

http://paws.kettering.edu/~drussell/Demos/waves-intro/waves-intro.html Artikulatorna fonetika ASR i TTS ::: Govorni signal

7

Akustička teorija produkcije govora Detaljna akustička teorija mora da razmotri sledeće efekte: • Vremenska varijacija oblika vokalnog trakta • Gubici usled sprovođenja toplote i viskozne frikcije na zidovima vokalnog trakta • Mekoća zidova vokalnog trakta • Radijacija zvuka sa usana • Uparivanje nazalnog trakta • Pobuđivanje zvuka u vokalnom traktu • Na ovom kursu ćemo razmotriti efekte prostiranja zvuka (bez gubitaka) kroz krutu glatku cev – sa zatvorenim krajem sa krutim/mekim zidom Artikulatorna fonetika ASR i TTS ::: Govorni signal

8

Stojeći talasi u cevi • Duvački instrumenti (npr. flauta ili klarinet) – duvamo sve, vraćaju se rezonantne f

• Slušni kanal – ovde se traži max na bubnoj opni

• Vokalni trakt (niz povezanih cevi) – svaka komora ima svoju rezonansu  formanti – postoje samo neparni harmonici

c

c fn   (2n  1) , n  1, 2, 3, ... n 4L

L  (2n  1)

otvoren kraj

n 4

, n  1, 2, 3, ... zatvoren kraj

pritsak

pritsak

pritsak

Artikulatorna fonetika ASR i TTS ::: Govorni signal

9

Uticaj akustičkih cevi na govor • Na koje frekvencije je uho najosetljivije? • Koja je rezonantna frekvencija slušnog kanala? (dužina je oko 2,5 cm) c 340 m s – rezonansa je oko:

f1 

4l



4  2,5 cm

 3400 Hz

• opseg 3-4 kHz se pojačava za oko 12 dB – a oko 7 kHz za svega 3 dB

• Dužina vokalnog trakta je oko 17 cm. U kom opsegu se generiše najviše energije u govoru? – rezonansa cevi od 17 cm je:

c 340 m s f1    500 Hz 4l 4 17 cm

• A od čega zavisi osnovna frekvencija glasa? Artikulatorna fonetika ASR i TTS ::: Govorni signal

10

Pojačanje zvuka u slušnom kanalu

Artikulatorna fonetika ASR i TTS ::: Govorni signal

11

Geometrija rezonatora u VT L  17.6 cm

L2 L1  8

2

A2 A1  8 L2 L1  1.2 L2 L1  1

2

A2 A1  8 A2 A1  1 / 8

1

2

A2 A1  1 / 8

L2 L1  1 / 3

1

1

F3

F4

500

1500

2500

3500

F1

F2

F3

F4

320

1200

2300

3430

F1

[i]

2

F1 220

F4

2720 3350

F4

1800 2230

630

L1  L2  14.5 cm

F3

F2 F 3 F1

1

F2

780 1240

1

2

A2 A1  8

F2

[a]

L1  L2  17.6 cm

L2 L1  1.5

F1

F2 F3

3800

F4

1770 2280 3240

F1

F2

F3

F4

260

1990

3050

4130

Artikulatorna fonetika ASR i TTS ::: Govorni signal

12

Modeli i spektri pojedinih glasova • Konfiguracija vokalnog trakta – usta dominantno utiču na oblik

• Model vokalnog trakta • Obvojnica rezultujućeg spektra

Artikulatorna fonetika ASR i TTS ::: Govorni signal

From Mark Liberman’s Web site

13

Delovi govornog mehanizma

artikulacioni organi

ždrelo

fonatorni organi

respiratorni organi

Artikulatorna fonetika ASR i TTS ::: Govorni signal

14

Model akustičkih cevi

Niz šupljina povezanih cevima su ekvivalentno LC kolo – rezonatori. Oni filtriraju – uobličavaju spektar (formiraju formantne oblasti) - karakteristično za svaki glas.

Artikulatorna fonetika ASR i TTS ::: Govorni signal

15

Modelovanje govornog mehanizma glas:

Periodična pobuda Šumna pobuda

zvučna bezvučna

M

Ž

D

f0

125

225

300

f0min

80

150

200

f0max

200

350

500

Vokalni trakt

govor

Artikulatorna fonetika ASR i TTS ::: Govorni signal

16

Linearni model produkcije govora Voiced Excitation Pitch Period AV IMPULSE TRAIN GENERATOR I(z)

GLOTTAL PULSE MODEL G(z)

Vocal Tract Parameters

Voiced/Unvoiced Switch

uG(n)

VOCAL TRACT MODEL V(z)

RADIATION MODEL R(z)

pL(n)

RANDOM NOISE GENERATOR N(z) AN

Unvoiced Excitation Artikulatorna fonetika ASR i TTS ::: Govorni signal

17

Linearni model produkcije govora |I(F)G(F)|

1/F0



-12 dB/oct

= Time

F0 2F0 ... Freq.

Pitch Period AV IMPULSE TRAIN GENERATOR I(z)

GLOTTAL PULSE MODEL G(z)

Vocal Tract Parameters

Voiced/Unvoiced Switch

uG(n)

VOCAL TRACT MODEL V(z)

RADIATION MODEL R(z)

pL(n)

RANDOM NOISE GENERATOR N(z) AN

Artikulatorna fonetika ASR i TTS ::: Govorni signal

18

Linearni model produkcije govora

Pitch Period AV GLOTTAL PULSE MODEL G(z)

IMPULSE TRAIN GENERATOR I(z)

Vocal Tract Parameters

Voiced/Unvoiced Switch

uG(n)

VOCAL TRACT MODEL V(z)

RADIATION MODEL R(z)

pL(n)

RANDOM NOISE GENERATOR N(z)



|N(F)|

AN

= Time

Frequency

Artikulatorna fonetika ASR i TTS ::: Govorni signal

19

Linearni model produkcije govora

Pitch Period AV

|V(F)| -12

IMPULSE TRAIN GENERATOR I(z)

GLOTTAL PULSE MODEL G(z)

8

8

6

6

4

4

2

2

0

0

-2

-2

-4

Voiced/Unvoiced Switch

-12

x 10

0

500

uG(n)

x 10

-4 1000 0

-12

8

x 10

6

4

4

2

2

x 10

Vocal Tract Parameters 0

0

Frequency -2

1500 500

-4 2000 1000 0

Frequency

-2

-4 2500 1500 500 3000 2000 1000 0 3500 2500 1500 500 4000 3000 2000 1000 3500 2500 1500 4000 3000 2000

3500 2500

4000 3000

VOCAL TRACT MODEL V(z)

V ( z)  RANDOM NOISE GENERATOR N(z)

|R(F)| +6 dB/oct

-12

8

6

3500

4000

RADIATION MODEL R(z)

pL(n)

G N

1   k z k k 1

AN

Artikulatorna fonetika ASR i TTS ::: Govorni signal

20

Linearni model produkcije govora |I(F)G(F)|

1/F0



-12 dB/oct

= Time

F0 2F0 ... Freq.

Pitch Period AV

|V(F)| -12

GLOTTAL PULSE MODEL G(z)

IMPULSE TRAIN GENERATOR I(z)

8

8

6

6

4

4

2

2

0

0

-2

-2

-4

Voiced/Unvoiced Switch

-12

x 10

0

500

uG(n)

x 10

-4 1000 0

-12

8

x 10

6

4

4

2

2



|N(F)|

x 10

Vocal Tract Parameters 0

0

Frequency -2

1500 500

-4 2000 1000 0

Frequency

-2

-4 2500 1500 500 3000 2000 1000 0 3500 2500 1500 500 4000 3000 2000 1000 3500 2500 1500 4000 3000 2000

3500 2500

4000 3000

VOCAL TRACT MODEL V(z)

V ( z)  RANDOM NOISE GENERATOR N(z)

|R(F)| +6 dB/oct

-12

8

6

3500

4000

RADIATION MODEL R(z)

pL(n)

G N

1   k z k k 1

AN

= Time

Frequency

Artikulatorna fonetika ASR i TTS ::: Govorni signal

21

Modelovanje govornog aparata • Pobuda se može razložiti na zvučni i bezvučni deo • Model vokalnog trakta je vremenski promenljivi digitalni filtar

Artikulatorna fonetika ASR i TTS ::: Govorni signal

22

Funkcije govornih organa organi

nazalni trakt pluća

grkljan

ždrelo

vokalni trakt

funkcije

rezonancija izdisaj

pomeranje glasnica

rezonancija

rezultujući efekti

rezonancija modulacija

intenzitet

zvučnost i F0

subglotalni pritisak

glotalni talas

fonacija (prozodijski parametri)

modulacija

modulacija govorni talas

artikulacija (spektralni parametri)

Artikulatorna fonetika ASR i TTS ::: Govorni signal

23

Oralni i nazalni izgovor Oralni izgovor

Nazalni izgovor

Auditorna fonetika ASR i TTS ::: Govorni signal

24

Uobličavanje spektra vokala

Artikulatorna fonetika ASR i TTS ::: Govorni signal

25

Primer sw alata za modelovanje VT

Artikulatorna fonetika ASR i TTS ::: Govorni signal

26

Modelovanje vokalnog trakta

Artikulatorna fonetika ASR i TTS ::: Govorni signal

27

Auditorna fonetika

Motivacija: • Modelovanje percepcije govora  razumevanje prirodnog prepoznavanja i razumevanja govora  projektovanje algoritama za ASR i SLU – problem je (ne)poznavanje viših kognitivnih nivoa

Proces percepcije govora: • Talasni front stigne do spoljnjeg uha • Ušna školjka i slušni kanal usmeravaju zvuk na bubnu opnu – usmeravaju i posebno pojačavaju govorne frekvencije

• Oscilacije bubne opne se prenose na bazilarnu membranu – vrši spektralnu analizu u toku vremena

• Mozak razaznaje niz glasova, shvata reči i rečenice, opaža emocije

ASR i TTS ::: Govorni signal

28

Delovi slušnog aparata Slušni kanal Ušna školjka

Slušne koščice Pužasto telo Kohlea

2.5 0.4cm cm2 Bubna opna

Presek kroz uho Auditorna fonetika ASR i TTS ::: Govorni signal

29

zvuk

0

20

Kako čujemo?

Slušni nerv

50 Hz

-60

Srednje uho

Frekvencija

-40

Spoljašnje uho

Amplituda dB -20

16 kHz

0

1

0

Kohlearni fluidi

2 Frekvencija Položaj kHz

3

4

35 mm

Unutrašnje trepljaste ćelije

Auditorna fonetika ASR i TTS ::: Govorni signal

30

Frekvencije duž bazilarne membrane

Auditorna fonetika ASR i TTS ::: Govorni signal

31

Položaj maksimalnog pomeraja bazilarne membrane za različite frekvencije pobude

Auditorna fonetika ASR i TTS ::: Govorni signal

32

Uhu primetne promene fekvencije

Osećaj promene visine tona 850 segmenata bazilarne membrane 32 mm po 37 m. Mel vs. Hz skala: - ista do 500 Hz - posle logaritamska Mel skala je linearna duž bazilarne membrane. Radna grupa ćelija bazilarne membrane - oko 100 mela.

Auditorna fonetika ASR i TTS ::: Govorni signal

33

Virtuelna visina tona • Uho detektuje f0 iako je nema • Kombinacija tonova – 2f1-f2, 3f1-2f2 i 4f1-3f2

Izvorni zvučni signal

Filtriranje (uklanjanje prva tri harmonika)

Spektar ostatka

Auditorna fonetika ASR i TTS ::: Govorni signal

34

Subjektivni osećaj visine tona (pič) • Ton iste frekvencije različito se doživljava ako je tiši ili glasniji  subjektivni osećaj = visina tona (vezana za pič period)

• Povećanjem intenziteta – osećaj visine tona se pomera naviše kod viših frekvencija • jači zvuk izgleda još viši – osećaj visine tona se pomera naniže kod nižih frekvencija • pojačavanjem disharmoničnog zvuka 168 i 318 Hz počinje da se čuje kao harmoničan ton 150 i 300 Hz

• Visina tona se vezuje za melodijsku skalu – kriva Mel-Hz kao pozicije Hz na bazilarnoj membrani

• Visina tona od 1000 mela = frekvenciji od 1000 Hz – samo za nivo od 60 dB Auditorna fonetika ASR i TTS ::: Govorni signal

35

Govorno područje (dB-Hz)

Auditorna fonetika ASR i TTS ::: Govorni signal

36

Krive maskiranja • Da li se efekat maskiranja odigrava na bazilarnoj membrani ili u CNS? Eksperiment: • Maskirajući zvuk na jedno uho, a maskirani na drugo. Ishod?

• Kritični opsezi – povezani sa bazilarnom membranom – širina se povećava na višim frekvencijama – terce se dobro poklapaju sa kritičnim opsezima

Auditorna fonetika ASR i TTS ::: Govorni signal

37

Binauralna lokalizacija izvora • Vremenska razlika između levog i desnog uha – fazne razlike – dominiraju ispod 1 kH

• Razlika u glasnoći na dva uha je i zbog zasenjivanja glave i ušnih školjki – razlike u intenzitetu – dominiraju iznad 1 kHz

Auditorna fonetika ASR i TTS ::: Govorni signal

38

Zakon prvog talasnog fronta • Prvo se čuje direktan zvuk, a potom refleksije • Ako je vremenska razlika između dva signala na mestu slušaoca veća od 1 ms – pozicija slušnog doživljaja zavisi od pravca u kom se nalazi izvor čiji signal je prvi stigao do slušaoca – drugi izvor postaje irelevantan u smislu lokalizacije

• Eksperiment sa govorom – stereo postavka zvučnika • dozirano kašnjenje i intenzitet iz drugog zvučnika • slušalac javlja kada opazi “refleksiju”

Auditorna fonetika ASR i TTS ::: Govorni signal

39

Fuzija audio signala • Nakon direktnog zvuka – uho prikuplja refleksije još 20-30 ms • rane refleksije doprinose intenzitetu zvuka

– stiče se utisak o • zvučnom izvoru – lokacija i dr. i • ambijentu – koliko brzo iščezava zvuk

• Refleksije koje kasne za više od 50 ms – čuju se kao eho ili odjek (jeka)

Auditorna fonetika ASR i TTS ::: Govorni signal

40

Odjek (jeka) • Ako kašnjenje prekorači neku gornju granicu – nastaju dva slušna doživljaja – odjek (jeka) – njihove pozicije zavise od pozicija izvora

• Prag jeke nema oštru granicu (kašnjenja) – kreće se između 35 i 50 ms – zavisi od vrste i glasnosti signala, kao i smera upada – povećanjem glasnosti prag se smanjuje, tj. odjek se uočava kod manjeg kašnjenja

Auditorna fonetika ASR i TTS ::: Govorni signal

41

Obrada govornog signala Prof. dr Vlado Delić FTN Novi Sad

Jedan ton i govorni signal • Kakva je veza između • Koja tri parametra sinusoida i govornog signala? karakterišu sinusoidu? • Sabijanje/razređivanje vazduha su • Kako se očitava frekvencija? pozitivne/negativne amplitude

Kolika je osnovna frekvencija (f0) govornog signala na slici? Akustička fonetika ASR i TTS ::: Analiza govornog signala

43

Promene amplitude u vremenu

Akustička fonetika ASR i TTS ::: Analiza govornog signala

44

Akustička fonetika ASR i TTS ::: Analiza govornog signala

45

Akustička fonetika ASR i TTS ::: Analiza govornog signala

46

Subjektivni osećaj visine tona Pič je subjektivni osećaj f0 (visina tona) – linearna veza do 1kHz – logaritamska preko 1kHz

Mel je jedinica za visinu tona • Mel skala – model f0-pič mapiranja f [mel]  1127  ln(1  f [Hz] 700) Par zvukova koji su po piču perceptualno ekvidistantni udaljeni su za isti broj mela.

Akustička fonetika ASR i TTS ::: Analiza govornog signala

47

Spektar jedne rečenice Način

Nivo

Max

88dBA

Shout

82dBA

vLoud

74dBA

Raised 65dBA Normal

57dBA

Relaxed

50dBA

Whisper

40dBA

1m, anechoic Akustička fonetika ASR i TTS ::: Analiza govornog signala

48

Govorno područje

49

Obvojnica i zvučnost u spektru Bezvučni glas [š]

Zvučni glas [a]

Akustička fonetika ASR i TTS ::: Analiza govornog signala

50

Glasovi se najviše razlikuju po obvojnici spektra.

Akustička fonetika ASR i TTS ::: Analiza govornog signala

51

Glasovi se najviše razlikuju po obvojnici spektra.

Akustička fonetika ASR i TTS ::: Analiza govornog signala

52

Spektrogram govora

Akustička fonetika ASR i TTS ::: Analiza govornog signala

53

Formantna struktura vokala

Akustička fonetika ASR i TTS ::: Analiza govornog signala

54

Spektrogram jedne rečenice

Akustička fonetika ASR i TTS ::: Analiza govornog signala

55

“Two plus seven is less than ten”

Akustička fonetika ASR i TTS ::: Analiza govornog signala

56

Širokopojasni spektrogram

Akustička fonetika ASR i TTS ::: Analiza govornog signala

“Two plus seven is less than ten” 57

Uskopojasni spektrogram

Akustička fonetika ASR i TTS ::: Analiza govornog signala

“Two plus seven is less than ten” 58

SNIMANJE GOVORA

ASR i TTS ::: Govorni signal

59

Potrebne karakteristike mikrofona • Koji je frekvencijski opseg govora? • Koliki je dinamički opseg govora?

• Koju karakteristiku usmerenosti izabrati? – ako čita neće praviti neočekivane izlete iz ose mikrofona • koristiti usmeren mikrofon – super- ili hiper-kardioid – izbegava se reflektovani zvuk i buka

– ako je slobodna interpretacija – okreće glavu, gestikulira • koristiti manje usmeren mikrofon – kardioid

ASR i TTS ::: Govorni signal

60

Postavljanje mikrofona • Govor – za RTV, film, razglas, pozorište – uvek je najvažnija razumljivost

• Snimatelj se na probi (15-20s) prilagodi govorniku – zanima nas zvučna snaga, spektar i dinamika – profesionalci su izabrani bez govornih mana

• Govornik se smešta u ambijent i podesi mu se položaj mikrofona – bitna visina i ugao ka govorniku

Problemi u snimanju govora • Prenaglašenost sibilanata (piskavih glasova) – rešavaju se zakretanjem mikrofona za 20-tak stepeni • jer je mikrofon najosetljiviji na VF u pravcu ose

• Kod praskavaca (ploziva) problem je jak vazdušni udar – rešava se udaljavanjem mikrofona • osa ostaje u pravcu usta

• Oba problema može da reši i specijalni štitnik – windschutz, windscreen • Eventualni mali gubitak u nivou signala lako se pojača • Problemi se rešavaju postavkom mikrofona, a tek onda filtrima • Kod više govornika, prvo se postavlja najkritičniji – retko se jednim mikrofonom rešava više od 3-4 govornika • npr. ženski glas bliže ali van ose • za više govornika bolja je osmičasta karakteristika usmerenosti

Snimanje govora sa više mikrofona • Prednosti: – grupisanje izvođača sa govornim manama – slobodnije korišćenje filtara, bojenja, i sl. – lako balansiranje glasovne ravnoteže – veći komfor za izvođače

• Problemi: – otežana operativnost za snimatelja • prati tekst • replike prati odsečna regulacija – povećan nivo šuma i reverberacije • ne trebaju svi odjednom – preklapanje signala – u slušalicama nema binauralnu lokalizaciju

Ozvučavanje vokala • Za snimanje u studiju – cevni mikrofon (npr. Neumann U 48)

• Za izvođenje uživo – robusnost, otpornost na vlagu, udarce; dinamički kardioidni mikrofon (najčešće SHURE SM 58)

• Zaštitne mrežice (zbog ploziva) • Zakretanje mikrofona kod visokih frekvencija • Kompresor – drži dinamiku vokala ujednačenom

• Reverb – uklapa vokal u celokupnu sliku, daje efekat prostora vokalu

MERENJE RAZUMLJIVOSTI GOVORA

ASR i TTS ::: Govorni signal

65

Merenje razumljivosti govora • Zadovoljavajuća – logatomi 65% • 75% - dobra • 60% - nedovoljna

– reči >90% – rečenice blizu 100%

66

Mean Opinion Score (MOS) skala • Neprimetna oštećenja • Primetna ali ne smetaju • Malo smetaju • Smetaju • Veoma smetaju

67

Uticaj reverberacije i šuma

68

Uticaj jačine na razumljivost

ASR i TTS ::: Govorni signal

69

Govor u bučnoj sredini Kriterijumi u dB(A)

Mogućnost sporazumevanja telefon i dr.

ispod 50

normalna

55

zadovoljavajuća

60-65

manje-više otežana

70

teška (samo govorne komande i neki zvučni signali)

iznad 75

nezadovoljavajuća (ne može se računati na sporazumevanje govorom)

70

Udaljenost sa koje se razume govor Kriterijumi u dB(A)

Udaljenost u metrima (normalan govor)

Udaljenost u metrima (glasan govor)

40-45

5

10

45-50

2,5

5

50-60

1

2

60-65

0,70

1,20

70

0,40

0,80

75

0,22

0,45

80

0,13

0,25

85

0,07

0,14

90

-

0,08

Za buku do 70 dB(A) govornik se razume iz prihvatljive blizine. Pri buci od preko 75 dB(A) moguće je dovikivanje na uvo. 71

Pitanja - artikulacija govora • Opisati govornu komunikaciju od govornika do slušaoca. • Koji su delovi govornog aparata? – Objasniti funkcije pojedinih govornih organa. • Kako rade glasnice? • Koji efekat stvaraju pluća? • Kako funkcioniše vokalni trakt?

• Skicirati model govornog mehanizma. – Kako se modeluju (bez)zvučni glasovi? – Kako se modeluje uticaj vokalnog trakta?

• Kako izgleda dugovremeni spektar govora? • Po čemu se razlikuju spektri pojedinih vokala? • Šta pokazuje spektrogram?

Pitanja - snimanje i merenje govora Snimanje glasa (govor/vokal)

Merenja govornog signala

• Karakteristike mikrofona:

• Objasniti MOS skalu

– frekvencijski opseg – dinamički opseg – karakteristika usmerenosti

• Kako se rešava: – prenaglašenost sibilanata – vazdušni udar praskavaca

• Prednosti i mane korišćenja posebnih mikrofona za svakog govornika

– Šta se meri i izražava na njoj?

• Šta su logatomi i kako se sa njima meri razumljivost? • Kako glasnost govora utiče na njegovu razumljivost? • Kako reverberacija utiče na razumljivost govora? • Kako nivo buke utiče na mogućnost sporazumevanja govorom?

Artikulacija, percepcija i analiza govornog signala Prof. dr Vlado Delić FTN Novi Sad

Artikulacija Percepcija i Analiza Govornog Signala

Short Description

Description

Comments

We need your help!