Cenusa Raischi Serban Matematici pentru Economisti.pdf
August 5, 2017 | Author: Darie Leolea | Category: N/A
Short Description
Download Cenusa Raischi Serban Matematici pentru Economisti.pdf...
Description
Biblioteca digitala - detalii carte
http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=21...
Prof.univ.dr.Gheorghe CENUSA,Prof.univ.dr.Radu SERBAN, Conf.univ.dr.Constantin RAISCHI Cuprinsul cărţii: PARTEA I: ALGEBRA Capitolul 1 SPATII VECTORIALE 1.1. Notiunea de spatiu vectorial 1.2. Vectori liniar independenti si liniar dependenti ; baza si dimensiune 1.3. Schimbarea coordonatelor unui vector la schimbarea bazelor 1.4. Tema substitutiei 1.5. Spatii vectoriale izomorfe 1.6. Subspatii liniare 1.7. Suma de subspatii liniare Capitolul 2 FUNCTIONALE LINIARE 2.1. Notiunea de functionala liniara 2.2. Matricea unei functionale liniare 2.3. Schimbarea matricei unei functionale liniare la schimbarea bazelor 2.4. Dualul algebric al unui spatiu vectorial 2.5. Functionale biliniare 2.6. Matricea unei functionale biliniare 2.7. Schimbarea matricei unei functionale biliniare la schimbarea bazelor 2.7. Schimbarea matricei unei functionale biliniare la schimbarea bazelor Capitolul 3 FUNCTIONALE PATRATICE 3.1. Notiunea de functionala patratica 3.2. Metoda Gauss pentru determinarea formei canonice a unei functionale patratice si determinarea bazei 3.3. Metoda Jacobi pentru determinarea formei canonice a functionalei patratice 3.4. Legea inertiei PARTEA a II-a: ANALIZA MATEMATICA Capitolul 4 COMPLEMENTE DE TEORIA SIRURILOR SI SERIILOR NUMERICE 4.1. Notiuni introductive 4.2. Sir fundamental 4.3. Puncte limita ale unui sir 4.4. Serii de numere reale 4.5. Serii cu termeni pozitivi 4.6. Serii alternate 4.7. Serii absolut convergente 4.8. Siruri de functii 4.9. Serii de functii 4.10 Serii de puteri 4.11. Serii tazlor si serii maclaurin Capitolul 5 FUNCTII REALE DE MAI MULTE VARIABILE REALE 5.1. Multimi si puncte din Rn 5.2. Functii vectoriale de variabila reala vectoriala. Continuitate partiala 5.3. Derivata partiala a unei functii 5.4. Derivate partiale de ordin superior 5.5. Functii diferentiabile 5.6. Diferentiala unei functii
1 of 3
04.12.2011 10:12
Biblioteca digitala - detalii carte
http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=21...
5.7. Formula lui Taylor pentru functii de mai multe variabile 5.8. Extremele functiilor de mai multe variabile 5.9. Metoda celor mai mici patrate Capitolul 6 CALCUL INTEGRAL 6.1. Extensii ale notiunii de integrala 6.2. Integrale cu limite infinite 6.3. Integrale in care functia f este nemarginita intr-un punct al intervalului de integrare 6.4. Integrale euleriene PARTEA a III-a: PROBABILITATI STATISTICA MATEMATICA Capitolul 7 CAMP DE EVENIMENTE. CAMP DE PROBABILITATE 7.1. Notiuni fundamentale : evenimente ; probabilitatea de producere a evenimentelor 7.2. Operatii cu evenimente 7.3. Conceptul de probabilitate 7.4. Probabilitati conditionate 7.5. Formule de calcul ale probabilitatilor in cazul operatiilor cu evenimente 7.6. Formula probabilitatilor totale 7.7. Formula lui Bayes 7.8. Scheme probabilistice clasice Capitolul 8 VARIABILE ALEATOARE 8.1. Variabile aleatoare discrete. Operatii cu variabile aleatoare discrete; variabile aleatoare independente 8.2. Variabile aleatoare continue Capitolul 9 CARACTERISTICI NUMERICE ALE VARIABILELOR ALEATOARE 9.1. Media; definitie, proprietati 9.2. Dispersia; definitie, proprietati 9.3. Abaterea medie patratica 9.4. Momente ale variabilei aleatoare X 9.5. Functia generatoare de momente ale unei variabile aleatoare 9.6. Functia caracteristica a unei variabile aleatoare 9.7. Normarea (reducerea) unei variabile aleatoare X 9.8. Valoarea mediana 9.9. Modul (valoarea cea mai probabila) 9.10. Covarianta (corelatia) 9.11. Coeficientul de corelatie 9.12. Caracteristici ale formei de repartitie. Simetrie si asimetrie Capitolul 10 REPARTITII CLASICE 10.1. Repartitii discrete Repartitia binomiala Repartitia hipergeometrica Repartitia uniforma discreta Repartitia Poisson 10.2. Repartitii continue Repartitia continua uniforma Repartitia exponentiala negativa Repartitia normala Repartitia Gamma Repartitia Beta Repartitia Repartitia Student Capitolul 11 TIPURI DE CONVERGENTA.LEGILE NUMERELOR MARI.TEOREME LIMITA CENTRALA 11.1. Inegalitatea lui Cebasev 11.2. Tipuri de convergenta 11.3. Legi ale numerelor mari Teorema lui Cebasev Teorema lui Bernoulli Teorema lui Poisson Teorema limita centrala Capitolul 12 STATISTICA MATEMATICA
2 of 3
04.12.2011 10:12
Biblioteca digitala - detalii carte
http://www.biblioteca-digitala.ase.ro/biblioteca/carte2.asp?id=21...
12.1. Notiuni de teoria selectiei si a estimatiei 12.2. Repartitii de selectie 12.3. Repartitia mediei de selectie pentru o selectie dintr-o populatie normala Legatura cu variabila aleatoare cu n grade de libertate 12.4. Repartitia dispersiei de selectie pentru o selectie dintr-o populatie normala 12.5. Estimatie punctuala Estimator; estimator consistent Estimator absolut corect; estimator corect Estimator de maxima verosimilitate 12.6. Estimarea prin intervale de incredere Intervale de incredere pentru parametrii repartitiei normale 12.7. Estimarea parametrilor unei variabile aleatoare prin metoda momentelor 12.8. Verificarea ipotezei cu privire la legea de repartitie a unei variabile aleatoare PARTEA a IV-a: MATEMATICI FINANCIARE Capitolul 13 MATEMATICI FINANCIARE 13.1 Dobanda simpla Elementele dobanzii simple Operatiuni echivalente in regim de dobanda simpla Procent mediu de dispunere 13.2. Dobanda compusa Stabilirea formulei dobanzii compuse Procent normal si procent real (efectiv) 13.3. Dobanda unitara instantanee 13.4. Echivalenta in regim de dobanda compusa 13.5. Plasament cu dobanda simpla sau compusa Capitolul 14 PLATI ESALONATE (RENTE) 14.1. Anuitati constante posticipate 14.2. Anuitati constante anticipate Capitolul 15 RAMBURSAREA IMPRUMUTURILOR 15.1. Amortizarea unui imprumut prin anuitati constante posticipate 15.2. Suma rambursata dupa plata a p anuitati 15.3. Legea urmata de diferente succesive a dobanzilor in cazul anuitatilor constante 15.4. Imprumuturi cu anuitati constante si dobanda platita la inceputul anului 15.5. Aplicatie PARTEA a V-a : MATEMATICI ACTUARIALE Capitolul 16 MATEMATICI ACTUARIALE 16.1. Teoria mortalitatii 16.2. Functiile biometrice 16.3. Viata probabila
3 of 3
04.12.2011 10:12
CAPITOLUL 1 SPAŢII VECTORIALE 1.1. Noţiunea de spaţiu vectorial Fie V o mulţime nevidă. Fie (K,+,·) un corp în raport cu operaţiile “+” şi “.” Elementele corpului K le vom numi scalari sau numere. , Pe mulţimea V introducem legea : ϕ :V ×V →V
ϕ ( x, y ) = x ⊕ y care este o lege de compoziţie internă pe V, iar pe corpul K introducem legea de compoziţie externă: ψ : K ×V →V , ψ (α , x ) = α ⊗ x . DEFINIŢIA 1.1.1. Mulţimea nevidă V peste care s-au introdus două operaţii : ϕ ( x, y ) = x ⊕ y şi ψ (α , x ) = α ⊗ x prima, internă pe V, cea de-a doua, externă cu valori din K, se numeşte spaţiu vectorial (liniar) peste corpul K, dacă sunt satisfăcute proprietăţile: Ø (V ,⊕ ) formează un grup abelian, adică adunarea este asociativă, are element neutru θ, are element simetric, şi este comutativă. Ø 1) 1 ⊗ x = x , oricare ar fi elementul x din V. 2) (α + β ) ⊗ x = (α ⊗ x ) + ( β ⊗ x ) , oricare ar fi x şi y din V, α şi β din K. 3) (α ⋅ β ) ⊗ x = α ⋅ ( β ⊗ x) , oricare ar fi x şi y din V, α şi β din K. 4) α ⊗ ( x ⊕ y ) = (α ⊗ x ) ⊕ (α ⊗ y ) , oricare ar fi x şi y din V, α şi β din K. EXEMPLUL 1: Fie V = Rn spaţiul real n dimensional , iar K = R. Rn = R x R={( x1 , x2 ,…, xn )T | xi aparţinând lui R, i = 1, … ,n }.
æ x1 ö ç Dacă x aparţine lui Rn , atunci vom nota : x = ç x2 = ( x , x ,Κ , x )T n 1 2 çΜ çç è xn æ y1 ö ç Fie y din spaţiul Rn , y = ç y 2 . çΜ çç è yn
æ x1 + y 1 ö æ αx1 ö ÷ ç ç x + y2 ÷ αx Introducem notaţiile: x ⊕ y = ç 2 şi α ⊗ x = ç 2 . ÷ çΜ çΜ ÷÷ çç çç è xn + yn ø è αx n Arătăm că ( Rn , R ) este un spaţiu vectorial real , n-dimensional. Ø 1) asociativitatea rezultă din asociativitatea numerelor reale æ 0ö ç 2) elementul neutru este: θ = ç 0 . çΜ çç è0 æ − x1 ö ç 3) elementul simetric este : − x = ç − x 2 çΜ çç è − xn
4)
Ø
comutativitatea rezultă din comutativitatea adunării numerelor reale
1)
æ1 ⋅ x1 ö ç ç1 ⋅ x2 =x 1⊗ x = ç Μ çç è1 ⋅ xn
2)
æ αx1 + βx1 ö ç ç αx2 + βx2 (α + β ) ⊗ x = ç = (α ⊗ x ) ⊕ ( β ⊗ x ) Μ çç è αxn + βxn
æαx1 ö ç αx 3) α ⊗ x = ç 2 çΜ çç èαxn
æ βx1 ö ç ç βx deci: β⊗x=ç 2 Μ çç è βx n
æαx1 + βx1 ö ç çαx + βx2 (α ⊗ x) ⊕ ( β ⊗ x) = ç 2 Μ çç èαxn + βxn DEFINIŢIA 1.1.2. Elementele unui spaţiu vectorial le vom numi vectori. DEFINIŢIA 1.1.3. Elementele corpului K le vom numi scalari. EXEMPLUL 2 : Fie Pn [x] mulţinea tuturor polinoamelor de gradul n cu coeficienţi reali. Dacă p aparţine mulţimii Pn [x] , atunci p(x) = a0 + a1 x1 + … + an xn , unde a este diferit de zero. Dacă q aparţine mulţimii Pn [x] , atunci q(x) = b0 + b1 x1 + … + bn xn , unde b este diferit de zero. n ( p ⊕ q)( x ) = a 0 + b0 + (a1 + b1 ) x + Κ + (a n + bn ) x
(α ⊗ p )( x ) = αa 0 + αa1 x1 + Κ + αa n x n
Din aceste două relaţii observăm că mulţimea Pn [x] nu formează un spaţiu vectorial deoarece, dacă avem an = -bn , în urma adunării rezultă un polinom care nu este de gradul n . Dacă notăm cu Pn [x] mulţimea polinoamelor de grad mai mic sau egal cu n şi introducem aceste două legi de compoziţie, atunci mulţimea dată formează un spaţiu vectorial. PROPOZIŢIA 1.1.1. Fie (V,K) un spaţiu vectorial. Atunci elementul neutru θ este unic. DEMONSTRAŢIE: Din propoziţie ştim că există elementul neutru θ, oricare ar fi vectorul x din mulţimea V. Aceasta înseamnă că θ+x = x+θ = x. Presupunem că există două elemente neutre θ1 şi θ2. Atunci fiecare din cele două elemente neutre verifică relaţia de mai sus: θ1+x = x+θ1 = x pentru orice x aparţinând mulţimii V. θ2+x = x+θ2 = x pentru orice x aparţinând mulţimii V. Dacă aceste relaţii sunt adevarate pentru orice x aparţinând mulţimii V, atunci sunt adevarate şi pentru θ care aparţine mulţimii V. Astfel, putem scrie: pentru x = θ2 , θ1+θ2 = θ2+θ1 = θ2 pentru x = θ1 , θ2+θ1 = θ1+θ2 = θ1 Din cele două relaţii observăm că θ1 = θ2 , deci elementul neutru este unic. 1.2. Vectori liniar independenţi şi liniar dependenţi; bază şi dimensiune Fie (V,K) un spaţiu vectorial. Fie x1, x2, … , xn vectori care aparţin mulţimii V. Fie λ1, λ2,…, λn scalari care aparţin corpului K.
DEFINIŢIA 1.2.1. n
λ1 x1 + λ2 x 2 + Κ + λn x n = å λi x i
Relaţia:
se numeşte
i =1
combinaţie liniară a vectorilor x1 , x2 , …, xn cu scalari din K. DEFINIŢIA 1.2.2. Vectorii x1, x2, …, xn care aparţin mulţimii V se numesc liniar independenţi atunci când relaţia : (1 ) λ1 x1 + λ2 x2 + …+ λn xn = θ este adevărată dacă şi numai dacă toţi scalarii sunt nuli: λ1 = λ2 = … = λn = 0. DEFINIŢIA 1.2.3. Dacă relaţia (1) are loc fără ca toţi scalarii λ1 , λ2 , … , λn să fie nuli,vectorii x1 , x2 , … , xn se numesc liniar dependenţi. EXEMPLUL 1: Fie ( R3 , R ) un spaţiu vectorial , fie x1 , x2 , x3 vectori din æ1 ö ç x1 = ç1 , ç0 è
acest spaţiu vectorial:
æ1 ö æ 0ö ç ç , x2 = ç 0 x3 = ç1 . ç1 ç1 è è
Să se arate că aceşti vectori sunt liniar independenţi. λ1 x1 + λ2 x2 + …+ λn xn = θ
æ1 ö æ1 ö æ0ö æ0ö ç ÷ ç ÷ ç ÷ ç ÷ λ1 ç 1 ÷ + λ 2 ç 0 ÷ + λ 3 ç 1 ÷ = ç 0 ÷ ç0÷ ç1 ÷ ç1 ÷ ç 0 ÷ è ø è ø è ø è ø ì λ1 + λ 2 = 0 ï í λ1 + λ 3 = 0 ; ïλ + λ = 0 3 î 2
1
1
0
1
1
0
1 = 0
0
1
1
0
1
0
− 1 1 = -2 1
1
Întrucât determinantul este diferit de zero, soluţia sistemului este λ1 = λ2 = λ3 = 0 , deci vectorii x1 , x2 , x3 sunt liniar independenţi.
PROPOZIŢIA 1.2.1. Fie (V,K) un spaţiu vectorial. Vectorii x1 , x2 , … , xn sunt liniar dependenţi dacă şi numai dacă cel puţin un vector este o combinaţie liniară a celorlalţi vectori. DEMONSTRAŢIE: 1* Presupunem că x1 , x2 , … , xk-1 , xk , xk+1 , …, xn sunt liniar dependenţi şi vom demonstra că cel puţin un vector este o combinaţie liniară a celorlalţi. Vectorii fiind liniar independenţi, înseamnă că relaţia : λ1 x1 + λ2 x2 + … + λk-1 xk-1 + λk xk + λk+1 xk+1 + … + λk xk = θ este adevărată fără ca toţi scalarii să fie nuli. Presupunem că λ k este diferit de zero. Atunci: n æλ ö λ λ λ λ λi xk = −çç 1 x1 + 2 x2 + Κ + k −1 xk −1 + k +1 xk + Κ + n xn = − xi λk λk λk λk i =1 λk è λk i ≠k
2* Presupunem că cel puţin un vector este o combinaţie liniară a celorlalţi vectori şi vom demonstra că vectorii sunt liniar dependenţi. xk = α1 x1 + α2 x2 + … + αk-1 xk-1 + αk xk + αk+1 xk+1 + … + αn xn α1 x1 + α2 x2 + … + αk-1 xk-1 + (-1) xk + αk+1 xk+1 + … + αn xn = θ
Întrucât (-1) este un scalar diferit de zero, ultima relaţie demonstrează că vectorii sunt liniar dependenţi. DEFINIŢIA 1.2.4. Vectorii x1 , x2 , … , xn care aparţin mulţimii V formează un sistem de generatori ai spaţiului V, dacă oricare ar fi vectorul x din mulţimea V, există scalarii λ1 , λ2 , … , λn aparţinând corpului K astfel încât să existe relaţia: x = λ1 x1 + λ2 x2 + … + λn xn (3) Altfel spus, x1 , x2, …, xn formează un sistem de generatori dacă oricare ar fi vectorul x din mulţimea V, el se poate scrie ca o combinaţie liniară a vectorilor x1 , x2 , … , xn .
DEFINIŢIA 1.2.5. Fie (V,K) un spaţiu vectorial. Vectorii x1 , x2 , … , xn formează o bază a spaţiului V dacă sunt îndeplinite urmatoarele condiţii: 1) vectorii x1 , x2 , … , xn formează un sistem de generatori. 2) vectorii x1 , x2 , … , xn sunt liniar independenţi. EXEMPLUL 2 : Fie ( R3 , R ) un spaţiu vectorial , fie x1 , x2 , x3 vectori din acest spaţiu vectorial:
æ1 ö æ1 ö æ0ö ç ç ç , , x1 = ç1 x2 = ç 0 x 3 = ç1 . ç0 ç1 ç1 è è è
În exemplul anterior am arătat că aceşti vectori sunt liniar independenţi. În continuare vom arăta că formează un sistem de generatori. Ştim că oricare ar fi vectorul x din R3, există scalarii λ1 , λ2 , λ3 astfel încât : æ x1 ö ç ÷ x = λ1 x1 + λ2 x2 + λ3 x3 , x = ç x 2 ÷ çx ÷ è 3ø æ x1 ö æ1 ö æ1 ö æ0ö ç ÷ ç ÷ ç ÷ ç ÷ λ1 ç1 ÷ + λ2 ç 0 ÷ + λ3 ç1 ÷ = x = ç x 2 ÷ deci sistemul: ç0÷ ç1 ÷ ç1 ÷ çx ÷ è ø è ø è ø è 3ø
ìλ1 + λ2 = x1 íλ1 + λ3 = x 2
îλ2 + λ3 = x 3
este un sistem liniar, neomogen. Vectorii x1 , x2 , x3 formează un sistem de generatori deoarece sistemul de mai sus este compatibil determinat. Astfel am demonstrat că vectorii x1 , x2 , x3 formează o bază în R3 . DEFINIŢIA 1.2.6. Dimensiunea spaţiului vectorial V este egală cu numărul vectorilor unei baze.
PROPOZIŢIA 1.2.2. Fie V un spaţiu vectorial peste corpul K, dimensiunea spaţiului V fiind n. Fie B = { x1 , x2 , … , xn } o bază în spaţiul V. Atunci, oricare ar fi vectorul x din V el se scrie în mod unic ca o combinaţie liniară de vectorii bazei. DEMONSTRAŢIE: Din ipoteză ştim că B = { x1 , x2 , … , xn } este o bază. Aceasta înseamnă că vectorii x1 , x2 , … , xn formează un sistem de generatori şi sunt liniar independenţi. Întrucât vectorii x1 , x2 , … , xn formează un sistem de generatori , înseamnă că este verificată relaţia: (1) x = λ1 x1 + λ2 x2 + … + λn xn Presupunem că x se scrie şi sub forma: x = β1x1 + β2x2 + … + βnxn (2) Înmulţind relaţia (2) cu -1 şi adunând-o cu relaţia (1) vom obţine: x + (-x) = ( α1 – β1) x1 + ( α2 – β2 ) x2 + … + ( αn – βn) xn = θ Din această relaţie şi din faptul că vectorii subt liniar independenţi, rezultă că: α1 – β1 = 0, α2 – β2 = 0, … , αn – βn = 0 , adică α1= β1, α2 = β2, … , α3 = β3. Spaţiul V este un spaţiu vectorial de dimensiune n , iar
B = {x 1 , x 2 ,..., x n } este o bază în V. Atunci, oricare ar fi vectorul x
din V, el se scrie în mod unic sub forma unei combinaţii liniare de vectorii bazei. Deci x se scrie sub forma: x = α1 x1 + α2 x2 + … + αn xn . DEFINIŢIA 1.2.7. Scalarii α1 , α2 , … , αn se numesc coordonatele vectorului x în baza B.
æ α1 ö ç çα xB = ç 2 Μ çç èα n
EXEMPLUL 1: Fie P2 [x] spaţiul vectorial al polinoamelor de grad mai mic sau egal cu 2, cu coeficienţi reali. Să se cerceteze dacă vectorii B1 = { 1 + x , 1 + x2 , x + x2 } şi B2 = { 1 + 2x + 2x2 } formează sau nu o bază. (i) Oricare ar fi polinomul p din spaţiul vectorial P2 [x], p(x) = a0 + a1x + +a2 x2, unde a0, a1, a2 sunt numere reale, există λ1 , λ2 , λ3 astfel încât p = λ1 p1 + λ2 p2 +λ3 p3 . λ1 ( 1+x) + λ2 (1 + x2 ) + λ3 ( x + x2) = a0 + a1 x + a2 x2 ( λ1 + λ2) + ( λ1 + λ3) x + ( λ2 + λ3) x2 = a0 + a1 x + a2 x2 Din aceste două relaţii obţinem un sistem compatibil determinat: ì λ1 + λ 2 = a 0 í λ1 + λ 3 = a 1
îλ 2 + λ 3 = a 2
(ii) Vectorii sunt liniar independenţi : θ = 0 + 0x + 0x2 ì λ1 + λ 2 = 0 í λ1 + λ 3 = 0
îλ 2 + λ3 = 0
1.3. Schimbarea coordonatelor unui vector la schimbarea bazelor
Fie (V,K) un spaţiu vectorial de dimensiune n. Fie E = { e1 , e2 , … , en } o bază în spaţiul vectorial V.
Fie x un vector din V , xE = α1 e1 + α2 e2 + … + αn en , xE = ( α1 , α2 , … , αn )T . Fie G = { g1 , g2 , … , gn } o altă bază în spaţiul vectorial V. xG = β1 g1 + β2 g2 + … + βn gn , xG = ( β1 , β2 , … , βn )T Deoarece E şi G formează baze în spaţiul V, înseamnă că vectorii ei şi gi aparţin spaţiului V oricare ar fi indicele “i” cu valori în mulţimea { 1, … , n }. g1 aparţine lui V, atunci g1 = c11 e1 + c12 e2 + … + c1n en g2 aparţine lui V, atunci g2 = c21 e1 + c22 e2 + … + c2n en …………………………………………………………………………………………..
gn aparţine lui V, atunci gn = cn1 e1 + cn2 e2 + … + cnn en Vom nota cu CEG = (cij ) , unde cij aparţine corpului K, iar indicii i şi j aparţin mulţimii { 1 , … , n }. DEFINIŢIA 1.3.1. Matricea CEG = (cij ) se numeşte matricea de trecere de la baza E la baza G. OBSERVAŢIE : Determinantul matricei CEG este diferit de zero, ceea ce înseamnă că matricea este nesingulară. PROPOZIŢIA 1.3.1. Fie (V,K ) un spaţiu vectorial de dimensiune n . Fie E şi G două baze în spaţiul V, unde E={ e1 , e2 , … , en } , G = { g1 , g2 , … , gn } . Fie vectorul x din V, xE = ( α1 , α2 , … , αn )T şi xG = ( β1 , β2 , … , βn )T . xE = α1 e1 + α2 e2 + … + αn en xG = β1 g1 + β2 g2 + … + βn gn Atunci este adevărată relaţia: XG = ( CT EG )-1 XE DEMONSTRAŢIE: gi = ci1 e1 + ci2 e2 + … + cin en
xG = β1 g1 + β2 g2 + … + βn gn = β1 (c11 e1 + c12 e2 + … + c1n en ) + + β2 (c21 e1 + c22 e2 + … + c2n en ) + +………………………………………+ + βn (cn1 e1 + cn2 e2 + … + cnn en ) = ( β1 c11 + β2 c21 + … + βn cn1 ) e1 + ( β1 c12 + β2 c22 + … + βn cn2 ) e2 + … + ( β1 c1n + β2 c2n + … + βn cnn ) en Deoarece scrierea unui vector într-o bază este unică, vom obţine: ì β 1 c 11 + β 2 c 21 + Κ + β n c n 1 = α 1 ïβ c + β c + Κ + β c = α ï 1 12 2 22 n n2 2 í Μ ï ïî β 1 c 1n + β 2 c 2 n + Κ + β n c nn = α n
Acest sistem, scris matriceal, are forma : CT EG XG = XE ( 2’ ) Determinantul matricei CEG este diferit de zero, deci şi determinantul matricei CTEG este diferit de zero, astfel încât există ( CT EG )-1 . Din ( 2’ ) obţinem: ( CT EG )-1 CT EG XG = ( CT EG )-1 XE , adică , XG = ( CT EG )-1 XE 1.4. Lema substituţiei
Fie (V,K) un spaţiu vectorial de dimensiune n . Fie E = { e1 , e2 , … , en } = { e1 , e2, … , ei-1 , ei , ei+1 , … , en } o bază în spaţiul V. Fie u un vector oarecare din V, uE = ( λ1 , λ2 , … , λi-1 , λi , λi+1 , … , λn )T . uE = λ1 e1 + λ2 e2 + … + λi-1 ei-1 + λi ei + λi+1 ei+1 + … + λn en Lema substituţiei răspunde la următoarele întrebări: 1) În ce condiţii mulţimea E* = { e1 , e2 , … , ei-1 , u , ei+1 , … , en } formează o bază în spaţiul V ? 2) Fiind dat un vector x din spaţiul V , xE = ( α1 , α2 , … , αi-1 , αi , αi+1 , … , αn )T , care sunt coordonatele vectorului în baza E* ? xE * = ( α *1 , α *2 , … , α *i-1 , α *i , α *i+1 , … , α *n )T Vom demonstra că:
mulţimea E* = { e1 , e2 , … , ei-1 , u , ei+1 , … , en } formează o bază şi că dacă vectorul x aparţine spaţiului V, xE = ( α1 , α2 , … , αi-1 , αi , αi+1 , … , αn )T şi dacă xE * = ( α *1 , α *2 , … , α *i-1 , α *i , α *i+1 , … , α *n )T, atunci: α λ − αiλ j α ( 1 ) αi* = i ; ( 2 ) α *j = j i unde j ia valori din λi λi mulţimea { 1 , … , n }, j fiind diferit de i . DEMONSTRAŢIE: 1) Trebuie să arătăm că vectorii { e1 , e2 , … , ei-1 , u , ei+1 , … , en } sunt liniar independenţi . µ1 e1 + µ2 e2 + … + µi-1 ei-1 + µi u + µi+1 ei+1 + … + µn en = θ µ1 e1 + µ2 e2 + … + µi-1 ei-1 + µi ( λ1 e1 + λ2 e2 + … + λi-1 ei-1 + λi ei + λi+1 ei+1 + …+λnen)+ +µi+1 ei+1 + … + µn en = θ ( µ1 +µi λ1 ) e1 + … + ( µi-1 + µi λi-1 ) ei-1 + µi λi ei + ( µi λi+1 + µi+1 ) ei+1 + … + ( µi λn + + µn ) en = θ Dar vectorii { e1 , e2 , … , en } formează o bază deci sunt liniar independenţi. Astfel, obţinem un sistem liniar şi omogen de n ecuaţii şi n necunoscute:
ì µ 1 + µ i λ1 = 0 ïΜ ï ïµ i −1 + µ i λi −1 = 0 ï í µ i λi = 0 ïµ λ + µ = 0 i +1 ï i i +1 ïΜ ïµ λ + µ = 0 n î i n
1 Κ Κ 0 λ1 0 Κ Κ 0 ΜΚ Κ Κ Κ Κ Κ Κ Μ ;
0 Κ Κ 1 λi−1 0 Κ Κ 0 A = 0 Κ Κ 0 λi 1 Κ Κ 0 0 Κ Κ 0 λi+1 1 Κ Κ 0 ΜΚ Κ Κ Κ Κ Κ Κ Μ 0 Κ Κ 0 λn 0 Κ Κ 0
Determinantul sistemului este: detA = (-1)i+1 λi | Ii-1 | , deci detA = λi şi este diferit de zero. Înseamnă că sistemul (3) are numai soluţia banală. Deci vectorii { e1, e2, … , ei-1, u , ei+1, … , en } sunt liniar independenţi .
2) Trebuie să arătăm că { e1, e2, … , ei-1, u , ei+1, … , en } formează un sistem de generatori. Oricare ar fi vectorul x din spaţiul V, există scalarii α *1 , α 2 , … , α *i-1 , α *i , α *i+1 , … , α *n astfel încât : *
xE = λ*1 e1 + λ*2 e2 + … + λ*i-1 ei-1 + λ*i u + λ*i+1 ei+1 + … + λ*n en xE =λ*1e1 +λ*2 e2+…+λ*i-1 ei-1 +λ*I (λ1 e1 + λ2 e2 + … + λi-1 ei-1 + λi ei+λi+1 ei+1 +…+λnen)+λ*i+1 ei+1+…+λ*n en=(α*1+α*i λ1)e1+…+(α*i-1+ + α*i λi-1 )ei-1 + α*i λi ei +(α*i+1 + α*i λi+1)ei+1 + (α*n + α*i λn) en
Ştim că scrierea unui vector într-o bază este unică. Vom obţine sistemul: ìα 1* + α i* λ1 = α 1 ï ïΚ Κ Κ Κ Κ Κ Κ ïα * + α * λ = α i i −1 i −1 ïï i*−1 íα i λi = α i ïα * + α * λ = α i i +1 i +1 ï i +1 ïΚ Κ Κ Κ Κ Κ Κ ï * * ïîα n + α i λ n = α n
rezultă că αi* =
αi λi
Celelalte ecuaţii le putem scrie sub forma:
α*j + αi*λ j = α j α *j = α j − α i* λ j = α j − α
* j
=
αiλ j λi
de aici rezultă că:
α j λ i − α i λ j , pentru oricare j din mulţimea { 1, … , n } , j λi
fiind diferit de i. Formulele ( 1 ) şi ( 2 ) se numesc formulele de pivotare Gauss- Jordan.
E e1 · · · ei-1 ei ei+1 · · · ej · · en
U λ1 · · · λi-1 λi λi+1 · · · λj · · λn
X α1 · · · αi-1 αi αi+1 · · · αj · · αn
E* e1 · · · ei-1 u ei+1 · · · ej · · e1
X α*1 · · · α*i-1 α*i α*i+1 · · · α*j · · α*n
( 1 ) Se împarte linia pivot la pivot ; ( 2 ) Se aplică Gauss-Jordan. 1.5. Spaţii vectoriale izomorfe
Fie (X,K) şi (Y,K) două spaţii vectoriale peste acelaşi corp de sclari K. DEFINIŢA 1.5.1. Spaţiile vectoriale X şi Y se numesc K izomorfe, dacă există φ : X→ Y cu proprietăţile următoare: 1) φ este bijectivă 2) oricare ar fi x1 şi x2 doi vectori din spaţiul X şi oricare ar fi α1 şi α2 scalari din corpul K, atunci : φ ( α1 x1 + α2 x2 ) = α1 φ ( x1 ) + α2 φ ( x2 ) . Funcţia φ cu proprietatea 2) se numeşte aplicaţie sau funcţie liniară. TEOREMA 1.5.1. Dacă X şi Y sunt două spaţii vectoriale definite pe acelaşi corp de scalari K, dimensiunea celor două spaţii fiind n finit, atunci X şi Y sunt K-izomorfe.
Aceasta este teorema de izomorfism a spaţiilor vectoriale finit dimensionale. DEMONSTRAŢIE: Fie E = { e1 , e2 , … , en } o bază în spaţiul X . Fie G = { g1 , g2 , … , gn } o bază în spaţiul Y. Oricare ar fi vectorul x din spaţiul X, putem scrie: x = α1 e1 + α2 e2 + …+ αn en =
n
åα e i =1
Defininim funcţia φ : X → Y, n
n
i =1
i =1
i i
.
φ ( x ) = y
adică
ϕ ( å α i ei ) = å α i g i
Pentru a arăta că φ este izomorfism, demonstrăm că: 1) funcţia este bijectivă: Ø injectivitate : oricare ar fi x1 şi x2, x1 diferit de x2 , atunci : φ ( x1 ) este diferit de φ ( x2 ) . Fie x1 = α1 e1 + α2 e2 + … + αk ek + … + αn en . Fie x2 = β1 e1 + β2 e2 + … + βk ek + … + βn en , unde αi şi βi aparţin corpului K, oricare ar fi indicele “i” din mulţimea { 1, … , k, ,… , n } . Întrucât x1 este diferit de x2 , există cel puţin un indice “k” din mulţimea { 1, … , n } astfel încât αk este diferit de βk . φ ( x1 ) = α1 e1 + α2 e2 + … + αk ek + … + αn en φ ( x2 ) = β 1 e1 + β 2 e2 + … + β k ek + … + βn en
Deoarece există cel puţin un indice “k” din mulţimea { 1, … , n } astfel încât αk este diferit de βk , atunci φ ( x1 ) este diferit de φ ( x2 ). Ø surjectivitate: oricare ar fi y din Y, există x din X astfel încât : φ ( x ) = y. Oricare ar fi y din Y, există scalarii α1 , α2 , … , αn din corpul K astfel încât să existe relaţia: y = α1 g1 + α2 g2 + … + αn gn . Considerăm un x care aparţine lui X, x = α1 e1 + α2 e2 + … + αn en . Din definiţia funcţiei φ rezultă că φ ( x ) = y.
2) liniaritatea funcţiei φ :
Oricare ar fi x1 şi x2 din spaţiul X şi oricare ar fi a şi b din corpul K, φ ( a x 1 + b x2 ) = a φ ( x 1 ) + b φ ( x 2 ) n
n
i =1
i =1
x 1 = å α i e i , x 2 = å β i ei , unde αi , βi aparţin corpului K, iar i
aparţine mulţimii { 1 , … , n} . n é n ù é n ù n ϕ (ax 1 + bx 2 ) = ϕ ê a å α i e i + b å β i e i ú = ϕ ê å (aα i + bβ i )e i ú = å (aα i + bβ i )g i = i =1 ë i =1 û ë i =1 û i =1
=
n
å aα i =1
i
gi +
n
å bβ
i
i =1
n
n
i =1
i =1
g i = a å α i g i + b å β i g i = a ϕ (x 1 ) + b ϕ (x 2 )
1.6. Subspaţii liniare
Fie (X,K) un spaţiu liniar vectorial; fie X0 un spatiu inclus în spaţiul X, X0 fiind diferit de mulţimea vidă. DEFINIŢIA 1.6.1. Mulţimea X0 este un subspaţiu liniar al spaţiului X dacă: 1) oricare ar fi x, y doi vectori din X0 , atunci şi x + y aparţine lui X0 . 2) oricare ar fi scalarul α din corpul K şi oricare ar fi vectorul x din X0 şi α x aparţine lui X0 . PROPOZIŢIA 1.6.1. Dacă Xi ( i aparţine unei familii de indici ) este o familie de subspaţii liniare a spaţiului liniar ( X,K ) , atunci şi mulţimea X0 formată din intersecţia subspaţiilor Xi este un subspaţiu liniar al spaţiului X. DEMONSTRAŢIE: 1) oricare ar fi vectorii x şi y din spaţiul X0 , X0 =
Ι
X i , unde x
i∈I
aparţine lui Xi şi y aparţine lui Xi , pentru orice i din familia de indici I .
Dar Xi este un subspaţiu liniar al lui X, deci x+y aparţin lui Xi oricare ar fi i din mulţimea I, adică x+y aparţin lui X0 . 2) Oricare ar fi vectorul x din spaţiul X0 , x aparţine subspaţiului Xi al spaţiului X0 . Oricare ar fi scalarul α din corpul K, αx aparţine spaţiului Xi , deci aparţine şi subspaţiului X0. Fie (X,K) un spaţiu liniar. Fie mulţimea A ⊂ X , A ≠ ∅ . DEFINIŢIA 1.6.2. Se numeşte acoperirea liniară a mulţimii A, mulţimea tuturor combinaţiilor liniare de vectori din mulţimea A . Acoperirea liniară se notează cu L(A). p ì ü L(A) = í x | x = å α i a i , a i ∈ A, α i ∈ K , i = 1, Κ , p, p ∈ N * ý i =1 î þ PROPOZIŢIA 1.6.2. Fie (X,K) un spaţiu vectorial. Fie A o mulţime din X, diferită de mulţimea vidă. Atunci acoperirea liniară a lui A este un subspaţiu liniar al spatiului X. DEMONSTRAŢIE: 1) Demonstrăm că oricare ar fi vectorii x şi y din L(A) şi x+y aparţine acoperirii liniare L(A). Dacă x ∈ L(A), atunci : p1
x = åαi ai unde αi este un scalar din K, ai este un vector din i =1
A, i = 1, … , p1 , iar p1 este un număr natural. Dacă y ∈ L(A), atunci : p2
y = å β j a j unde βj este un scalar din K, aj este un vector i =1
din A, j = 1, … , p2 , iar p2 este un număr natural.
x+ y=
p1
å α iai + i =1
p2
åβ i =1
j
a j deci (x+y) este o combimaţie
liniară de vectori din mulţimea A, ceea ce înseamnă că (x+y) aparţine acoperirii liniare a mulţimii A. 2) Demonstrăm că oricare ar fi vectorul x din L(A) şi αx aparţine acoperirii liniare L(A), unde α este un scalar din corpul K. Dacă x ∈ L(A), atunci : p1
αx = å (αα i )a i oricare ar fi α din corpul K. i =1
Deoarece α i aparţine corpului K şi αα i aparţine corpului K. Rezultă astfel că αx aparţine acoperirii liniare L(A) . PROPOZIŢIA 1.6.3. Fie A o mulţime din spaţiul liniar X, A fiind diferită de mulţimea vidă. Acoperirea liniară a unei mulţimi conţine mulţimea respectivă. DEMONSTRAŢIE: Oricare ar fi elementul a din mulţimea A, el se poate scrie astfel: a =
1
å1* a = 1* a = a
aceasta fiind o combinaţie liniară ce
i =1
aparţine acoperirii liniare L(A) . Fie (X,K) un spaţiu liniar şi fie A o mulţime din acest spaţiu, A fiind diferită de mulţimea vidă. DEFINIŢIA 1.6.2. Se numeşte subspaţiu liniar generat de mulţimea A, cel mai mic subspaţiu liniar al spaţiului X care conţine mulţimea A. Subspaţiul liniar generat de mulţimea este un subspaţiu al spaţiului X care conţine pe A şi este cel mai mic subspaţiu care are acestă proprietate. Îl vom nota cu Sp(A).
OBSERVAŢIE: Dacă XA = { Xi | Xi fiind subspaţii ale lui X, A ⊂ X, i = I } , atunci mulţimea XA este diferită de mulţimea vidă. PROPOZIŢIA 1.6.4. Fie (X,K) un spaţiu liniar şi fie A o mulţime inclusă în X, A fiind diferită de mulţimea vidă. Atunci L(A) = Sp(A) . DEMONSTRAŢIE: 1) Sp ( A) ⊂ L( A) este evidentă deoarece L(A) este un subspaţiu liniar al lui X care conţine mulţimea A, iar Sp(A) este cel mai mic subspaţiu cu această proprietate. 2) L( A) ⊂ Sp ( A) p
Fie x un vector din L(A) , x = å α k a k
, αk aparţinând
k =1
corpului K şi ak aparţinând mulţimii A , k = 1, … , p . A ⊂ X i , iar Xi este un subspaţiu , deci ak aparţine subspaţiului Xi , k = 1, … ,p . p
x = åα kak
aparţine subspaţiului Xi , oricare ar fi Xi care
k =1
include mulţimea A. Deci
p
x = åα kak k =1
aparţine
Ι
X i = Sp( A) . Astfel
Xi ⊃A
rezultă că L(A) = Sp(A) . PROPOZIŢIA 1.6.5. Fie (X,K) un spaţiu liniar, fie A o mulţime din X, A fiind diferită de mulţimea vidă. Fie B o familie maximală de vectori liliar independenţi conţinută în mulţimea A. Atunci, L(A) = L(B) . OBSERVAŢIE : Fie (X,K) un spaţiu liniar şi fie X0 un subspaţiu liniar al spaţiului X. Atunci elementul neutru θ aparţine subspaţiului X0 . DEMONSTRAŢIE : 1) L( A) ⊂ L( B )
Dacă B este o familie maximală de vectori liniar independenţi din mulţimea A, atunci oricare ar fi elementul a din A, a este o combinaţie liniară de elemente din familia maximală B. Rezultă că oricare ar fi vectorul x aparţinând acoperirii liniare L(A), x este o combinaţie liniară de elemente din B, adică x aparţine acoperirii liniare L(B). Deci L( A) ⊂ L( B ) . 2) L( B ) ⊂ L( A) este evidentă. PROPOZIŢIA 1.6.6. Fie (X,K) un spaţiu liniar a cărui dimensiune este n. Fie X1 şi X2 două subspaţii liniare ale lui X. Dacă dim X1 + dim X2 > dim X , atunci X 1 ∩ X 2 conţine şi alte elemente diferite de θ . DEMONSTRAŢIE: Fie dim X1 = p1 . Fie E = { e1 , … , ep } o bază în X1 . Fie dim X2 = p2 . Fie G = { g1 , … , g2 } o bază în X2 . Dacă x ∈ X1 ∩ X2 , atunci : p1
x = å α i e i dacă x aparţine subspaţiului X1 . i =1
p2
x = å β j g j dacă x aparţine subspaţiului X2 . i =1
p1
å α i ei = i =1
p2
å
j =1
β jg j ⇔
p1
å α i ei + i =1
p2
å (− β )g i =1
j
j
=θ
Dar {e 1 , Κ , e p , g 1 , Κ , g p } este o mulţime care aparţine lui X şi are p1 + p2 elemente. Din ipoteză ştim că p1 + p2 > p deci vectorii {e 1 , Κ , e p , g 1 , Κ , g p } sunt liniar dependenţi. 1
1
2
2
Presupunem că αi = 0 ( i = 1, … , p1 ) . Atunci există scalari βj diferiţi de zero pentru că vectorii sunt liniar dependenţi. Presupunem că βj = 0 (j = 1, … , p2 ) . Atunci există scalari αi diferiţi de zero pentru că vectorii sunt liniar dependenţi. Deci există şi vectori nenuli.
1.7. Sumă de subspaţii liniare
Fie (X,K) un spaţiu liniar . Fie X1 şi X2 două subspaţii liniare ale lui X. DEFINIŢIA 1.7.1. Se numeşte suma subspaţiilor X1 şi X2 mulţimea: S = X1 + X2 unde X1 + X2 = { x | x = x1 + x2 , x1 ∈ X1 , x2 ∈ X2 }. PROPOZIŢIA 1.7.1. Suma a două subspaţii liniare este un subspaţiu liniar. DEMONSTRAŢIE: 1) Oricare ar fi x din S , x = x1 + x2 , x1 ∈ X1 , x2 ∈ X2 Oricare ar fi y din S , y = y1 + y2 , y1 ∈ X1 , y2 ∈ X2 Dacă x1 ∈ X1 şi y1 ∈ X1 , atunci x1 + y1 ∈ X1 . Dacă x2 ∈ X2 şi y2 ∈ X2 , atunci x2 + y2 ∈ X2 . x + y = x1 + x2 + y1 + y2 = x1 + y1 + x2 + y2 ∈ S.
2) Oricare ar fi λ un scalar din corpul K, oricare ar fi vectorul x din S, obţinem: λx = λ(x1 + x2 ) = λx1 + λx2 deci λx ∈ S . OBSERVAŢIE : 1) În general, X 1 ∪ X 2 nu este un subspaţiu liniar 2) S = X1 + X2 ≠ X 1 ∪ X 2 . TEOREMA 1.7.1. ( teorema dimensiunii ) Fie (X,K) un spaţiu vectorial de dimensiune n. Fie X1 un subspaţiu liniar, dim X1 = p1 . Fie X2 un alt subspaţiu al lui X, dim X2 = p2 . Fie D = X1 ∩ X2 , dim D = d . Fie S = X1 + X2 , dim S = s. Atunci : dim X1 + dim X2 = dim D + dim S ⇔ p1 + p2 = d + s . DEMONSTRAŢIE :
Fie { e1 , … , ed } o bază în D. Completăm această bază astfel încât să obţinem nişte baze în X1 şi în X2 . Fie { e1 , … , ed , fd+1 , … , fp1 } o bază în X1 . Fie { e1 , … , ed , gd+1 , … , gp2 } o bază în X2 . Vom arăta că mulţimea BS = { e1 , … , ed , fd+1 , … , fp1 , gd+1 , … , gp2 } formează o bază în S. oricare ar fi x ∈ S, x = x1 + x2 , x1 ∈ X1 , x2 ∈ X2
1)
p1
d
Dacă x1 ∈ X1 , atunci x 1 = å α i e i +
åα
i =1
i = d +1
d
p2
Dacă x2 ∈ X2 , atunci x 2 = å β i e i + i =1
x∈ S , x =
d
å
p1
(α i + β i ) e i +
i =1
å
fi
i
åβ
i = d +1
gi
p2
αi fi +
i = d +1
i
åβ
i
deci x se scrie
gi
i = d +1
ca o combinaţie liniară a vectorilor din BS . Înseamnă că formează un sistem de generatori.
BS
2) arătăm că vectorii din BS sunt liniar independenţi. d
(*) åαi ei + i =1
p1
åβ
j =d +1
j
fj +
p2
åγ
k =d +1
k
p1
å (− β ) f
gk = θ Þ
j
1 44 2 4 43 j = d +1
j
+
p2
d
åα e + åγ g i i
k k
1i=14 44 2 k4=d+41 43
este vector în X1 este vector în X2 deci x ∈ X1 deci x ∈ X2 Din cele scrise mai sus, rezultă că x ∈ D = X1 ∩ X2 , deci γk = 0 (1) , oricare ar fi k = d+1, … , p1 . Din (*) obţinem :
p2
å (− γ k )g k
=
1 44 2 4 43
k = d +1
p1
d
α i ei + å β j f j å i =1 1 4 44 2 j4=d +41 43
x∈ X2
x∈ X1
De aici rezultă că x ∈ X 1 ∩ X 2 , deci βj = 0 oricare ar fi j = 1, … , p1 . Din (*) , ( 1 ) , ( 2 ) obţinem :
d
åα i =1
i
ei = θ
( 2 ) ,
Dar vectorii { e1 , … , ed } formează o bază în D, deci sunt liniar independenţi. Rezultă că αi = 0 , oricare ar fi i = 1 , … , d , ceea ce înseamnă că BS formează o bază. BS are d + p1 – d + p2 – d = s vectori Þ -d + p1 + p2 = s Þ p1 + p2 = s + d . COROLAR: Fie S un subspaţiu al spaţiului X , S ⊂ X , deci s ≤ n , atunci: p1 + p2 – d ≤ n . OBSERVAŢIE : Dacă X 1 ∩ X 2 = {θ } , atunci d = 0 , p1 + p2 = s , ceea ce inseamnă: dim X1 + dim X2 = dim ( X1 + X2 ) . DEFINIŢIA 1.7.2. Fie X1 şi X2 două subspaţii ale spaţiului (X,K) . Dacă X 1 ∩ X 2 = {θ } , atunci X 1 ⊕ X 2 se numeşte suma directă a subspaţiilor X1 şi X2 .
CAPITOLUL 2 FUNCŢIONALE LINIARE
2.1.
Noţiunea de funcţională liniară Fie (X,K) un spaţiu vectorial de dimensiune n .
DEFINIŢIA 2.1.1. O aplicaţie f : X → K , se numeşte funcţională . DEFINIŢIA 2.1.2. Funcţionala f : X → K este liniară dacă: 1) oricare ar fi vectorii x şi y din X, f ( x + y ) = f ( x ) + f ( y ) ( proprietate de aditivitate) 2) oricare ar fi scalarul λ din corpul K, oricare ar fi vectorul x din X, f ( λ x ) = λ f ( x ) ( proprietate de omogenitate ) OBSERVAŢIE : Ø proprietăţile 1) şi 2) pot fi scrise într – o singură formulă : f(αx+βb)=αf(x)+βf(y), oricare ar fi scalarii α şi β din corpul K şi oricare ar fi vectorii x şi y din spaţiul X. n n n Ø Dacă x = å α i e i Þ f ( x ) = f æç å α i e i ö÷ = å α i f (e i ) i =1 è i =1 ø i =1 EXEMPLUL 1 : Fie spaţiul vectorial ( P2[x], R ) şi fie funcţionala
f : P2 [x ] → R, f ( x ) = ò x (t )dt , unde x(t) = a0 + a1 t + a2 t2 , a0 , 1
0
a1 , a2 ∈ R . Să se demonstreze că această funcţională este o funcţională liniară.
Oricare ar fi x şi y din ( P2[x], R ) , x(t) = a0 + a1 t + a2 t2 , y(t) = b0 + b1 t + b2 t2 , b0 , b1 , b2 ∈ R . Oricare ar fi α şi β din R , f (αx + βy ) =
ò0 [α x (t ) + β y (t )]dt 1
1
= α ò x (t )dt + β ò y (t )dt = 1
0
0
= αf ( x ) + βf ( y ) INTERPRETARE GEOMETRICÃ :
Fie spaţiul ( R3, R ) şi fie f : R 3 → R o funcţională liniară. x3 •x R
-e3
e2
0
x1
e1
f(x) f( e3 )
f( e1 ) f( e2 )
x2
2.2. Matricea unei funcţionale liniare:
din X.
Fie (X,K) un spaţiu vectorial , dim X = n. Fie E = { e1 , e2 , … , en } o bază în spaţiul X. Fie x = α1 e1 + α2 e2 + … + αn en , unde x este un vector Fie f : X → K , o funcţională liniară. Valoarea funcţionalei liniare în punctul
æ ö f ( x ) = f ç α i ei = è i =1 n
n i =1
α i f (ei ) .
x
este:
Notăm ai = f ( ei )
i = 1, … ,n
(1)
DEFINIŢIA 2.2.1 Se numeşte matricea funcţionalei f corespunzătoare bazei E , matricea: æ a1 ç ça A=ç 2 Μ çç èan
EXEMPLUL 1 :
ö ÷ ÷ ÷ ÷÷ ø
Fie spaţiul vectorial ( P2[x],R ) şi fie funcţionala
f : P2 [x ] → R, f ( x ) = ò x (t )dt , o funcţională liniară. 1
0
Fie E = { 1, t, t2 } o bază în P2[x] . Să se determine matricea funcţionalei f în baza E .
a1 = a2 = a3 =
1 0 1 0 1 0
f (e1 )dt = 1dt = 1 ; 1
0
f (e2 ) =
1 0
f (e 3 )dt =
tdt = 1 0
1; 2
t 2 dt =
t3 3
1
= 0
1 3
æ ö ç1 ÷ ç ÷ De aici rezultă că : A = ç 1 ÷ . ç2÷ ç ÷ çç 1 ÷÷ è3ø
2.3. Schimbarea matricei schimbarea bazelor
unei
funcţionale
PROPOZIŢIA 2.3.1. Fie (X,K) un spaţiu vectorial , dim X = n . Fie E = { e1 , e2 , … , en } o bază în spaţiul X .
liniare
la
n
Oricare ar fi vectorul x din spaţiul X , x =
i =1
f : X → K , o funcţională liniară , fie
α i ei . Fie
æ a1 ö ç ÷ ça ÷ A = ç 2 ÷ ai = f (ei) Μ çç ÷÷ è an ø
unde i = 1, … ,n . Fie G = { g1 , g2 , … , gn } o altă bază în spaţiul X . Fie CEG matricea de trecere de la baza E la baza G .
æ b1 ö ç ç b2 matricea functionalei f în baza G , bi = f (gi), Fie B = ç Μ çç è bn
unde i = 1, … ,n .
Atunci : B = C• A DEMONSTRAŢIE : Scriem matricea C ( cij ) , matricea de trecere de la baza E la baza G . g1 = c11 e1 + c12 e2 + … + c1n en g2 = c21 e1 + c22 e2 + … + c2n en ……………………………………… gn = cn1 e1 + cn2 e2 + … + cnn en b1 = f ( g1 ) = c11 f ( e1 ) + c12 f ( e2 ) + … + c1n f ( en ) b2 = f ( g2 ) = c21 f ( e1 ) + c22 f ( e2 ) + … + c2n f ( en ) ………………………………………………………………… bn = f ( gn ) = cn1 f ( e1 ) + c2n f ( e2 ) + … + cnn f ( en )
ìb1 = c11a1 + c12 a 2 + Κ + c1n a n sau : íΜ
îbn = c n1a1 + c n 2 a 2 + Κ + c nn a n
B = C• A
2.4. Dualul algebric al unui spaţiu vectorial Fie (X,K) un spaţiu vectorial, dim X = n . Considerăm mulţimea tuturor funcţionalelor liniare definite pe spaţiul X . L ( X , K ) = { f | f : X → K , f liniare
}
Vom organiza această mulţime ca un spaţiu vectorial. 1) oricare ar fi f , g ∈ L ( X , K ) , ( f ⊕ g )( x ) = f ( x ) + g ( x ) , unde “+” este adunarea din corpul K. 2) oricare ar fi λ ∈ K şi oricare ar fi f ∈ L( X , K ) , (α ⊗ f )(x ) = αf (x ) Cu aceste proprietăţi, spaţiul vectorial reprezintă un dual algebric. DEMONSTRAŢIE : Oricare ar fi f , g ∈ L( X , K ) Þ ( f ⊕ g )( x ) ∈ L ( X , K ) • f este funcţională liniară Þ oricare ar fi α , β ∈ K , oricare ar fi x, y ∈ X este adevărată relaţia : f (αx + βy ) = αf (x ) + βf ( y ) • g este funcţională liniară Þ oricare ar fi α , β ∈ K , oricare ar fi x, y ∈ X este adevărată relaţia : g (αx + βy ) = αg ( x ) + βg ( y )
( f ⊕ g)[αx + βy] = f (αx + βy) + g(αx + βy) = αf (x) + βf ( y) + αg(x) + βg( y) = = α[ f ( x) + g( x)] + β [ f ( y ) + g( y )] = α ( f ⊕ g ) + β ( f ⊕ g ) • • • • •
Asociativitate : (( f ⊕ g ) ⊕ h )( x ) = ( f ⊕ (g ⊕ h ))( x ) , oricare ar fi f , g ∈ L ( X , K ) . Element neutru : există ν ∈ L ( X , K ) , ν ( x ) = 0 , oricare ar fi x∈ X . Element simetric : oricare ar fi f ∈ L( X , K ) , există (− f ) ∈ L( X , K ) , astfel încât: (− f )( x ) = − f (x ) . Comutativitate : ( f ⊕g)( x) = (g ⊕ f )( x) , oricare ar fi f , g ∈ L( X , K ) . (1 ⊗ f )( x ) = f (x ) , oricare ar fi f ∈ L( X , K ) .
•
(α ⊗ β ) ⊗ f (x ) = α ⊗ (β ⊗ f (x )) , oricare ar fi f , g ∈ L( X , K ) ,
•
oricare ar fi α , β ∈ K . α ⊗ ( f (x) ⊕ g( x)) = (α ⊗ f ( x) ⊕αg(x)) , oricare ar fi f , g ∈L( X, K) , oricare ar fi α ∈ K .
Dualul algebric se mai numeşte spaţiul adjunct sau conjugat al lui X. 2.5. Funcţionale biliniare Fie (X,K) şi fie (Y,K) două spaţii vectoriale definite peste acelaşi corp de scalari K. DEFINIŢIA 2.5.1. O aplicaţie f : X × Y → K se numeşte funcţională biliniară dacă : 1) f (α1 x’ + α2 x’’ , y) = α1 f (x’, y) + α2 f (x’’, y) , oricare ar fi α1 , α2 ∈ K, oricare ar fi x’ , x’’ ∈ X şi oricare ar fi y ∈ Y ( funcţionala f este liniară în raport cu prima variabilă, x’ ) . 2) f (x , β1 y’ + β2 y’’) = β1 f (x , y’) + β2 f (x , y’’) , oricare ar fi β1 , β2 ∈ K, oricare ar fi y’ , y’’ ∈ Y şi oricare ar fi x ∈ X (funcţionala f este liniară în raport cu a doua variabilă, y’) . 2.6. Matricea unei funcţionale biliniare Fie (X,K) un spaţiu vectorial, dimX = m ; Fie E = { e1 , e2 ,…, em } o bază în X. Fie (Y,K) un spaţiu vectorial, dimY = n ; Fie Y = { g1 , g2 ,…, gn } o bază în Y. m
n
i =1
i =1
Oricare ar fi x ∈ X , x = αi ei şi oricare ar fi y ∈ Y , y = Fie f : X × Y → K , o funcţională biliniară,
n æ m ö m n f ( x, y ) = f çç å α i ei , å β j g j ÷÷ = åå α i β j f (ei , g j ) j =1 è i =1 ø i =1 j =1
βjgj .
Notăm (1) aij = f ( ei ,gj ) , i = 1 , … , m , j = 1 , … , n obţinem matricea A ( aij ). DEFINIŢIA 2.6.1. Matricea A ( aij ) ∈ Mnxm (K) unde aij = f ( ei ,gj ) , iar i = =1 , … , m şi j = 1 , … , n se numeşte matricea funcţionalei biliniare corespunzătoare bazelor E din spaţiul X şi G din spaţiul Y. f (x , y)=
m
n
i =1 j =1
α i β j a ij = α1 ( β1 a11 + β2 a12 + … + βn a1n ) +
+ α2 ( β1 a21 + β2 a22 + … + βn a2n ) + … + + am ( β1 am1 + β2 am2 + … + βn amn ) = XT AY æ a11 Κ ç XT = ( α1 ,α2 , … , αm ) , A = ç Μ ça è m1 Κ
(2)
a1n ö ÷ ÷ , a mn ÷ø
æ β1 ö ç ÷ Y = ç Μ÷ çβ ÷ è nø
f ( x , y ) = XT AEG YG
2.7. Schimbarea matricei schimbarea bazelor
unei funcţionale
biliniare
la
Fie (X,K) un spaţiu vectorial, dimX = m ; Fie E = { e1 , e2 ,…, em } o bază în X. Fie (Y,K) un spaţiu vectorial, dimY = n ; Fie Y = { g1 , g2 ,…, gn } o bază în Y. Fie x E =
m
n
i =1
i =1
åα i ei şi y G = å β j g j .
Fie f : X × Y → K o funcţională biliniară . Fie A matricea funcţionalei biliniare f corespunzătoare bazei E din spaţiul X şi bazei G din spaţiul Y . Fie F = { f1 , f2 , … , fm } o altă bază în spaţiul X . Fie CEF matricea de trecere de la baza E la baza F.
ì f f = c11 e1 + c12 e 2 + Κ + c1m e m ï íΜ ï f = c e + c e +Κ + c e m1 1 m2 2 mm m î m Fie H = { h1 , h2 , … , hm } o altă bază în spaţiul Y .
ìh f = d 11 g 1 + d 12 g 2 + Κ + d 1m g m ï íΜ ïh = d g + d g + Κ + d g m1 1 m2 2 mm m î m Fie B matricea funcţionalei biliniare f corespunzătoare bazei F din spaţiul X şi bazei H din spaţiul Y. (3) f ( x , y ) = XTE A YG (4) f ( x , y ) = XTF B YH (5) XF = ( CT )-1 XE (6) YH = ( DT )-1 YG
(4) Þ f (x, y) = [(CT )−1 X E ] B(DT )−1YG (∗) ( A⋅ B)T = BT AT (∗∗) (C−1 )T = (CT )−1 T
[
ü ï f ( x, y) = XET C−1B DT ï ýÞ (3) ï ïþ
Þ
( )
−1
]Y üïýÞ G
ïþ
A = C –1 B ( DT )-1 | • C Þ C A = C C –1 B ( DT )-1 Þ DT | C A = B ( DT )-1 Þ
Þ B = C • A • DT
CAPITOLUL 3
FUNCŢIONALE PÃTRATICE
3.1. Noţiunea de funcţională pătratică Fie (X,R) un spaţiu vectorial , dim X = n . DEFINIŢIA 3.1.1. Funcţia f : X → R este o funcţională liniară dacă oricare ar fi x1 , x2 care aparţin lui X şi oricare ar fi α1 , α2 care aparţin lui R, atunci : f ( α1 x1 + α2 x2 ) = α1 f ( x1 ) + α2 f ( x2 ) .
E = { e1 , e 2 , … , e n }
æ a1 ö ç ÷ A = ç Μ ÷ , ai = f ( e i ) , i = 1 , … , n . ça ÷ è 2ø
Din capitolul 2 , subcapitolul “ Funcţionale biliniare “ , cunoaştem următoarele : Ø Fie (X,R) , dim X = n şi fie (Y,R) , dim Y = m . Funcţionala biliniară f : X × Y → R are proprietăţile : 1. Oricare ar fi α1 , α2 ∈ R , x1 , x2 ∈ X , y ∈ Y , f ( α1 x1 + α2 x2 , y ) = α1 f ( x1 , y ) + α2 f ( x2 , y ) . 2. Oricare ar fi β1 , β2 ∈ R , y1 , y2 ∈ Y , x ∈ X , f ( x ,β1 y1 + β2 y2 ) = β1 f ( x , y1 ) + β2 f ( x , y2 ) . Ø
f ( x, y ) = X ET AYG
În cazul în care Y = X , f : X × X → R . Atunci apar următoarele modificari : A ( aij ) , aij = f ( ei , ej ) , i , j = 1 , … , n , f ( x, y ) = X T AY . DEFINIŢIA 3.1.2. Funcţionala biliniară f ( x , y ) este simetrică dacă f ( x , y ) = f ( y , x ) , oricare ar fi x , y ∈ X . DEFINIŢIA 3.1.3. Prin diagonala produsului cartezian X × X înţelegem :
diagX × X = {( x, x ) | x ∈ X } . DEFINIŢIA 3.1.4. Se numeşte funcţională pătratică , restricţia unei funcţionale biliniare simetrice la diagonala produsului cartezian X × X . n
n
2 V( x) = f ( x, x) = X T AX = ååaij xi x j = a11 x1 +2a12 x1 x2+2 a13 x1 x3+…+ i=1 j=1
+2 a1n x1 xn + a22 x22 + 2 a23 x2 x3 + … + 2 a2n x2 xn + … + ann xn2 , unde ( aij = f ( ei , ej ) ) . DEFINIŢIA 3.1.5. x∈ X.
V (x) este strict pozitiv definită dacă V (x) > 0 , oricare ar fi
DEFINIŢIA 3.1.6. x∈ X.
V (x) este semipozitiv definită dacă V (x) ≥ 0 , oricare ar fi
DEFINIŢIA 3.1.7. x∈ X.
V (x) este strict negativ definită dacă V (x) < 0 , oricare ar fi
DEFINIŢIA 3.1.8. x∈ X.
V (x) este seminegativ definită dacă V (x) ≤ 0 , oricare ar fi
DEFINIŢIA 3.1.9. V (x) este nedefinită dacă există x ∈ X astfel încât V (x) ≥ 0 şi există y ∈ X astfel încât V ( y ) ≤ 0 . Se pune problema dacă există o bază G = { g1 , g2 , … , gn } astfel încât în această bază ( bază canonică ) , avem: V (x) = β1 x12 + β2 x22 + … + βn xn2 . 3.2. Metoda Gauss pentru determinarea formei canonice a unei funcţionale pătratice şi determinarea bazei Fie (X,R) un spaţiu vectorial , dim X = n , şi o bază a acestui spaţiu, E = { e1 , e2 , … , en } . Fie f : X × X → R o funcţională biliniară simetrică . A (aij) , aij = f (ei,ej) , i , j = 1 , … , n , f ( x, y ) = X T AY . n
n
V ( x ) = X T AX = åå a ij x i x j i =1 j =1
Presupunem că există indicele i ( 1 ≤ i ≤ n ) astfel încât aii este diferit de zero. Presupunem că a11 diferit de zero . Luăm separat termenii care conţin componenta x1 şi vom scrie astfel : é ù a11x12+2a12x1x2+…+2a1nx1xn= a11 ê x12 + 2 x1 æç a12 x 2 + Κ + a1n x n ö÷ ú = ça ÷ a ë
è
11
11
øû
éæ a a ö æa ö ù a = a11 êç x1 + 12 x 2 + Κ + 1n x n ÷ − ç 12 x 2 + Κ + 1n x n ÷ ú . ç ça a11 a11 ÷ø a11 ÷ø ú è 11 ëêè û 2
2
2
æ ö a a Deci V ( x ) = a11 çç x1 + 12 x 2 + Κ + 1n x n ÷÷ = V1 ( x ) unde V1 ( x ) a11 a11 ø è nu conţine pe x1 .
Notăm : y 1 = x1 +
a12 a x 2 + Κ + 1n x n a11 a11
y2 = x2 y 3 = x3 Μ yn = xn
Astfel , V ( y ) = a11 y12 + b22 y22 + 2 b23 y2 y3 + … + bnn yn2 . Aplicăm acelaşi procedeu lui V1 şi după n paşi , obţinem forma canonică a funcţionalei . Dacă aii = 0, oricare ar fi i = 1 , … , n , vom face notaţia următoare : x 1 = y1 + y2 ; x 2 = y1 – y 2 ; x 3 = y3 ; … ; x n = yn . Astfel , vom obţine forma : V ( x ) = a12 ( y1 + y 2 )( y1 − y 2 ) +
åa
i≠ j i , j ≥3
ij
y i y j = a12 y12 −a12 y 22 +
åa
i≠ j i , j ≥3
ij
yi y j
EXEMPLUL 1 : V ( x ) = 2 x12 + x22 – x32 + 6 x1 x2 – 8 x1 x3 + 2 x2 x3 2
1 (2 x1 + 3x 2 − 4 x 3 )2 − 2 æç − 7 x 2 + 7 x 3 ö÷ + 5x 3 7è 2 2 ø
V (x ) =
y 1 = 2 x1 + 3 x 2 − 4 x 3 y2 = −
7 x2 + 7 x3 2
Þ (1) V ( y ) = 1 y12 − 2 y 22 + 5 y 32 , 2
7
y3 = x3 reprezintă o funcţională în forma canonică . Care este baza din spaţiul vectorial X în care funcţionala pătratică V are forma canonică (1) ?
æ y1 ö æç 2 3 ç ÷ 7 ç y2 ÷ = ç 0 − 2 çy ÷ ç è 3 ø è0 0
− 4 ö æ x1 ö ÷ç ÷ 7 ÷ç x 2 ÷ ÷ç ÷ 1 øè x 3 ø
Y = (C T ) X , unde C ( cij ) este matricea de trecere de la −1
baza E la baza G ( G este baza în care funcţionala pătratică are forma canonică ) .
(C )
T −1
− 4ö ÷ 7 ÷ ; ÷ 1 ø 3 ö æ1 ö æ 1 − 1÷ ç 0 0÷ ç 2 7 ÷ ç ÷ ç 2 2 3 2 T ÷ ç ç 2 Þ C EG = =C = 0 − − 0÷ ÷ ç ÷ ç 7 7 7 ç0 0 ç − 1 2 1÷ 1÷ ÷ ÷ ç ç ø ø è è
æ2 3 ç 7 = ç0 − 2 ç è0 0
((C ) )
−1 T −1
Fie baza G baza în care vom determina forma canonică a funcţionalei pătratice V , G = { g1 , g2 , … , gn } Calculăm vectorii acestei baze :
æ1ö æ1ö ç 2 ÷ 1 1ç ÷ ç ÷ g 1 = c11 e1 + c12 e 2 + c13 e 3 = e1 = ç 0 ÷ = ç 0 ÷ 2 2ç ÷ è 0 ø çç 0 ÷÷ è ø 3 æ ö ç ÷ 7 æ − 1ö ç ÷ ç ÷ 3 2 2 g 3 = − e1 + 2e 2 + e 3 = ç 2 ÷ g 2 = e1 − e 2 = ç − ÷ ç 7÷ 7 7 ç 1 ÷ ç 0 ÷ è ø ç ÷ è ø
æ1 ç ç2 Matricea B a funcţionalei V în baza G este : B = ç 0 ç ç0 ç è
0 2 7 0
−
ö 0÷ ÷ 0÷ . ÷ 5÷ ÷ ø
3.3. Metoda Jacobi pentru determinarea formei canonice a funcţionalei pătratice
V ( x ) = 2 x12 + x22 – x32 + 6 x1 x2 – 8 x1 x3 + 2 x2 x3 Notăm : ∆ 0 = 1 , ∆ 1 = 2 , ∆ 2 = 2 ∆3 = 3
3 −4 1
−4 1
V (y) =
2 3 = −7 , 3 1
1 = −35 . −1
∆ 0 2 ∆1 2 ∆ 2 2 y1 + y2 + y3 ∆3 ∆2 ∆1
Deci , obţinem : V ( y ) =
1 2 2 2 1 2 y1 − y 2 + y 3 . 2 7 5
Într – un spaţiu există mai multe baze în care funcţionala poate fi adusă la forma canonică , deci forma canonică obţinută prin metoda Gauss diferă de cea obţinută prin metoda Jacobi . Metoda Jacobi se poate aplica numai dacă toţi minorii principali ai matricei A sunt nenuli . METODA JACOBI LA CAZUL GENERAL
Fie spaţiul vectorial (X,R) , dim X = n , şi fie o bază în acest spaţiu, notată E = { e1 , e2 , … , en } . Fie f : X × X → R o funcţională biliniară simetrică . Fie A( aij ) matricea funcţionalei f în baza E .
TEOREMA 3.3.1. Fie
n
n
V ( x ) = x T Ax = åå a ij x i x j o funcţională pătratică , i =1 j =1
unde A(aij) este matricea funcţionalei V în baza E . Dacă toţi minorii principali ai matricei A sunt nenuli , a11 Κ a1r Μ ≠ 0 ( r = 1 , … ,n ) şi ∆ 0 = 1 , ∆r = Μ a r1 Κ
a rr
atunci există o bază G = { g1 , g2 , … , gn } în care matricea B a funcţionalei V este diagonală şi æ ∆0 ç ç ∆1 ç B=ç ç ç ç 0 ç è
∆1 ∆2
ö 0 ÷ ÷ ÷ ÷ . ÷ ÷ ∆ n −1 ÷ ∆ n ÷ø
Ο
OBSERVAŢIE : În baza G , V ( y ) = å ∆ i −1 y i2 . n
i =1
DEMONSTRAŢIE : Vom construi baza G astfel :
(1)
g1 = λ11 e1 g2 = λ21 e1 + λ22 e2 ………………….. gi = λi1 e1 + λi2 e2 + … + λii ei ……………………………… gn = λn1 e1 + λn2 e2 + … + λnn en
Vom determina scalarii λij din condiţiile :
∆n
ì f (g k , ei ) = 0 í î f (g k , e k ) = 1
(2) k=1
k = 1 , … , n , i = 1 , … ,k-1
f( g1 ,e1 ) = 1 Þ f( λ11 e1 , e1 ) = 1 Þ λ11 f( e1 , e1 ) = 1 Þ
λ11 a11 = 1 Þ λ11 =
1 . ( din ipoteză , a11 este diferit de zero ) . a11
k=2
ì f (g2 , e1 ) = 0 ì f (λ21e1 + λ22e2 , e1 ) = 0 ìλ21 f (e1 , e1 ) + λ22 f (e2 , e1 ) = 0 Þí Þí Þ í î f (g2 , e2 ) = 1 î f (λ21e1 + λ22e2 , e2 ) = 1 îλ21 f (e1 , e2 ) + λ22 f (e2 , e2 ) = 1 a11 λ 21 + a 21 λ22 = 0
Þ ìí
îa12 λ 21 + a 22 λ22 = 1 a12 = a21
0 a21
λ21 =
ìa11 λ21 + a 21 λ 22 = 0 îa 21 λ21 + a 22 λ22 = 1
Þ í
0 a21
1 a22 a11 a21 a12 a22
=
1 a22 a11 a12
0 a21 =
1 a22 ∆2
, λ22 =
a11
0
a12
1
∆2
=
∆ 22 ∆2
.
a21 a22
Analog demonstrăm şi pentru 1 ≤ k ≤ n , iar sistemul (2) are soluţia următoare : col1 Κ coli Κ colk
λ ki =
∆ ki ∆k
, unde
∆ ki =
a11 Κ Μ a k1 Κ
0 Κ Μ 1 Κ
a 1k Μ a kk
În baza G astfel determinată , matricea B a funcţionalei pătratice V este de forma:
æ ∆0 ç ç ∆1 ç B=ç ç ç ç 0 ç è
∆1 ∆2
Ο
ö 0 ÷ ÷ ÷ ÷ ÷ ÷ ∆ n −1 ÷ ∆ n ÷ø
ì0, i ≠ j
, b = ïí ∆ ij i −1 ,i = j ï
.
î ∆i
Ø pentru i < j :
bij = f( gi , gj ) = f( λi1 e1 + … + λii ei , gj ) = λi1 f( e1 , gj ) + … + + λii f( ei , gj ) = λi1 f( gj , e1 ) + … + λii f( gj , ei ) . Din sistemul (2) , rezultă că pentru i < j , bij = 0 . Ø pentru i = j :
bii = f( gi , gj ) = f( λi1 e1 + … + λii-1 ei-1 + λii ei , gi ) = = λi1 f (e1 , g i ) + Κ + λii −1 f (e i −1 , g i ) + λii f (ei , g i ) = λii . 1 42 43 1 4 4 2 4 43 1 42 43 =0
λii =
∆ ii ∆i
=0
,
a11 Κ Μ ∆ ii = a i −1,1 Κ a i1 Κ
=1
a1,i −1 Μ a i −1,i −1 a i ,i −1
0 Μ ∆ = ∆ i −1 Þ λii = i −1 0 ∆i 1
EXEMPLUL 1 : V ( x ) = 2 x12 + x22 – x32 + 6 x1 x2 – 8 x1 x3 + 2 x2 x3
æ 2 3 − 4ö ç ÷ A=ç 3 1 1 ÷ ç− 4 1 1 ÷ è ø
.
2 3 −4 2 3 ∆ 0 = 1 , ∆1 = 2 , ∆ 2 = = −7 , ∆ 3 = 3 1 1 = −35 3 1 − 4 1 −1 V (y) =
1 2 2 2 1 2 ∆ 0 2 ∆1 2 ∆ 2 2 y1 + y2 + y 3 Þ V ( y ) = y1 − y 2 + y 3 2 7 5 ∆1 ∆2 ∆3
g1 = λ11 e1 g2 = λ21 e1 + λ22 e2 g3 = λ31 e1 + λ32 e2 + λ33 e3 Ø pentru k = 1 :
Þ f( g1 , e1 ) = 1 Þ f( λ11 e1 , e1 ) = λ11 f( e1 , e1 ) = λ11 a11 = 2λ11 æ1ö
ç ÷ 1 1 = 1 Þ Þ λ11 = Þ g 1 = e1 Þ g = ç 20 ÷ . 1 ç ÷ 2 2 ç0÷ ç ÷ è ø
Ø pentru k = 2 : ì f (λ21e1 + λ22 e2 , e1 ) = 0 ìλ21a11 + λ22 a 21 = 0 Þ Þí Þí î f (g 2 , e2 ) = 1 î f (λ21e1 + λ22 e2 , e2 ) = 1 îλ21a12 + λ22 a 22 = 1
Þ ìí
f (g 2 , e1 ) = 0
æ 3 ö ç ÷ 3 ì ç 7 ÷ = λ 21 3 2 ç 2÷ 7 Þ ìí2λ21 + 3λ22 = 0 Þ ïïí Þ g 2 = e1 − e 2 Þ g 2 = − ç 7÷ 7 7 î3λ21 + λ22 = 1 ïλ22 = − 2 ç 0 ÷ 7 îï ç ÷ è ø Ø pentru k = 3 : ì f (g 3 , e1 ) = 0
ì f (λ 31 e1 + λ32 e 2 + λ 33 e 3 , e1 ) = 0
ï f (g , e ) = 1 3 1 î
ï f (λ e + λ e + λ e , e ) = 1 31 1 32 2 33 3 3 î
Þ ïí f (g 3 , e 2 ) = 0 Þ ïí f (λ31 e1 + λ32 e 2 + λ33 e 3 , e 2 ) = 0 Þ
1 ì ïλ31 = − 5 ìλ31a11 + λ32 a 21 + λ33a 31 = 0 ì2λ31 + 3λ32 − 4λ33 = 0 ï 2 ï ï ï Þ íλ31a12 + λ32 a 22 + λ33a 32 = 0 Þ í3λ31 + λ32 + λ33 = 0 Þ íλ32 = − 7 ïλ a + λ a + λ a = 1 ï− 4λ + λ − λ = 1 ï î 31 13 î 32 23 33 33 31 32 33 1 ï ïîλ33 = 5
1 5
2 7
1 5
Þ g 3 = − e1 − e 2 + e 3 . Matricea B a funcţionalei pătratice V are forma : æ1 ç ç2 B=ç ç ç ç0 è
−
2 7
ö 0÷ ÷ ÷ ÷ 1÷ ÷ 5ø
3.4. Legea inerţiei
TEOREMA 3.4.1. Numărul coeficienţilor pozitivi şi numărul coeficienţilor negativi din forma canonică a unei funcţionale pătratice V(x) nu depinde de alegerea bazei canonice . ( Deci , coeficienţii pozitivi şi coeficienţii negativi sunt invarianţi ai funcţionalei pătratice .) DEMONSTRAŢIE : Fie spaţiul vectorial (X,R) , dim X = n .Fie bazele canonice E şi G din spaţiul vectorial X , astfel încât : E = { e1 , e2 , … , en } xE = ( x1 , x2 , … , xn )T G = { g1 , g2 , … , gn } yG = ( y1 , y2 , … , yn )T m1
În baza E : V ( x ) = å λi x i2 − i =1
n1
åλ
j
x 2j , λi > 0 , i = 1 , … , m1
j = m1+1
λj > 0 , j = m1+1 , … , n1
m2
În baza G : V ( y ) = å µ i y i2 − i =1
n2
åµ
j = m 2 +1
j
y 2j , µi > 0 , i = 1 , … , m2
µj > 0 , j = m2+1 , … , n2 Deci funcţionala pătratică are în baza E , m1 coeficienţi pozitivi şi n1 – m1 coeficienţi negativi . ( Nu am scris n ci n1 , pentru că există posibilitatea ca anumiţi coeficienţi să fie nuli . ) Trebuie să demonstrăm că m1 = m2 şi n1 = n2 . Demonstraţia o vom face prin reducere la absurd . Presupunem contrariul şi anume m1 > m2 . Fie subspaţiul X1 = Sp ( { e1 , … , em1 } ) , X1 ⊂ X , dim X1 = m1 . Fie subspaţiul X2 = Sp ( { gm2+1 , … , gn } ) , X2 ⊂ X , dim X2 = m1 . Fie D = X 1 ∩ X 2 . dim X1 + dim X2 = m1 + n – m2 Þ D conţine şi vectori nenuli . m1
Fie x ∈ D Þ x ∈ X 1 Þ x = å x i ei 1 4 2i =1 4 3
,
ß
()
()
m1
V x = å λi x i2 > 0
()
i =1
n
x∈X2 Þ x = å yjg j 1 44j =2m 2 +41 43
( ) åy
V x =
ß
n
j = m 2 +1
j
y 2j < 0
Dar V x >0 şi V x 0 r=1,…,n . a rr
CAPITOLUL 4 COMPLEMENTE DE TEORIA ŞIRURILOR ŞI SERIILOR NUMERICE 4.1. Noţiuni introductive DEFINIŢIA 4.1.1. : Se numeşte şir de numere reale o funcţie f : N → R, f (n ) = a n . Notăm (a n )n∈N * . *
DEFINIŢIA 4.1.2. : Fie n1 0 , există un prag N (ε ) astfel încât
2. Şirul a n =
oricare ar fi n ≥ N (ε ) rezultă că a n − a < ε . 1 1 1 é1ù − 0 < ε ⇔ < ε ⇔ 1 < nε ⇔ n > Þ N (ε ) = ê ú + 1 ε n n ëε û
OBSERVAŢIA 5 : În definiţiile anterioare ( de convergenţă a unui şir către un număr ) , limita şirului , “a” , este aprioric cunoscută. 4.2. Şir fundamental Cauchy introduce noţiunea de şir fundamental ( şir Cauchy ). DEFINIŢIA 4.2.1. : Şirul (a n )n∈N * este şir fundamental (Cauchy)
dacă oricare ar fi ε > 0 , există un prag N (ε ) astfel încât oricare ar fi
m ≥ N (ε ) şi oricare ar fi n ≥ N (ε ) vom avea a m − a n < ε . DEFINIŢIA 4.2.2.
:
Şirul
(an )n∈N
*
este un şir fundamental
(Cauchy) dacă oricare ar fi ε > 0 , există un prag N (ε ) astfel încât oricare ar fi n ≥ N (ε ) şi oricare ar fi p ∈ N * , avem a n + p − a n < ε . OBSERVAŢIA 1 : Definiţiile 4.2.1. şi 4.2.2. sunt echivalente. DEMONSTRAŢIE : (a) Presupunem că (a n )n∈N * este fundamental conform definiţiei 4.2.1. Putem presupune fără îngrădirea generalităţii că m>n . Vom nota p=m-n . De aici rezultă că m=n+p. Înlocuind pe m=n+p în definiţia 4.2.1. vom obţine definiţia 4.2.2. (b) Presupunem că (a n )n∈N * este fundamental conform definiţiei 4.2.2. Vom nota m=n+p , m > N (ε ) . Rezultă astfel că este verificată definiţia 4.2.1.
OBSERVAŢIA 2 : Şirul (a n )n∈N * este fundamental dacă şi
numai dacă oricare ar fi ε > 0 , există un rang N = N (ε ) astfel încât oricare ar fi n ≥ N (ε ) rezultă că a N − a n < ε . DEMONSTRAŢIE : (i) Presupunem că (a n )n∈N * este un şir fundamental. Conform
definiţiei 1.2.1. rezultă că oricare ar fi ε > 0 , există un rang N = N (ε )
astfel încât pentru m ≥ N (ε ), n ≥ N (ε ), a m − a n < ε . Dacă N=m, atunci
a N − am < ε . (ii) Presupunem că oricare ar fi ε > 0 , există un rang N = N (ε ) astfel încât oricare ar fi n ≥ N (ε ) rezultă că a N − a n <
ε . 2
ε ε
Fie m ≥ N = N(ε ) Þ am − an = am − aN + aN − an ≤ am − aN + aN − an < + = ε 2 2
Observaţia anterioară poate fi considerată ca a treia definiţie a unui şir fundamental. PROPOZIŢIA 4.2.1. : Orice şir fundamental este mărginit. DEMONSTRAŢIE : Din ipoteză ştim că şirul
(an )n∈N
*
este fundamental. Conform
observaţiei 2 , oricare ar fi ε > 0 , există un rang N = N (ε ) astfel încât oricare ar fi n ≥ N (ε ) rezultă că a N − a n < ε .
a n − a N < ε ⇔ −ε < a n − a N < ε Þ a N − ε < a n < a N + ε . | a1
| a2
| aN-1
| aN- ε
| aN
| aN+ ε
Notăm m = min{a1, a2 ,Κ , aN − 1, aN − ε } şi M = max{a1, a2 ,Κ , aN −1, aN + ε}. Rezultă că m ≤ a n ≤ M , ∀n ∈ N * .
PROPOZIŢIA 4.2.2. : Dacă şirul fundamental (a n )n∈N * conţine
( )
un subşir a nk
k∈N *
convergent către “a” , atunci şirul
(an )n∈N
*
este
convergent către “a”. DEMONSTRAŢIE : Subşirul a nk k∈N * converge către “a”.
( )
(∀)ε > 0 Þ (∃) N1 (ε ) astfel încât : (∀)nk ≥ N1 (ε ) Þ an − a < ε k
Şirul (a n )n∈N * este fundamental.
2
(1)
ε (2) 2 Fie N (ε ) = max{N1 (ε ), N2 (ε )} . Alegem k∈N* astfel încât nk ≥ N (ε ) . Din (1) rezultă : dacă m = nk , atunci a n − an < ε sau an − an < ε . (∀)ε > 0 Þ(∃)N2 (ε ) astfel încât (∀)m ≥ N 2 (ε ) şi (∀)n ≥ N2 (ε) Þ am − an <
k
2
k
Din (2) rezultă : dacă m = nk , atunci a n − a < ε . 2 Oricare ar fi ε > 0, şi n ≥ N (ε ) , obţinem :
2
k
a n − a = an − a nk + a nk − a ≤ a n − a nk + ank − a < ε Þ a n → a . 14 2 43 14 2 43 <
ε 2
<
ε 2
CRITERIU DE CONVERGENŢĂ : Fie (bn )n∈N * , bn > 0 , lim bn = 0 . Fie (a n )n∈N . Dacă există un n →∞
prag N astfel încât oricare ar fi n ≥ N Þ a n − l < bn Þ a n → l . n →∞
LEMA LUI CESARO:
Din orice şir mărginit se poate extrage un subşir convergent. DEMONSTRAŢIE : Din ipoteză ştim că (a n )n∈N * este mărginit, deci există a , b ∈ Q astfel încât a ≤ a n ≤ b , oricare ar fi n ∈ N * .
a1 |
a2 |
a=a0
c1
b2=b1 |
c0 =
a 0 + b0 2
| b=b0
Lungimea intervalului [ a , b ] este b-a. Calculăm c0 =
a0 + b0 şi 2
obţinem două intervale [ a0 , c0 ] şi [c0 , b0 ]. Notăm cu [ a1 , b1 ] un interval ce conţine o infinitate de termeni ai şirului. Dacă ambele intervale obţinute mai sus conţin o infinitate de termeni, vom considera drept [ a1 , b1 ] intervalul din stânga. Lungimea intervalului [ a1 , b1 ] este Notăm cu c1 =
b−a . Alegem a n1 ∈ [a1 , b1 ] 2
a1 + b1 . Notăm cu [ a2 , b2 ] intervalul care conţine o 2
infinitate de termeni ai şirului. Dacă ambele intervale conţin o infinitate de termeni , aleg drept [ a2 , b2 ] pe cel din stânga. Lungimea intervalului [ a2 , b2 ] este Alegem a n2 ∈ [a 2 , b2 ] , n2 > n1 .
b−a . 22
Repetând procedeul de mai sus, după k paşi vom avea intervalul [ ak , bk ] cu lungimea şirului.
b−a şi care conţine o infinitate de termeni ai 2k
Alegem a nk ∈ [a k , bk ] , nk > nk-1 .
Împărţim intervalul [ ak , bk ] în două intervale egale şi alegem drept interval [ ak+1 , bk+1 ] intervalul care conţine o infinitate de termeni ai şirului. Dacă ambele intervale conţin o infinitate de termeni, alegem drept [ ak+1 , bk+1 ] pe cel din stânga. Alegem a nk +1 ∈ [a k +1 , bk +1 ] , nk+1 > nk . Am demonstrat astfel prin inducţie după “k” , faptul că putem alege
( )
un subşir a nk
k∈N *
astfel încât a n ∈ [ak , bk ] , interval de lungime b −k a . k
2
a = a0 ≤ a1 ≤ a 2 ≤ Κ ≤ a k ≤ Κ ≤ α ≤ Κ ≤ bk ≤ Κ ≤ b1 ≤ b0 = b pentru oricare k ∈ N * . Rezultă că există şi este unic numărul real α ∈ [a k , bk ], (∀)k ∈ N * .
Dar ank ∈ [ak , bk ] pentru oricare k ∈ N * , şi deci ank − α =
b−a . 2k
Notând bk = b −k a avem bk > 0 şi lim bk = 0 . k →∞ 2 Conform criteriului de convergenţă enunţat anterior rezultă că a nk → α . k →∞
TEOREMA DE CONVERGENŢĂ A LUI CAUCHY
Un şir de numere reale (a n )n∈N * este convergent dacă şi numai dacă este şir fundamental. DEMONSTRAŢIE : (i) Presupunem că (a n )n∈N * este convergent . Aceasta înseamnă că oricare
ε . 2 (∀)m ≥ N(ε ),(∀)n ≥ N(ε ) Þ am − an = am − a + a − an ≤ am − a + a − an < ε . 1 2 3 123
ar fi ε > 0 , există N (ε ) astfel încât oricare ar fi n ≥ N (ε ) Þ an − a <
Deci şirul (a n )n∈N * este şir fundamental.
ε < 2
ε < 2
(ii) Presupunem că (a n )n∈N * este şir fundamental. Dacă an este şir fundamental, atunci, conform propoziţiei 4.2.1. şirul an este mărginit. Din lema lui Cesaro rezultă că şirul mărginit an conţine un subşir
a nk
convergent. Conform propoziţiei 4.2.2. orice şir fundamental care conţine un subşir convergent este convergent. Teorema este astfel demonstrată. 4.3. Puncte limită ale unui şir
Fie (a n )n∈N * un şir de numere reale. DEFINIŢIA 4.3.1. : Numărul real “a” este punct limită al şirului (an )n∈N * , dacă orice vecinătate a lui “a” ( V(a) ) conţine o infinitate de termeni ai şirului.
EXEMPLU : Fie şirul a n =
1 + ( −1) n 2
a1 = 0 , a3 = 0 , … , a2k-1 = 0 , … a2 = 1 , a4 = 1 , … , a2k = 1 , … Putem spune că “0” şi “1” sunt puncte limită ale lui an pentru că oricare ar fi vecinătăţile V(0) şi V(1), în ele există o infinitate de termeni ai şirului. OBSERVAŢIE : 1) Dacă şirul (a n )n∈N * este convergent către “a” , atunci “a” este singurul punct limită. 2) Un punct limită al unui şir poate fi un număr finit sau ± ∞ . EXEMPLU : fie şirul 1, 1, 2, 1, 2, 3, 1, 2, 3, 4, … Puncte limită sunt : 1, 2, 3, … Deci există şiruri cu o infinitate de puncte limită. PROPOZIŢIA 4.3.1. : Fie şirul (a n )n∈N * . Punctul “a” este punct limită pentru acest şir dacă şi numai dacă există un subşir a nk → a . k →∞
DEMONSTRAŢIE : (i) Presupunem că (a n )n∈N * conţine un subşir (a nk ) astfel încât
a nk → a , deci “a” este punct limită al şirului an . k →∞
Oricare ar fi vecinătatea V(a) , în afara ei există cel mult un număr finit de termeni ai subşirului a n k . Deci oricare ar fi vecinătatea V(a) , în interiorul ei există o infinitate de termeni ai şirului an . Rezultă astfel că “a” este punct limită al şirului an . (ii) Fie “a” un punct limită al şirului an . Trebuie să arătăm că există un subşir a n k astfel încât a nk → a . k →∞
Vom studia trei situaţii : 1) “a” este finit , 2) “a” este + ∞ , 3) “a” este − ∞ .
1) Fie V1(a) = (a-1 , a+1) . Deoarece “a” este punct limită al şirului an , în această vecinătate există o infinitate de termeni ai şirului an . Alegem un termen al şirului an astfel încât a n ∈ V1 ( a ) . 1
Fie V2 (a ) = æç a − 1 , a + 1 ö÷ . Şi în această vecinătate există o 2 2ø è
infinitate de termeni ai şirului an . Alegem a n2 ∈ V2 (a ), n2 > n1 .
………………………………………………………………………………. 1 1 Fie Vk ( a ) = æç a − , a + ö÷ . Alegem a nk ∈ Vk ( a ), n k > nk −1 . k kø è Demonstrăm prin inducţie că această relaţie este adevărată. 1 1 Oricare ar fi Vk ( a ) = æç a − , a + ö÷ , oricare ar fi k ∈ N * , alegem k kø è
1 1 1 1 a nk ∈ Vk ( a ), n k > nk −1 . Deci ank ∈ æç a − , a + ö÷ ⇔ a − < ank < a + ⇔ k kø k k è
1 1 1 < a nk − a < Þ a nk − a < . Din criteriul de convergenţă enunţat k k k æ mai sus, rezultă că lim a nk = a ç bk = 1 > 0; bk → 0 ö÷ . n →∞ ⇔−
k
è
k →∞
ø
2) a = + ∞ Fie V1( ∞ ) = ( 1, ∞ ) . Alegem a n1 ∈V1 ( ∞ ) .
Fie V2( ∞ ) = ( 2, ∞ ) . Alegem a n2 ∈ V2 (∞ ), n2 > n1 . ………………………………………………………. Fie Vk( ∞ ) = ( k, ∞ ). Alegem a nk ∈ Vk ( ∞ ), n k > nk −1 , etc.
a nk ∈ ( k , ∞ ) Þ a nk > k Þ lim a nk > lim k Þ lim a nk = ∞ . k →∞
k →∞
k →∞
3) a = − ∞ Fie V1( − ∞ ) = ( − ∞ , 1 ) . Fie V2( − ∞ ) = ( − ∞ , 2 ) . …………………………… Fie Vk( − ∞ ) = ( − ∞ , k ) , etc. În continuare se procedează la fel ca la punctul 2) .
DEFINIŢIA 1.3.2. : Fie (a n )n∈N * un şir de numere reale. Se numeşte limită inferioară a şirului an , cel mai mic punct limită al lui an . Se notează : lim inf a n = lim an . n →∞
n →∞
DEFINITIA 1.3.3. : Fie (a n )n∈N * un şir de numere reale. Se numeşte limită superioară a şirului an , cel mai mare punct limită al lui an . Se notează : lim sup a n = lim a n . n→∞
n →∞
EXEMPLU : Fie şirul (a n )n∈N * , an = ( −1) n 2n n +1 2( 2k − 1) a 2 k −1 = − → − 2 Þ lim an = −2 n →∞ 2k − 1 + 1 k →∞
a2k =
2( 2k ) →+2 2k + 1 k → ∞
Þ lim a n = +2 n →∞
4.4. Serii de numere reale
Fie şirul de numere reale (a n )n∈N * , a1 , a2 , … , an , an+1 , … Notăm : S1 = a1 S2 = a1 + a2 ……………………. Sn = a1 + a2 + … + an …………………….
(Sn )n∈N
*
se numeşte şirul sumelor parţiale. Dacă (S n )n∈N * este
convergent către limita “S” ( deci “S” este finit! ) , atunci lim S n = S , n→∞
∞
S = å ai .
(1)
i =1
DEFINIŢIA 4.4.1. : Membrul drept al relaţiei (1) se numeşte serie. DEFINIŢIA 4.4.2. : a1 , a2 , … , an se numesc termenii seriei.
DEFINIŢIA 4.4.3. : Sn = a1 + a2 + … + an se numeşte suma parţială de ordinul n . DEFINIŢIA 4.4.4. : Dacă există, S este suma seriei . OBSERVAŢIE : Dacă se cunosc termenii seriei, putem obţine sumele parţiale şi reciproc. Fie şirul sumelor parţiale (S n )n∈N * . Sn = a1 + a2 + … + an Sn-1 = a1 + a2 + … + an-1
Þ a n = S n − S n −1 , a1 = S1 , n ≥ 2 .
DEFINIŢIA 4.4.5. : Seria
∞
åa n =1
n
este convergentă dacă şirul
sumelor parţiale Sn este convergent. DEFINIŢIA 4.4.6. : Dacă şirul sumelor parţiale are limita + ∞ sau − ∞ sau nu are limită, atunci seria
∞
åa n =1
n
este divergentă .
A cerceta natura unei serii înseamnă a determina dacă seria este convergentă sau divergentă. EXEMPLE : A. Folosind definiţia convergenţei unei serii, să se stabilească natura seriei cu termenul general : 1 un = 2 , n ≥1 n + 4n + 3 n 2 + 4n + 3 = (n + 3)(n + 1) 1 1æ 1 1 ö un = 2 = ç − ÷, n ≥ 1 n + 4n + 3 2 è n + 1 n + 3 ø 1æ1 1 1 1 1 1 1 1 1 1 ö + − Sn = u1 + u2 + Κ + un = ç − + − + − + Κ + − ÷= 2è2 4 3 5 4 6 n n + 2 n +1 n + 3ø 1æ1 1 1 1 ö 5 1 1 − − = ç + − − ÷= 2 è 2 3 n + 2 n + 3 ø 12 2(n + 2) 2(n + 3)
æ 5 1 1 ö 5 lim S n = lim çç − − ÷= n→∞ n → ∞ 12 2 ( n 2 ) 2 ( n + + 3) ÷ø 12 è B. Să se cerceteze natura seriilor următoare : ∞ 1 1) å n =1 n ( n + 1) 1 1 1 an = = − n (n + 1) n n + 1 1 1 1 1 1 1 1 1 Þ Sn = a1 + a2 + Κ + an−1 + an = 1 − + − + Κ + − + − = 1− 2 2 3 n −1 n n n + 1 n +1 ∞ 1 este convergentă şi are suma S = 1 . Þ lim S n = 1 Þ å n →∞ n =1 n ( n + 1) 2) Seria geometrică : Fie r>0 .
∞
år
n
= 1 + r + r2 + Κ + rn + Κ
n =0
Sn = 1 + r + r 2 + Κ + r n =
1 − r n +1 1− r
1 − r n +1 1 = Ø r ∈ (0,1) : lim n →∞ 1 − r 1− r n +1 1− r Ø r ∈ (1, ∞ ) : lim = +∞ n →∞ 1 − r Ø r = 1 : Sn = n+1 , lim S n = +∞ n →∞
Deci seria geometrică este convergentă pentru r ∈ (0,1) şi
divergentă pentru r ∈ [1, ∞ ) . 3) Seria oscilantă : ∞
å (− 1)
n
= 1 − 1 + 1 − 1 + ...
n =0
S0 = 1 S2 = 1 ……… S2k = 1 ………
S1 = 0 S3 = 0 ……… S2k+1 = 0 ……….
Observăm că Sn nu are limită , deci
∞
å (− 1)
n
este divergentă .
n =0
PROPRIETĂŢI ALE SERIILOR : Aceste proprietăţi rezultă din proprietăţile şirurilor. P1) Dacă într-o serie se schimbă ordinea unui număr finit de termeni, se obţine o serie de aceeaşi natură ca şi prima. P2) Dacă într-o serie adăugăm sau scădem un număr finit de termeni, obţinem o serie de aceeaşi natură ca şi prima. P3) către zero.
Resturile unei serii convergente formează un şir convergent
DEMONSTRAŢIE : Fie
∞
åa n=1
Rn =
n
= a1 + a2 + Κ + an + an+1 + an+2 + Κ 1 4 4 2 4 4 3 1 4 4 2 4 43 Sn
Rn
∞
åa
k = n +1
k
, unde cu Rn am notat restul de ordinul n al seriei.
∞
S = åan = Sn + Rn Þ Rn = S − Sn Þ limRn = lim(S − Sn ) = S − limSn = S − S = 0 n→∞
n=1
P4)
Dacă seria
parţiale este mărginit. P5) Dacă seria
åa
åa
DEMONSTRAŢIE : Din ipoteză ştim că
n
n
n→∞
n→∞
este convergentă, atunci şirul sumelor
este convergentă, atunci lim an = 0 . n→∞
åa
n
este convergentă, deci lim S n = S , n →∞
unde S este finit. a n = S n − S n +1 Þ lim a n = lim(S n − S n −1 ) = lim S n − lim S n −1 = S − S = 0 n →∞
OBSERVAŢIA 1 :
n→∞
n →∞
n →∞
Reciproca acestei afirmaţii nu este adevărată. Adică, dacă lim a n = 0 , nu rezultă că a n este convergentă. Pentru a demonstra
å
n →∞
această afirmaţie, vom da un exemplu: Seria armonică : ∞
1
1 1 Þ lim = 0 . n →∞ n n n =1 1 1ö æ 1ö æ1 1ö æ1 1 1 1ö æ 1 S2n = ç1 + ÷ + ç + ÷ + ç + + + ÷ + Κ + ç n−1 + n−1 +Κ + n ÷ 2 ø è 2ø è3 4ø è5 6 7 8ø è 2 +1 2 + 2 1 1 1+ > 2 2
ån
, an =
1 1 1 1 1 + > + = 3 4 4 4 2
1 1 1 1 4 1 + + + > = 5 6 7 8 8 2 ……………………… 1 1 1 +Κ + n > n −1 2 +1 2 2 n Deci S > Þ lim S 2 = ∞ 2 n→ ∞ 2 n
n
Din şirul Sn am extras şirul
S 2n
care este divergent. De aici
rezultă faptul că Sn este divergent, deci lim S n = ∞ Þ å 1 este divergentă . n →∞ n OBSERVAŢIA 2 : Dacă lim a n ≠ 0 Þ å a n este divergentă . Această observaţie n →∞
reprezintă un criteriu de divergenţă a seriilor. P6) Fie
åa
n
o serie convergentă cu suma A . Fie
convergentă cu suma B . Atunci,
α, β ∈ R .
å (αa
conv
n
åb
n
o serie
+ βbn ) → αA + βB , oricare ar fi
OBSERVAŢIE : Mulţimea seriilor convergente formează un spaţiu vectorial. EXEMPLU : Să se arate că seria cu termenul general un =
3n − 5n , n ≥ 1 este 15n
convergentă şi să i se calculeze suma . n
un =
3n 5n æ 1 ö æ 1 ö − =ç ÷ −ç ÷ 15n 15n è 5 ø è 3 ø
n
n
n
1 Fie seriile cu termenii generali vn = æç ö÷ şi tn = æç 1 ö÷ , n ≥ 1 è 5ø è3ø ∞
Seria
åv n =1
n
este convergentă şi are suma
convergentă şi are suma
1 , iar seria 4
∞
åt n =1
n
este
1 . Din proprietăţile seriilor convergente rezultă 2
că, dacă două serii, respectiv
∞
åv n =1
şi
n
n =1
∞
V şi T , atunci seria diferenţă
∞
åt
å (v n =1
n
n
sunt convergente şi au sumele
− tn ) este o serie convergentă şi are
suma V-T . Deci
3n − 5 n 1 1 1 = − =− å n 15 4 2 4 n =1 ∞
CRITERIUL GENERAL DE CONVERGENŢĂ AL LUI CAUCHY (CGCC)
Seria
åa
n
este convergentă dacă şi numai dacă , oricare ar fi
ε > 0 , există N (ε ) astfel încât , oricare ar fi n ≥ N (ε ) şi oricare ar fi p ∈ N * avem : | a n +1 + a n + 2 + Κ + a n + p |< ε DEMONSTRAŢIE : (i) Presupunem că seria
åa
n
este convergentă, deci (Sn) este
convergent şi conform teoremei de convergenţă a lui Cauchy, (Sn) este un
şir fundamental. Rezultă astfel că oricare ar fi ε > 0 , există N (ε ) astfel încât , oricare ar fi n ≥ N (ε ) şi oricare ar fi p ∈ N * avem : S n + p − S n < ε Sn+p = a1 + a2 + … + an + an+1 + … + an+p Sn = a1 + … + an Deci | a n +1 + a n + 2 + Κ + a n + p |< ε . (ii) Presupunem că oricare ar fi ε > 0 , există N (ε ) astfel încât , oricare ar fi n ≥ N (ε ) şi oricare ar fi p ∈ N * rezultă că | an+1 + an+2 + Κ + an+ p |< ε , adică S n + p − S n < ε . De aici rezultă că Sn este un şir fundamental şi conform teoremei de convergenţă a lui Cauchy, Sn este un şir convergent. a n este convergentă. Astfel am demonstrat că seria
å
4.5. Serii cu termeni pozitivi ∞
DEFINIŢIA 4.5.1. : Seria
åa n =1
n
este o serie cu termeni pozitivi
( stp ) , dacă an>0, n =1, 2, … . CRITERII DE COMPARAŢIE PENTRU SERII CU TERMENI POZITIVI
În acest paragraf vom prezenta câteva criterii de convergenţă a unei serii cu termeni pozitivi. Se compară seria a cărei natură este necunoscută cu o serie a cărei natură o cunoaştem şi astfel putem obţine informaţii despre natura seriei considerate. De aici denumirea de criterii de comparaţie. I.
Primul criteriu de comparaţie :
Fie
åa
n
şi
åb
n
două serii cu termeni pozitivi. Dacă există N
astfel încât oricare ar fi n ≥ N Þ a n ≤ bn atunci : 1. dacă
åb
n
convergentă.
este convergentă, atunci şi seria
åa
n
este
åa
2. dacă
n
este divergentă, atunci că şi seria
divergentă.
DEMONSTRAŢIE : 1. Din ipoteză ştim că
åb
n
åb
n
este
este convergentă şi, conform criteriului
general de convergenţă al lui Cauchy, oricare ar fi ε > 0 , există N (ε ) astfel încât , oricare ar fi n ≥ N (ε ) şi oricare ar fi p ∈ N * rezultă că
| bn+1 + bn+2 + Κ + bn+ p |< ε . Deoarece bn > 0 , avem bn+1 + bn+2 + Κ + bn+ p < ε .
(n ∈ N ) , avem :
Deoarece şi a n > 0 ,
*
a n +1 + a n +2 + Κ + an + p = a n+1 + a n+ 2 + Κ + a n + p ≤ bn +1 + bn + 2 + Κ + bn + p < ε şi prin urmare seria 2.
åa
Presupunem contrariul, adică
conform 1. rezultă că şi că II.
åa
este convergentă.
n
n
åa
n
åb
n
este convergentă, atunci,
este convergentă, ceea ce contrazice ipoteza
este divergentă.
Al doilea criteriu de comparaţie :
Fie
åa
n
şi
åb
n
două serii cu termeni pozitivi. Dacă există N
astfel încât oricare ar fi n ≥ N Þ 1. dacă
åb
n
a n +1 bn +1 ≤ , atunci : an bn
este convergentă, atunci şi seria
convergentă. a n este divergentă, atunci şi seria 2. dacă
å
divergentă.
åa
n
åb
n
este este
DEMONSTRAŢIE : a n +1 bn +1 a a ≤ Þ n +1 ≤ n oricare ar fi n ≥ N an bn bn +1 bn a a a Obţinem astfel : c = N ≥ N +1 ≥ Λ ≥ n ≥ Λ , unde “c” este o bN bN +1 bn constantă.
1.
Deci c ≤ a n , oricare ar fi n ≥ N Þ a n ≤ cbn . bn
åb
Din ipoteză ştim că
P6 rezultă că şi că seria
å cb
n
n
este convergentă şi conform proprietăţii
este convergentă.
Din aceste ultime două afirmaţii rezultă, conform primului criteriu a n este convergentă.
å
2. Presupunem contrariul, adică
åb
n
este convergentă şi
åa
n
este divergentă, lucru care este in contradicţie cu primul criteriu. Rezultă astfel că seria bn este divergentă.
å
III.
Al treilea criteriu de comparaţie: ( fără demonstraţie )
åa
Fie
n
şi
åb
n
două serii cu termeni pozitivi. Dacă lim an = c n →∞
( c fiind finit şi diferit de zero ), atunci seriile aceeaşi natură.
åa
n
şi
bn
åb
n
au
SERII UTILIZATE ÎN CRITERII DE COMPARAŢIE ∞
1. Seria armonică :
1
ån
. Aceasta este o serie divergentă.
n =1
∞
2. Seria geometrică :
år n =0
n
ì0 < r < 1 Þ serie convergent a
, r>0 , ïí
3. Seria armonică generalizată :
ï r ≥ 1 Þ serie divergenta î ∞
1
å nα
,α ∈ R .
Există mai multe
n =1
situaţii : a) α ∈ (0,1) Þ 1α > 1 Þ conform n n generalizată este divergentă.
criteriului
I
,
seria
armonică
∞
b) α = 1 Þ å 1 Þ este seria armonică şi este divergentă. n =1
n
∞
1 1 1 1 1 1 1 = 1+ α + α + α + α + α + α +Κ α 2 3 4 5 6 7 n =1 n
c) α > 1 Þ å
1 1 1 1 2 1 + α < α + α = α = α −1 α 2 3 2 2 2 2 1 1 1 1 4 1 1 æ 1 ö + α + α + α < α = α −1 = = ç α −1 ÷ α 2 4 5 6 7 4 4 (2α −1 ) è 2 ø
2
2
∞
1 1 æ 1 ö < 1 + α −1 + ç α −1 ÷ + Λ å α 2 è2 ø n =1 n
. Dar membrul drept al inegalităţii
reprezintă o serie geometrică cu raţia r = α1−1 , 0 < r < 1 ,deci este o 2
serie convergentă. Conform criteriului I , seria
∞
1
å nα
, α > 1 este convergentă .
n =1
În concluzie, seria armonică generalizată este : ìconvergenta pentru α > 1 ï í ïdivergenta î
pentru α ≤ 1
EXEMPLU : Să se studieze natura seriilor : ∞ 1 1. å n =1 2n + 1 ∞ 1 1 Vom nota cu an = 1 . Fie seria å unde vom nota bn = . n 2n + 1 n =1 n ∞ a 1 1 este divergentă . lim n = Þ conform criteriului III , seria å n →∞ b 2 n =1 2n + 1 n 2.
an =
1 2n + 5n + 7 3
;
1 1 < 3 2n + 5n + 7 n 3
1 1 . Observăm că seria å 3 este o serie armonică 3 n n generalizată convergentă, întrucât α = 3 . an este convergentă. Conform criterului I , seria Notăm bn =
å
3.
an = (n 3 − n )
−
1 4
=
Notăm b = 1 n 3
1 4
n3 − n
.
1
>
4
n3
1
=
3
n4
åb
Observăm că
n
n4
este o serie armonică
generalizată divergentă, întrucât α = 3 . Conform criteriului I , seria
åa
4
n
este divergentă.
CRITERII SUFICIENTE DE CONVERGENŢĂ A SERIILOR CU TERMENI POZITIVI I.
Criteriul rădăcinii ( Cauchy ) :
Fie
åa
n
o serie cu termeni pozitivi.
1. Dacă pentru oricare n ≥ N , există 0 < k < 1 astfel încât n
a n ≤ k , atunci seria
åa
n
este convergentă.
2. Dacă pentru o infinitate de termeni
n
a n ≥ 1 , atunci
divergentă.
åa
n
este
DEMONSTRAŢIE : 1.
Oricare ar fi n ≥ N , există 0 < k < 1 astfel încât n an ≤ k .
å k este o serie geometrică cu raţia r = k 1 , seria å a
1) pentru k < 1 , seria
n
este convergentă
2)
n
este divergentă
3) pentru k = 1 este neconcludent. EXEMPLU : n
æ 2n + 5 ö , æ 2n + 5 ö an = ç ç ÷ ÷ å − 3 n 10 ø è 3n − 10 ø n =1 è ∞
Fie seria
n
Aplicând criteriul rădăcinii, rezultă că
n
an =
deci seria este convergentă.
2n + 5 2 → < 1, 3n − 10 3
OBSERVAŢIE : Nu putem studia convergenţa seriei geometrie cu ajutorul criteriului raportului pentru că în demonstraţia criteriului raportului am folosit seria geometrică. EXEMPLU : Fie seria
1 1 1 1 1 1 + 2 + 3 + 4 + Κ + 2 n −1 + 2 n + Κ 1 2 3 2 3 2 3
Această serie este convergentă , fapt care rezultă din criteriul rădăcinii, dar nu putem aplica criteriul raportului. II.
Criteriul raportului ( D’Alembert ) :
Fie
åa
1.
Dacă pentru oricare n ≥ N avem
n
o serie cu termeni pozitivi.
a n +1 ≤ k < 1 , atunci seria an
este convergentă. 2. Dacă
an +1 ≥ k > 1 , atunci seria an
DEMONSTRAŢIE : 1. Oricare ar fi n ≥ N avem :
åa
n
este divergentă.
a n +1 ≤ ka n a N +1 ≤ ka N a N + 2 ≤ ka N +1 ≤ k 2 a N …………………… ∞
aN + p ≤ k paN
∞
aN k p = aN
p =1
kp
p =1
…………………… Seria pe care o obţinem este o serie geometrică de raţie “r” : ∞
åa p =1
∞
N
k p = a N å k p . Această serie este convergentă. Rezultă astfel, p =1
conform criterului I de comparaţie că seria
åa
n
este convergentă.
2. an +1 ≥ k > 1 an
a N +1 ≥ a N …………
a n +1 ≥ a n , oricare ar fi n ≥ N . Rezultă că şirul an este un şir crescător de numere pozitive Þ lim a n ≠ 0 . Deci a n este divergentă.
å
n→ ∞
COROLAR : Fie lim n →∞
a n +1 = k . Atunci : an
åa pentru k > 1 , seria å a
1) pentru k < 1 , seria
n
este convergentă.
2)
n
este divergentă.
3) pentru k = 1 este neconcludent. DEMONSTRAŢIE : 1) lim n →∞
a n +1 =k 0 astfel încât k + ε < 1 | ( 0 k −ε
Vε ( k ) = (k − ε , k + ε )
| k
)
k +ε
| 1
Deoarece lim a n+1 = k , înseamnă că oricare ar fi vecinătatea V ε (k ) , n→∞ a n în afara ei există cel mult un număr finit de termeni ai şirului, iar în interiorul ei există o infinitate de termeni. a n +1 a ∈ Vε ( k ) Þ n +1 < 1 conform părţii întâi a criteriului raportului. an an Deci seria
åa
n
este convergentă.
a n +1 =k >1 n →∞ a n V(k) = (1, ∞ ) . Repetând raţionamentul de mai sus, demonstrăm că
2) lim
seria
åa
n
este divergentă.
3) În cazul în care k = 1 , nu putem trage nici o concluzie, deoarece există situaţii în care seria este convergentă şi situaţii în care seria este divergentă. De exemplu : 1 Ø å an = å Þ lim an +1 = lim n = 1 , dar ştim că seria este n →∞ a n→ ∞ n + 1 n n divergentă. α 1 Ø å a n = å α , (α > 1) Þ lim a n+1 = lim n α = 1 , iar seria n →∞ (n + 1) n →∞ a n n este convergntă. EXEMPLE : 1)
∞
2n
å (n + 1)!+(n + 3)! Þ n =0
=
a n +1 2 n +1 ( n + 1)!+( n + 3)! = ⋅ = an (n + 2)!+( n + 4)! 2n
2(( n + 1)! )(1 + ( n + 2)( n + 3)) 2(1 + n 2 + 5n + 6) = →0 (n + 2)! (1 + ( n + 3)( n + 4)) (n + 2)(1 + ( n + 3)( n + 4))
Deci lim a n+1 = 0 şi n→∞ a n convergentă. 2)
conform criteriului raportului, seria este
n
a n +1 α n +1 ( n + 1)! n n α n ⋅ n! α æ n ö Þ = ⋅ n = αç ÷ → å n +1 n α ⋅ n! n an ( n + 1) e è n +1ø n =1 Dacă α > 1 Þ α > e , seria este divergentă. ∞
e α Dacă < 1 Þ α < e , seria este convergentă. e 1 1 n n a n e α æ ö n Dacă = 1 Þα = e Þ an = eç = Þ n+1 > 1, ÷ =e n n (n +1) æ 1 ö e an è n +1ø ç1+ ÷ è nø deci (a n ) este şir strict crescător, iar seria este divergentă. Rezultă că seria dată este divergentă.
3)
∞
an , a>0 å n =1 n!
un +1 a n +1 n! 1 = lim n ⋅ = a lim = 0 < 1 , deci seria este n →∞ n + 1 n →∞ a n→∞ u ( n + 1)! n convergentă conform criteriului raportului. lim
4)
∞
n
æaö n! ç ÷ , a > 0 å ènø n =1
un +1 = lim n →∞ u n →∞ n
lim
a n +1 n a ( n + 1) n +1 æ n + 1ö = lim a ç ÷ = n →∞ n e an è ø n! n n
( n + 1)!
a < 1 Þ a < e , seria este convergentă. e a Dacă > 1 Þ a > e , seria este divergentă. e Dacă
n
e Dacă a = 1 Þ a = e Þ un = n! æç e ö÷ . Atunci un +1 = > 1, n e ènø un æ n + 1ö ç ÷ è n ø oricare ar fi n , deci seria este divergentă. III.
Criteriul Raabe – Duhamel :
Fie
åa
n
o serie cu termeni pozitivi.
1. Dacă oricare ar fi n ≥ N , næç a n − 1ö÷ ≥ k > 1 Þ seria este ÷ ça ø è n +1 convergentă. 2. Dacă oricare ar fi n ≥ N , næç a n − 1ö÷ ≤ k < 1 Þ seria este ÷ ça ø è n +1 divergentă. COROLAR :
æ a
ö
Dacă lim n çç n − 1÷÷ = k , atunci : n →∞ è a n +1 ø
åa pentru k < 1 , seria å a
1) pentru k > 1 , seria
n
este convergentă
2)
n
este divergentă
3) pentru k = 1 este neconcludent. EXEMPLU : Fie seria :
∞
n!
å α (α − 1) Κ (α + n − 1)
(α > 0)
n =1
an n!α (α − 1)Κ (α + n − 1)(α + n ) α +n α −1 −1 = −1 = −1 = an +1 α (α + 1)Κ (α + n − 1)(n + 1)! (n + 1) n +1 n +1
æ a ö n (α − 1) lim n çç n − 1÷÷ = lim = α −1 n→∞ è a n +1 ø n→∞ n + 1
1) pentru α − 1 > 1 Þ α > 2 , seria este convergentă 2) pentru α − 1 < 1 Þ α < 2 , seria este divergentă 3) pentru α − 1 = 1 Þ α = 2, criteriul este neconcludent. ∞
∞
n!
1
å 2 ⋅ 3 ⋅ Κ ⋅ (n + 1) = å n + 1 , n =1
aceasta fiind serie armonică, este
n =1
divergentă. 4.6.
Serii alternate ∞
DEFINIŢIA
1.6.1.
:
Seria
åa n =1
n
se numeşte alternată dacă
produsul a doi termeni consecutivi este negativ , adică an ⋅ an+1 < 0, (∀)n∈N* Seria altenată poate avea forma :
(a n > 0) − a 2 n −1 + a 2 n − Κ , (a n > 0 )
a1 − a 2 + a 3 − a 4 + Κ + a 2 n−1 − a 2 n + Κ ,
− a1 + a 2 − a 3 + a 4 − Κ În general putem scrie seria astfel :
∞
å (− 1) n =1
n +1
an ,
(an > 0) .
CRITERIUL LUI LEIBNITZ
Fie
∞
å (− 1)
n +1
a n o serie altrenată. Dacă sunt îndeplinite condiţiile :
n =1
a n > a n +1 ( adică şirul termenilor fără semn este descrescător ) 2. lim a n = 0 1.
n →∞
atunci seria
∞
å (− 1)
n +1
a n este o serie convergentă.
n =1
DEMONSTRAŢIE : Presupunem că avem a1 − a 2 + a 3 − a 4 + Κ + a 2 n −1 − a 2 n + Κ
S 2 n = a1 − a 2 + a3 − a 4 + Κ + a 2 n−1 − a2 n + Κ S 2 n + 2 = S 2 n + a 2 n +1 − a 2 n + 2 Deoarece a 2 n +1 > a2 n + 2 Þ S 2 n +2 > S 2 n Þ S 2 n este un subşir strict crescător. Arătăm în continuare că S2n este un subşir mărginit superior.
S 2 n = a1 − (a 2 − a3 ) − (a 4 − a5 ) − Κ − (a2 n −2 − a 2 n −1 ) − a 2 n Þ S 2 n < a1 , deci { 14 2 43 14 2 43 1 44 2 4 43 >0
>0
>0
>0
S2n este mărginit superior. Fie
S = lim S 2 n
üï S 2 n = lim S 2 n −1 − lim a2 n Þ lim S n = S Þ ý Þ lim n →∞ n →∞ n→∞ n→∞ 14 2 43 123 = S 2 n −1 − a2 n ï þ 1 2= S 3 =S =0 n →∞
S2n
seria este convergentă. EXEMPLU : Să se studieze convergenţa seriei
∞
å (−1) n =1
n
log a n , a > 1. n
log a x Fie funcţia f ( x ) = , x ∈ [1, ∞ ) x x 1 − log a x − log a x log a e − log a x = ln a 2 = f ' ( x ) = x ln a 2 x x x2 Ştim că a>1 , deci funcţia log a x este crescătoare. Din relaţia de
mai sus, rezultă că f ' ( x ) < 0 , oricare ar fi x > e . Deci f ( x ) este log a n este descrescătoare pentru descrescătoare pe intervalul (e, ∞ ) şi n log n orice n > e , n ∈ N . De asemenea, lim a = 0. Conform criteriului lui n→∞ n Leibnitz, seria este convergentă. 4.7. Serii absolut convergente
Fie
åa
n
o serie numerică.
DEFINIŢIA 4.7.1. : Seria seria valorilor absolute
åa
n
åa
n
este abslut convergentă dacă
este convergentă.
TEOREMA convergentă.
4.7.1.
:
DEMONSTRAŢIE : Din ipoteză ştim că seria
Orice serie absolut convergentă este
åa
n
este absolut convergentă. Conform
criteriului general de convergenţă al lui Cauchy, oricare ar fi ε > 0 , există N (ε ) astfel încât , oricare ar fi n ≥ N (ε ) şi oricare ar fi p ∈ N * rezultă că a n +1 + a n + 2 + Κ + a n + p < ε ⇔ a n +1 + a n + 2 + Κ + a n + p < ε Seria
åa
n
este convergentă deoarece :
a n +1 + a n + 2 + Κ + a n + p ≤ a n +1 + a n + 2 + Κ + a n + p < ε oricare ar fi n ≥ N (ε ) şi oricare ar fi p ∈ N * . OBSERVAŢIE : Reciproca, în general, nu este adevărată ( nu orice serie convergentă este şi absolut convergentă ) . EXEMPLU : ∞
1 este convergentă . n n =1 ∞ ∞ 1 1 Ø Seria å (− 1)n +1 = å este seria armonică şi este divergentă. n n =1 n n =1 Ø Seria
å (− 1)
n +1
DEFINIŢIA 4.7.2. : O serie convergentă care nu este absolut convergentă se numeşte semiconvergentă. OBSERVAŢIE : Într-o serie cu termeni pozitivi, notiunile de convergenţă şi absolut convergenţă coincid. CRITERIU DE ABSOLUT CONVERGENŢĂ
Fie
åa
n
şi
åb
n
, două serii numerice. Dacă există N astfel încât
oricare ar fi n ≥ N , să avem a n ≤ bn absolut convergentă şi seria
åa
n
(*) , atunci dacă
este absolut convergentă.
åb
n
este
DEMONSTRAŢIE : Dacă bn este o serie absolut convergentă, din criteriul general de
å
convergenţă al lui Cauchy rezultă că oricare ar fi ε > 0 , există N (ε ) astfel încât, oricare ar fi n ≥ N (ε ) şi oricare ar fi p ∈ N * , există relaţia : bn +1 + bn +2 + Κ + bn + p < ε ⇔ bn +1 + bn +2 + Κ + bn + p < ε .
(*)
an+1 + an+2 + Κ + an+ p = an+1 + an+2 + Κ + an+ p ≤ bn+1 + bn+2 + Κ + bn+ p < ε , oricare ar fi n ≥ N (ε ) şi oricare ar fi p ∈ N * . Rezultă astfel că seria
åa
n
este abslut convergentă.
TEOREMA LUI ABEL ( pentru serii numerice ) : Fie
åa
n
o serie numerică şi fie ( Sn ) şirul sumelor parţiale care este
mărginit. Fie şirul de numere α n , (α n > 0) , (α n ) fiind convergent către zero şi descrescător. Atunci seria å α n an este convergentă. DEMONSTRAŢIE : Din ipoteză ştim că ( Sn ) este un şir mărginit. Sn = a1 + a2 + … + an S n ≤ M ( M > 0 ) , (∀ ) n ∈ N * Tot din ipoteză ştim că (α n ) → 0 , α n > 0, α n descrescător n →∞
Þ că
oricare ar fi ε > 0 , există N (ε ) astfel încât , oricare ar fi n ≥ N (ε ) ,
αn − 0 <
ε ε . Þ αn < 2M 2M
În continuare vom aplica seriei
åα a n
n
criteriul general de
convergenţă al lui Cauchy: Oricare ar fi ε > 0 , există N (ε ) astfel încât , oricare ar fi
n ≥ N (ε ) şi oricare ar fi p ∈ N * , există relaţia :
α n+1an+1 + α n+2 an+ 2 + Κ + α n+ p−1an+ p −1 + α n + p an+ p < ε
α n +1an+1 + α n +2 an +2 + Κ + α n + p −1an + p −1 + α n+ p an + p =
= αn+1 (Sn+1 − Sn ) + αn+2 (Sn+2 − Sn+1 ) +Κ + αn+ p−1 (Sn+ p−1 − Sn+ p−2 ) + αn+ p (Sn+ p − Sn+ p−1 ) =
= − αn+1Sn + (αn+1 −αn+2 )Sn+1 + Κ + (αn+ p−1 −αn+ p )Sn+ p−1 + αn+ p Sn+ p ≤
≤ S n α n +1 + S n +1 (α n +1 − α n +2 ) + Κ + S n + p −1 (α n + p −1 − α n + p ) + S n + p α n + p ≤ ≤ M (α n +1 + α n +1 − α n +2 + α n +2 − α n +3 + Κ + α n + p −1 − α n + p + α n + p ) = = 2α n +1 M ≤
2εM =ε 2M
Rezultă că seria
åα a n
n
este convergentă.
4.8.Şiruri de funcţii
Fie f n : A → B ,
n ∈ N * , funcţii reale definite pe mulţimea
A∈ R . DEFINIŢIA 4.8.1. : Şirul f1 , f2 , … , fn , … se numeşte şir de funcţii şi se notează cu ( f n )n∈N * ( 1 ) . OBSERVAŢIE : Oricare ar fi a ∈ A , obţinem şirul de numere f1(a), f2(a), …, fn(a) pe care-l notăm : ( f n (a ))n∈N * ( 2 ) . DEFINIŢIA 4.8.2. : Punctul x ∈ A se numeşte punct de convergenţă al şirului de funcţii ( 1 ) , dacă şirul ( f n ( x ))n∈N * este convergent. Fie B ⊂ A, B = {x ∈ A | ( f n ( x ))n∈N * DEFINIŢIA 4.8.3. : Mulţimea convergenţă a şirului de funcţii ( 1 ) . Fie x ∈ B . Notăm f ( x ) = lim f n ( x ) n →∞
este convergent}
(3)
B se numeşte mulţimea de ( 4) .
DEFINIŢIA 1.8.4. : Funcţia f : B → R care verifică relatia de mai sus se numeşte funcţia limită a şirului de funcţii ( 1 ) . EXEMPLU : Fie funcţia f n : R → R , f n ( x ) = x n . Evident, B = ( -1 , 1 ] .
ì0, x ∈ (− 1,1) f (x ) = í î1, x = 1
Þ f : B → R este funcţia limită.
Fie f n : A → B , n ∈ N * un şir de funcţii. Fie mulţimea B ⊂ A . DEFINIŢIA 4.8.5. : Şirul de funcţii
( f n )n∈N
*
converge simplu
către funcţia f pe mulţimea B, dacă oricare ar fi ε > 0 şi oricare ar fi x ∈ B , rezultă că există N (ε , x ) astfel încât oricare ar fi n ≥ N (ε , x ) ,
f n (x ) − f (x ) < ε
(1) .
Vom nota cu f n
cs
→f
, unde “cs” înseamnă “converge simplu” .
B
DEFINIŢIA 4.8.6. : Şirul de funcţii
( f n )n∈N
*
converge uniform
către funcţia f pe mulţimea B, dacă oricare ar fi ε > 0 , există N (ε , x )
astfel încât oricare ar fi n ≥ N (ε , x ) şi oricare ar fi x ∈ B , rezultă că
f n (x ) − f (x ) < ε
( 1’ ) .
Vom nota cu fn
cu
→f
, unde “cu” înseamnă “converge uniform” .
B
Interpretarea geometrică a convergenţei uniforme este prezentată în figura de mai jos :
f n , n ≥ N (ε )
- f +ε -f - f −ε a
b
OBSERVAŢIE : Dacă fn
cu
cs
B
B
→f , atunci f n → f . Reciproca nu
este adevărată. EXEMPLUL 1 :
f n : (− 1,1] → R ,
ì0, x ∈ (− 1,1) î1, x = 1
f n (x ) = x n Þ f (x ) = í cs
lim f n = f . Observăm că f n → f , dar nu este uniform n →∞ ( −1,1]
convergent. EXEMPLUL 2 :
f n : [0,2π ] → R ,
f n (x ) =
sin nx , (∀)n ∈ N * n
B = [0,2π ]
f ( x ) = 0 , (∀) x ∈ B . Fie şirul : 1 1 xn = , xn → 0 Þ (∀)ε > 0, (∃)N(ε ) astfel incat(∀)n ≥ N(ε ) Þ xn − 0 < ε ⇔ < ε → ∞ n n n sin nx 1 (∀)n ≥ N (ε ) , f n ( x ) − f ( x ) = − 0 ≤ < ε , (∀) x ∈ B . n n OBSERVAŢIE : Pentru convergenţa simplă se aplică criteriile obişnuite de convergenţă a şirurilor de numere. CRITERII DE CONVERGENŢĂ UNIFORMĂ I.
Primul criteriu de convergenţă uniformă ( criteriul lui Cauchy ):
Fie f n : A → B , n ∈ N * un şir de funcţii. Fie mulţimea B ⊂ A . Şirul fn
cu
→f B
dacă şi numai dacă , oricare ar fi ε > 0 , există
N (ε ) astfel încât oricare ar fi n ≥ N (ε ) , oricare ar fi m ≥ N (ε ) şi oricare ar fi x ∈ B , rezultă : f m ( x ) − f n ( x ) < ε (1)
DEMONSTRAŢIE : 1) Necesitatea : cu
Presupunem
că
fn →f Þ (∀)ε > 0, (∃) N (ε ), B
(∀)n ≥ N (ε ), (∀) x ∈ B , f n ( x ) − f ( x ) <
ε 2
astfel
încât,
(2).
Pentru m ≥ N (ε ) , avem relaţia f m ( x ) − f ( x ) <
ε 2
(2’)
ε ε fm (x) − fn (x) = fm (x) − f ( x) + f (x) − fn (x) ≤ fm (x) − f (x) + f (x) − fn (x) < + = ε 2 2 oricare ar fi n ≥ N (ε ) , oricare ar fi m ≥ N (ε ) şi oricare ar fi x ∈ B . 2) Suficienţa :
Presupunem că (∀)ε > 0, (∃)N (ε ), astfel încât, (∀)n ≥ N (ε ), (∀) x ∈ B Þ Þ f m ( x ) − f n ( x) < ε Prin urmare şirul de numere f n ( x ) este un şir
fundamental şi deci şirul ( f n )n∈N * este convergent. Fie f : B → R limita şirului
( f n )n∈N
cs
*
,
f n → f . Vom demonstra B
în continuare că această convergenţă este uniformă. Fie n ≥ N (ε ) , fixat, ales arbitrar . Deoarece f n
cs
→ f , înseamnă că B
este adevărată relaţia : cs
f n − f n → f − f n Þ (∀)n ≥ N (ε ), (∀) x ∈ B, f m ( x) − f n ( x) < ε . B
Trecem la limită când n → ∞ . Vom avea : | f ( x ) − f n ( x ) |< ε . Deoarece n este ales arbitrar, îl putem înlocui cu “n “ şi obţinem : cu
f ( x ) − f n ( x ) < ε , (∀) x ∈ B Þ fn →f B
II.
Al doilea criteriu de convergenţă uniformă:
Fie f n : A → R . Fie şirul numeric (a n )n∈N * , de numere pozitive,
convergent către zero. Fie B ⊂ A .
Dacă există f : B → R astfel încât f n ( x ) − f ( x ) ≤ a n , oricare ar fi n ∈ N * Þ fn
cu
→f . B
DEMONSTRAŢIE : Fie ε > 0 . Deoarece
lim a n = 0 Þ (∃) N (ε ) n →∞
astfel
încât
(∀)n ≥ N (ε ), a n − 0 < ε . Dar a n > 0 , deci a n < ε . Pentru (∀)n ≥ N (ε ), (∀) x ∈ B Þ f n ( x ) − f ( x ) ≤ a n < ε . demonstrează faptul că fn
Aceasta
cu
→f . B
CONTINUITATEA ŞI CONVERGENŢA UNIFORMĂ
Fie funcţia f : A → R .
dacă :
DEFINIŢIA 4.8.7. : Funcţia f este continuă în punctul a ∈ A 1) există lim f ( x ) x→ a
2) lim f ( x) = f (a ) x→a
DEFINIŢIA 4.8.8. : Funcţia f este continuă în punctul a ∈ A dacă oricare ar fi ε > 0 , există o vecinătate V(a) astfel încât oricare ar fi x ∈ V (a ) ∩ A Þ f ( x ) − f (a ) < ε . Cele două definiţii sunt echivalente. cu
TEOREMA 4.8.1. : Fie şirul fn →f ( mulţimea B fiind inclusă B
în mulţimea A ) . Dacă toate funcţiile fn sunt continue în punctul a ∈ B , atunci şi funcţia limită f este continuă în punctul “a” . DEMONSTRAŢIE :
cu
Din ipoteză ştim că
fn →f Þ (∀)ε > 0, (∃) N (ε ), astfel încât, B
(∀)n ≥ N (ε ), (∀) x ∈ B , f n ( x ) − f ( x ) <
ε . 3
(1)
ε . (2) 3 Tot din ipoteză ştim faptul că funcţiile fn sunt continue în x = a , deci şi funcţia fN este continuă în punctul x = a , şi prin urmare, oricare ar fi ε > 0 , există vecinătatea V(a) astfel încât oricare ar fi x ∈V (a ) ∩ B Þ ε . (3) f N ( x ) − f N (a ) < 3 (∀)x∈V(a) ∩B,(∀)ε > 0, f (x) − f (a) = f (x) − fN (x) + fN (x) − fN (a) + fN (a) − f (a) ≤ În cazul particular x = a , obţinem relaţia f n (a ) − f ( a ) <
ε ε ε ≤ f (x) − fN (x) + fN(x) − fN (a) + fN (a) − f (a) < + + = ε 1 44 2 4 43 1 44 2 4 43 1 44 2 4 43 3 3 3 ε = (1) 3
ε = (3) 3
ε = (2) 3
DERIVABILITATE ŞI CONVERGENŢĂ UNIFORMĂ
TEOREMA 4.8.2. : Fie I un interval mărginit şi fie şirul de funcţii f n : I → R derivabile pe intervalul I n ∈ N * . Dacă sunt îndeplinite condiţiile : 1) există x0 ∈ I astfel încât şirul ( f n ( x0 ))n∈N * este convergent
(
)
cu
2) există g : I → R astfel încât f n' → g I
cu
atunci : 1) există funcţia f : I → R astfel încât f n → f 2)
f ' (x ) = g (x ), (∀) x ∈ I .
I
OBSERVAŢIE : Convergenţa uniformă a şirului fn nu atrage după sine convergenţa uniformă a şirului derivatelor. EXEMPLU :
cosnx , (n ∈ N* ) . n Vom arăta că fn este un şir convergent uniform pe acest interval.
Fie intervalul I = [0,2π ] . Fie f n : I → R , f n ( x) =
f (x ) = 0 , x ∈ I . f n (x ) − f (x ) =
cos nx 1 . Conform criteriului II de convergenţă ≤ n n cu
uniformă, rezultă că f n → f . I
f n' ( x ) = − sin nx . Fie x = π æπ ö n = 1 Þ f1' ç ÷ = − sin = −1 2 è2ø æπ ö n = 2 Þ f 2' ç ÷ = − sin π = 0 è2ø
π ∈I . 2 3π æπ ö n = 3 Þ f 3' ç ÷ = − sin =1 2 è3ø 4π æπ ö n = 4 Þ f 4' ç ÷ = − sin =0 2 è2ø
Obţinem şirul -1, 0, 1, 0 , -1, … , deci nu este un şir convergent. TEOREMA 4.8.3. : Fie f n [a, b] → R , n ∈ N * un şir de funcţii, cu
fn → f [ a ,b ]
1) 2) 3)
. Dacă fn sunt integrabile pe intervalul [a, b], atunci : funcţia limită f este integrabilă pe intervalul [a, b]
ò f ( x )dx este convergentă lim ò f ( x )dx = ò f ( x )dx b
a
n
b
n→∞ a
b
n
a
OBSERVAŢIE : Teorema 4.8.2. se mai numeşte şi “teorema de derivare termen cu termen a unui şir de funcţii” , iar teorema 4.8.3. se mai numeşte şi “teorema de integrare termen cu termen a unui şir de funcţii” . 4.9.
Serii de funcţii
(
)
Fie f n : A → R , n ∈ N * , un şir de funcţii. DEFINIŢIA 4.9.1. : Suma (1) f 1 + f 2 + Κ + f n + Λ = se numeşte serie de funcţii. OBSERVAŢII :
∞
åf n =1
n
∞
åf
1) Oricare ar fi a ∈ A , seriei
n =1
numere
n
îi corespunde o serie de
∞
å f (a ) = f (a ) + f (a ) + Κ + f (a ) + Κ n
1
n
2
(2) .
n =1
Dacă seria numerică (2) este convergentă, atunci spunem că punctul “a” este un punct de convergenţă a seriei de funcţii (1) . 1) O serie de funcţii este echivalentă cu o familie de serii de numere ( fiecărui a ∈ A îi corespunde o serie de numere ) . 2) Unei serii de funcţii îi putem aplica rezultatele de la serii de numere şi de la şiruri de funcţii. Astfel, notăm : S1 = f1 S2 = f1 + f2 …………………… Sn = f1 + f2 + … + fn
(3)
unde Sn reprezintă suma parţială de ordinul n a seriei de funcţii
(1) (S n )n∈N *
DEFINIŢIA 4.9.2. : Seria de funcţii (1) ,
åf
n
, este convergentă
pe B ⊂ A dacă şirul de funcţii ( Sn ) este convergent pe multimea B . DEFINIŢIA
4.9.3.
: Seria de funcţii
convergentă în punctul a ∈ A dacă
åf
n
este absolut
å f (a ) este absolut convergentă. n
DEFINIŢIA 4.9.4. : Mulţimea de convergenţă B ⊂ A a unei serii de funcţii este B = {a ∈ A | å f n (a ) este convergent a} . EXEMPLE : (1)
∞
åe
− nx
n =0
, f n ( x ) = e − nx ,
fn : R → R
x < 0 : lim f n ( x ) = lim e − nx = +∞ , n →∞
n→∞
åf
n
este divergentă .
x = 0 :
f n (0) = 1 , S n (0) = n + 1 , lim S n (0) = +∞ , n →∞
åf
n
este
divergentă . n
x>0: r=
1 æ1 ö f n ( x ) = nx = ç x ÷ , e èe ø
n
æ1 ö å çè e x ÷ø este serie geometrică cu raţia
1 < 1 , deci este o serie convergentă. ex
Rezultă că mulţimea de convergenţă este B = (0, ∞ ) . ∞
(2)
å n =1
(x + 1)n n ⋅ 2n
, f n (x ) =
(x + 1)n n ⋅ 2n
, fn : R → R
Din criteriul raportului, obţinem :
lim
n →∞
Ø Ø
æ ( x + 1)n +1 n ⋅ 2 n ö f n +1 ( x ) n ( x + 1) x + 1 ÷ = lim = limçç ⋅ = f n ( x ) n→∞è (n + 1)2 n +1 ( x + 1)n ÷ø n→∞ 2(n + 1) 2 x +1 x +1 < 1 Þ −1 < < 1 Þ x ∈ (− 3,1) , seria este convergentă. 2 2 x +1 > 1 Þ x ∈ (− ∞,−3) ∪ (1, ∞ ) , seria este divergentă. 2
1 , serie armonică, divergentă. n (− 2)n = (− 1)n 1 , serie armonică alternată, care este Ø x = 3 Þ fn = n ⋅ 2n n Ø
x = 1 Þ fn =
convergentă.
Rezultă că mulţimea de convergenţă este [− 3,1) . DEFINIŢIA 4.9.5. : Seria
åf
n
converge simplu pe mulţimea B
către funcţia S dacă oricare ar fi ε > 0 , oricare ar fi x ∈ B , există N (ε , x )
astfel încât, oricare ar fi n ≥ N (ε , x ) , avem S n ( x ) − S ( x ) < ε .
DEFINIŢIA 4.9.6. : Seria
åf
n
converge uniform pe mulţimea
B către funcţia S dacă oricare ar fi ε > 0 , există N (ε ) astfel încât, oricare ar fi n ≥ N (ε ) , oricare ar fi x ∈ B , avem S n ( x ) − S ( x ) < ε .
DEFINIŢIA 4.9.7. : Funcţia S se numeşte suma seriei de funcţii. CRITERII DE UNIFORM CONVERGENTA A SERIILOR DE FUNCTII Criteriul Cauchy de convergenţă uniformă: Fie f n : A → R ,
n ∈ N * . Fie B ⊂ A . Seria
åf
converge
n
uniform pe mulţimea B dacă şi numai dacă oricare ar fi ε > 0 , există N (ε ) astfel încât, oricare ar fi n ≥ N (ε ) , oricare ar fi p ∈ N * , avem :
f n +1 ( x ) + f n +2 ( x ) + Κ + f n + p ( x ) < ε , oricare ar fi x ∈ B .
DEMONSTRAŢIE : Fie S n ( x ) = f1 ( x ) + f 2 ( x ) + Κ + f n ( x ) . cu
Şirul Sn → S ⇔ (∀)ε > 0, (∃)N (ε ) astfel încât : (∀)n ≥ N (ε ) şi (∀) x ∈ B Þ B
S n+ p (x ) − S n ( x ) < ε şi f n +1 ( x ) + f n +2 ( x ) + Κ + f n + p ( x ) < ε . Criteriul lui Weierstrass de convergenţă uniformă: Fie f n : A → R ,
n ∈ N * . Fie
åf
n
. Fie
åa
n
o serie cu
termeni pozitivi convergentă. Dacă oricare ar fi x ∈ B ⊂ A şi oricare ar fi n ∈ N * , f n ( x ) ≤ a n , atunci f n converge uniform pe mulţimea B .
å
DEMONSTRAŢIE : Din ipoteză ştim că
åa
n
este convergentă şi a n > 0 . Din
criteriul general de convergenţă al lui Cauchy rezultă că (∀)ε > 0, (∃) N (ε ) astfel încât (∀)n ≥ N (ε ) , (∀) p ∈ N * , avem :
a n +1 + a n + 2 + Κ + a n + p < ε Þ a n +1 + a n + 2 + Κ + a n + p < ε . fn+1( x) + fn+2( x) +Κ + fn+p ( x) ≤ fn+1( x) + fn+2( x) +Κ + fn+p ( x) ≤ an+1 + an+2 +Κ + an+p < ε şi conform criteriului de convergenţă uniformă al lui Cauchy rezultă că å f n converge uniform pe mulţimea B . EXEMPLE : 1.
åf
n
n
, f n : R → R , f n ( x ) = sin 2 x . n
(∀)n ∈ N * , (∀) x ∈ R Þ f n ( x ) =
åa
n
=
sin n x 1 ≤ 2 2 n n
1 este seria armonică generalizată, α = 2 , deci seria este n2
convergentă. Conform criteriului lui Weierstrass, f n converge uniform pe R. 2.
åf
n
, f n : R → R , f n (x ) =
Ø pentru
1 . nx
x > 1 Þ f n ( x ) = 1x n
este seria armonică generalizată
(convergentă) Ø pentru x ≤ 1 Þ seria este divergentă. 4.10. Serii de puteri Fie f n : R → R , f n ( x ) = a n x n ,
n∈N .
DEFINIŢIA 4.10.1. : Seria de funcţii
∞
åa x n=0
se numeşte serie de puteri. OBSERVAŢII :
n
n
= a0 + a1x +Κ + an xn +Κ
Ø Orice serie de puteri este o serie de funcţii, deci rezultatele obţinute la seriile de funcţii se aplică seriilor de puteri. Ø S n ( x ) = a 0 + a1 x + Κ + a n x n este un polinom de gradul n . PROPOZIŢIA 4.10.1. : Mulţimea de convergenţă a unei serii de puteri este nevidă. DEMONSTRAŢIE : Fie şirul (S n ( x ))n∈N . Pentru x = 0 , Sn(0) = a0 ;
limSn (0) = a0 Þ x = 0 ∈ B . Deci mulţimea B este nevidă. n→∞
OBSERVAŢIE : Există serii de puteri pentru care mulţimea de convergenţă este formată doar din numărul zero. ( B = {0} ) EXEMPLU :
∞
ån
Fie seria:
n
xn .
n =1
Notăm a n = n . n
Fie x0 ∈ R , ∞
ån n =1
n
x0 ≠ 0 .
x n = x0 + 2 2 x02 + 33 x03 + Κ + n n x0n + Κ
De asemenea, n n x0n ≤ (n x0 ) . n
é 1 ù Pentru n > ê ú Þ n ⋅ x0 > 1 . Rezultă că lim n n x0n ≠ 0 . Deci seria n →∞ ë x0 û este divergentă pentru orice x ≠ 0 ( vezi criteriile de convergenţă ) TEOREMA LUI ABEL PENTRU SERII DE PUTERI Pentru orice serie de puteri
åa
n
x n , există un număr R ≥ 0 astfel
încât : 1. Oricare ar fi x ∈ (− R, R ) , seria este absolut convergentă.
2. Oricare ar fi x ∈ (− ∞,− R ) ∪ (R, ∞ ) , seria este divergentă. 3. Oricare ar fi 0 < r < R , seria este uniform convergentă pentru orice x ∈ [− r , r ] .
Numărul R ≥ 0 cu proprietăţile 1. şi 2. se numeşte raza de convergenţă a seriei de puteri. DEMONSTRAŢIE : Fie B multimea de convergenţă a seriei
åa
n
xn .
Dacă B = {0} Þ R = 0 , atunci teorema este demonstrată. Dacă B ≠ {0}, atunci :
x0 ≠ 0 Þ å a n x0n
Fie x0 ∈ B ,
(*)
este convergentă, deci
lim an x0n = 0 de unde rezultă că şirul (an x0n )n∈N este mărginit. *
n →∞
(
Dacă şirul an x0n încât a n x ≤ M . n 0
)
n∈N *
este mărginit, atunci există M > 0 astfel
(
)
Consierăm x ∈ − x0 , x0 Þ x < x0 |
− x0
| 0
|
|
x0
x
xn x an x = a n x n = an x0n x0 x0 n 0
n 0
x å an x ≤ å M x 0 n 0
n
= Må
n
x ≤M x0 x x0
n
n
æ ö x este o serie geometrică convergentă ç r = < 1÷÷ , şi ç x0 è ø n an x este absolut conform primului criteriu de comparaţie, seria Dar
å
x x0
n
convergentă. Prin urmare, oricare ar fi x ∈ − x0 , x0
(
convergentă, deci convergentă. Am arătat deci că dacă
å
)
, seria este absolut
x0 ∈ B , atunci oricare ar fi
x ∈ (− x0 , x0 ) , seria este absolut convergentă. (**) Fie x1 ∉ B
0 |
( B
)
| x1
x
|
Dacă x1 ∉ B , atunci seria
åa
n n 1
x este divergentă.
Vom demonstra că oricare ar fi x astfel încât x > x1 , seria
åa
x este divergentă.
n n 1
Presupunem contrariul, adică conform (*) că seria
åa
åa
n
x n este convergentă. Rezultă
x este convergentă. Aceasta este o contradicţie
n n 1
cu ipoteza, deci seria este divergentă pentru orice punct mai mare decât x1 .
I = (a, b ) ∈ R .
Oricare ar fi M cu proprietatea se numeşte majorant al intervalului (a,b) . x ∈ (a, b ) , x < M Observaţie : Un interval (a,b) are o infinitate de majoranţi. Se numeşte supremul lui I , notat “supI “ , cel mai mic majorant. Fie
Fie R=supB . Vom arăta că R este raza de convergenţă a seriei. 1. Oricare ar fi x0 < R , rezultă conform (*) :
(− x
0
, x0 ) ∈ B Þ (∀) x ∈ (− R, R ) , seria este absolut convergentă.
2. Dacă R este infinit (R = ∞ ) , atunci punctul 2. din teorema lui Abel nu are sens. Presupunem că R este finit. Atunci : (**)
(∀) x > R Þ(∀) x ∈ (− ∞,− R ) ∪ (R, ∞ ) , seria este divergentă. Din 1. şi 2. rezultă faptul că R este raza de convergenţă a seriei.
3. Fie 0 < r < R Vom arăta că oricare ar fi x ∈ (− R, R ) , seria este convergentă . Dacă 0 < r < R , atunci r face parte din intrevalul de convergenţă , deci seria å a n r n este convergentă. Dar å a n r n = å a n r n , aceasta din
urmă fiind o serie numerică cu termeni pozitivi, convergentă. Oricare ar fi x ∈ [− r , r ] , rezultă că å a n x n = å a n r n şi conform criteriului lui Weierstrass de convergenţă uniformă, seria uniform convergentă pe intervalul [− r, r ] .
åa
n
x n este
OBSERVAŢII : Ø Teorema lui Abel nu afirmă nimic despre natura seriei atunci când x=R sau când x= -R. În aceste puncte seria poate fi convergentă sau divergentă.
Ø Teorema lui Abel afirmă existenţa seriei de puteri, dar nu arată cum poate fi calculată raza de convergenţă. EXEMPLU :
∞
åx
n
= 1 + x + x 2 + Κ + x n , (∀) x ∈ (− 1,1)
n =1
♦ Pentru orice x ∈ (− ∞,−1) ∪ (1, ∞ ) , seria este divergentă. ♦ Pentru x = 1, S n = ∞ , deci seria este divergentă. ♦ Pentru x = -1 , S n este o serie oscilantă, deci divergentă. În concluzie, B = (− 1,1) .
TEOREMA CAUCHY – HADAMARD Fie
åa
n
x n o serie de puteri. Fie ω = lim n a n . Atunci : n →∞
ì1 ïω , 0 < ω < ∞ ï R = í∞ , ω = 0 ï0 , ω = ∞ ï î DEMONSTRAŢIE : Fie x0 ∈ R oarecare . ( x0 fixat ) Fie seria cu termeni pozitivi n
un = an x0 . Pentru seria
åu
(
n
åa
x 0n = å a n x0 . Notăm n
n
aplicăm criteriul rădăcinii:
)
lim n un = lim x0 n a n = x0 lim n a n = ω x0
n →∞
n →∞
n →∞
Există mai multe cazuri : 1)
0 < ω < ∞ Þ (∀) x0 <
1 1 Þ x0 < Þ ω x0 < 1 . Din criteriul ω ω
lui Cauchy rezultă că seria este convergentă şi R = 2)
ω = 0 Þ 0 ⋅ x 0 < 1 , ( ∀) x 0 ∈ R Þ R = ∞ .
1 . ω
ω = ∞ Þ (∀) x0 , ω x0 > 1 Þ (∀) x0 , x0 ≠ 0 , seria este
3)
divergentă şi R=0 . Observaţie : ω = lim
n→∞
a n +1 an
. Dacă nu există această limită, atunci
ω = lim n an sau ω = lim a n +1 . n →∞ an
n→∞
EXEMPLE : ∞
1)
å n =1
2)
xn 1 , an = n n n n
(− 1)n
å2
n
⋅n
Þ ω = lim n a n = lim n →∞
x n Þ ω = lim n n→∞
(− 1)n 2 ⋅n n
=
n→∞
1 =0ÞR=∞ n
1 1 1 = ÞR= =2 n ω 2 ⋅ lim n 2 n →∞
Oricare ar fi x ∈ (− 2,2 ) , seria este absolut convergentă.
Oricare ar fi x ∈ (− ∞,−2 ) ∪ (2, ∞ ) , seria este divergentă. CONTINUITATEA UNEI SERII DE PUTERI
Fie seria
åa
n
x n şi fie B mulţimea de convergenţă a seriei,
(− R, R ) ⊂ B ⊂ [− R, R ] .
Oricare ar fi x ∈ B , notăm S ( x ) = a0 + a1 x + Κ + a n x n + Κ .
Obţinem astfel funcţia S : B → R ( suma seriei ). EXEMPLU :
∞
åx
n
= 1 + x + x2 + Κ + xn + Κ
n =0
B = (− 1,1 ) ,
S :B → R,
S (x ) =
1 1− x
PROPOZIŢIA 4.10.2. : Suma S a unei serii de puteri este continuă pentru oricare x ∈ (− R, R ) .
åa
n
xn
DEMONSTRAŢIE : Fie x0 ∈ (− R, R )
( -R
|
x0
| r
) R
Deoarece x0 aparţine acestui interval, rezultă că există r > 0 astfel an x n este uniform încât x0 < r < R . Conform teoremei lui Abel, seria
å
convergentă pe intervalul [-r,r] . Dar funcţiile a n x n sunt nişte polinoame, deci sunt continue pentru
orice x ∈ R Þ S ( x ) este continuă, deci S ( x ) este continuă pe intervalul (R,R) .
åa
TEOREMĂ : Fie serii. 1. Seria derivatelor
å na
n
n
x n o serie de puteri şi fie S suma acestei
x n−1 are aceeaşi rază de convergenţă ca şi seria
iniţială. 2. Funcţia S este derivabilă în intervalul de convergenţă şi suma seriei ’ å nan x n−1 este S . EXEMPLE : 1) Să se determine mulţimea de convergenţă a seriei
∞
å ( −1) n =0
n
x 2 n +1 2n + 1
an 2n + 3 = lim =1 n →∞ 2 n + 1 n →∞ a n +1
R = lim
Dacă x ∈ (− 1,1) , seria este absolut convergentă.
Dacă x ∈ (− ∞,−1) ∪ (1, ∞ ) , seria este divergentă. Oricare ar fi r astfel încât 0 < r < 1 , seria este uniform convergentă pe [− r, r ] . ∞ n ∞ ( −1) n +1 . Acestea sunt Dacă x = 1 Þ å ( −1) . Dacă x = −1 Þ å n =0 2 n + 1 n =0 2n + 1 serii alternate care verifică condiţiile criteriului lui Leibnitz, deci sunt convergente. Rezultă că mulţimea de convergenţă este B = [− 1,1] .
3n + ( −2) n ( x + 1) n å n n =1 n n ∞ Notăm x + 1 = y şi obţinem seria å 3 + ( −2) y n . n n =1
2) Să se studieze convergenţa seriei
∞
n
æ 2ö 1+ ç − ÷ n n a 3 + (−2) n +1 n +1 è 3ø Þ R = 1 ⋅ n+1 = lim ⋅ R = lim n = lim n+1 → ∞ n→∞ a n→∞ n 3 + (−2) 3 n n æ æ 2 ön+1 ö n+1 3ç1+ ç − ÷ ÷ ç è 3ø ÷ è ø 4 2 1 1 Dacă y ∈ æç − , ö÷ ⇔ x ∈ æç − ,− ö÷ , seria este absolut convergentă. è 3 3ø è 3 3ø n ∞ 1 3 + ( −2 ) n 1 Dacă y = Þ å ⋅ n este o serie cu termeni pozitivi pe 3 n 3 n =1 ∞ 1 care o comparăm cu seria å . n =1 n 3n + ( −2) n ( 3n + ( −2) n )n lim = = 1 . Observăm că seriile au n→∞ n →∞ n ⋅ 3n 3n aceeaşi natură, deci seria dată este divergentă. ∞ 1 3n + ( − 2 ) n este o serie alternată. Şirul Dacă y = − Þ å ( −1) n 3 n ⋅ 3n n =1
Astfel, lim
æ 3n + ( − 2 ) n çç n è n⋅3
ö este monoton descrescător şi tinde la zero. Conform ÷÷ ø n∈N
criteriului lui Leibnitz, seria dată este convergentă. 4 2 Dacă x ∈ æç − ∞,− ö÷ ∪ æç − , ∞ ö÷ , seria este divergentă. 3 è ø è 3 ø 3) Să se determine mulţimea de convergenţă a seriei
∞
å n =1
R = lim
n→∞ n
1 an
= lim
n→∞
n
1ö æ çn + ÷ nø è n
n+
1 n
n
= lim
n→ ∞
n+ n
1+
1 n =1 1 n2
Dacă x ∈ (− 1,1) , seria este absolut convergentă.
Dacă x ∈ (− ∞,−1) ∪ (1, ∞ ) , seria este divergentă.
n
n+
1 n
1ö æ çn + ÷ nø è
n
⋅ xn
Dacă
∞
x =1Þ å n =1
n
n+
1 n
1ö æ çn + ÷ nø è
.
x = −1 Þ å n =1
æ ç n ç 1 = lim n lim n n ç n →∞ n2 1ö n →∞ æ ç æ1 + 1 ö çn + ÷ çç n÷ nø è ø èè n+
Dacă
n
∞
1 n
n
n+
1 n
1ö æ çn + ÷ nø è
n
( −1) n .
1
ön ÷ ÷ , deci seria este divergentă. ÷ =1 ÷ ÷ ø
4) Să se dezvolte în serie de puteri ale lui x funcţia unde f ( x ) = ln (1 + x ) .
f : (− 1, ∞ ) → R ,
1 −1 = (1 + x ) = 1 − x + x 2 − x 3 + x 4 + Κ + ( −1) n x n + Κ 1+ x
f ' (x ) =
x x x x 1 dt = ò (1 − t + t 2 − t 3 + Κ + (−1)n t n + Κ )dt = ò 1dt − ò tdt + ò t 2dt − 0 0 0 0 1+ t n +1 xx x x2 x3 x4 n n n x 3 − ò t dt + Κ + ò (−1) t dt + Κ = x − + − + Κ + (−1) +Κ = 0 0 2 3 4 n +1 ∞ x n +1 = å ( −1) n n +1 n =0
f (x) = ò
x
0
4.11. Serii Taylor şi serii MacLaurin
Fie I un interval din R şi fie f : I → R o funcţie indefinit derivabilă în punctul a ∈ I . DEFINIŢIA 4.11.1. : Se numeşte serie Taylor ataşată funcţiei f în punctul “a”, seria : (1)
(x −a)n f (n) (a) = f (a) + x −a f ' (a) + (x −a)2 f ' ' (a) +Κ + (x −a)n f (n) (a) +Κ
∞
å n=0
n!
1!
2!
n!
Evident, seria (1) este o serie de puteri , căci notând x – a = y , obţinem : (1’)
∞
yn
å n! n =0
f ( n ) (a ) = f (a ) +
y y2 y n (n) f ' (a ) + f ' ' (a ) + Κ + f (a ) + Κ n! 1! 2!
Raza de convergenţă a seriei (1) se studiază cu ajutorul teoremei Cauchy – Hadamard. OBSERVAŢIE : Deoarece raza de convergenţă este 0 ≤ R ≤ ∞ , seria Taylor are mulţimea de convergenţă B ≠ ∅ deoarece a ∈ B . Suma parţială de ordinul n a seriei (1) , pentru orice x ∈ B (mulţimea de convergenţă) o vom nota : (x − a )2 f ' ' (a ) + Κ + ( x − a )n f ( n ) (a ) x−a (2) Tn ( x ) = f (a ) + f ' (a ) + 1! 2! n! şi se numeşte polinomul lui Taylor de ordinul n. DEFINIŢIA 4.11.2. : Se numeşte rest al lui Taylor de ordinul n, funcţia Rn : I → R , Rn (x) = f ( x) − Tn (x) (3). Deci f ( x ) = Tn ( x ) + Rn ( x ) (4) , oricare ar fi x ∈ I . TEOREMA 4.11.1. : Seria Taylor ataşată funcţiei f în punctul “a” este convergentă în punctul x ∈ I dacă şi numai dacă şirul (Rn ( x ))n∈N * este convergent către zero. DEMONSTRAŢIE : Din relaţia (4) obţinem relaţia (5)
f ( x ) − Tn ( x ) = Rn ( x ) . Prin
urmare, dacă şirul sumelor parţiale de ordinul n , Tn ( x ) , converge către
f(x), trecând la limită când n → ∞ în relatia (5), rezultă că lim Rn ( x ) = 0 . Invers,
dacă
lim Rn ( x ) = 0 n→ ∞
n →∞
atunci
din
relatia
(5)
avem
lim Tn ( x ) = f ( x ) şi deci seria Taylor ataşată funcţiei f în punctul “a” este n →∞
convergentă pentru orice x ∈ I , către f(x) . OBSERVAŢII : 1)
Dacă lim Rn ( x ) = 0 , avem : n →∞
f ( x) = f (a) +
(x − a) f ' ' (a) + Κ + (x − a) f (n) (a) + Κ x −a f ' (a) + n! 1! 2! 2
n
(6)
Formula (6) se numeşte formula de dezvoltare în serie Taylor a funcţiei f în jurul punctului x = a.
∞ ì ( x − a )n este convergenta ü nu Mulţimea B = í x ∈ I | å f ( n ) (a ) ý n! n =0 î þ coincide, în general cu I. Caz particular : Dacă 0 ∈ I , atunci seria următoare se numeşte serie MacLaurin ataşată funcţiei f .
2)
∞
xn
å n! n=0
f ( n ) (0 ) = f (0) +
x x2 x n (n) f ' (0 ) + f ' ' (0 ) + Κ + f (0) + Κ 1! 2! n!
Evident, dacă Rn =
∞
x k (k ) å f (0) k = n +1 k!
(7)
converge către zero când n
tinde spre infinit, avem: x x2 x n (n) f ( x ) = f (0) + f ' (0 ) + f ' ' (0 ) + Κ + f (0) + Κ 1! 2! n!
(8)
Formula (8) se numeşte formula de dezvoltare în serie MacLaurin a funcţiei f . EXEMPLE : Să
1)
se
dezvolte
f : R → R,
în f (x ) = e .
serie
MacLaurin
funcţia
x
f ( x ) = e x , f (0) = 1 f ' ( x ) = e x , f (0) = 1 ……………………………
f (n) (x ) = e x ,
f ( n ) (0) = 1
…………………………… x x2 xn + +Κ + +Κ 1! 2! n! serie MacLaurin )
Şi deci e x = 1 +
( formula de dezvoltare în
∞
1 n 1 x Þ an = n! n =0 n!
ex = å
Pentru determinarea razei de convergenţă, conform teoremei Cauchy – Hadamard, avem:
ω = lim
n →∞
a n +1 n! = lim =0Þ R=∞ n → ∞ (n + 1)! an
2)
Să se dezvolte în serie MacLaurin şi să se determine raza de convergenţă a funcţiei f : R → R , f ( x ) = sin x , f (0) = 0 . πö æ f ' ( x ) = cos x = sinç x + ÷ , f ' (0) = 1 2ø è πö πö æ æ f ' ' ( x ) = cosç x + ÷ = sinç x + 2 ÷ , f ' ' (0) = −1 2ø 2ø è è ……………………………………………………… πö æ f (n) (x) = sinç x + n ÷ (formulă ce se demonstrează uşor prin inducţie) 2ø è ………………………………………………………
x x3 x5 x7 x 2 k +1 (− 1) − + − +Κ + +Κ (2k + 1)! 1! 3! 5! 7! Pentru determinarea razei de convergenţă, avem : (2 k + 1)! = 0 Þ R = ∞ ω = lim k → ∞ (2 k + 3)! k
Prin urmare, sin x =
5) Să se scrie seria McLaurin pentru funcţia : f : R → R, f ( x) = cosx
πö π ì(−1)k , n = 2k æ n f ( n) ( x) = (cos x ) = cosç x + n ÷ ; f (n) (0) = cosn = í 2ø 2 î0, n = 2k −1 è π cos x = 1 −
∞ x x4 x 2n f ( n ) (0) n ∞ + + Κ + (−1) n +Κ = å x =å 2! 4! (2n)! n! n =0 n =0
cos n n!
2 xn
RESTUL ÎN FORMULA LUI TAYLOR
TEOREMA 4.11.2. : Fie f : I → R de n+1 ori derivabilă pe intervalul I. Atunci pentru orice p ∈ N * , există un număr " α " cuprins între “a” şi “x” astfel încât : (x − a ) p ( x − α )n − p +1 f ( n +1) (α ) (1) Rn ( x ) = p ⋅ n! DEMONSTRAŢIE :
p Vom considera restul Rn ( x ) de forma (2) Rn (x) = ( x − a) ⋅ k şi vom determina pe “k” în funcţie de “x” şi de “a”. Din formula lui Taylor (x − a)2 f ' ' (a) +Κ + (x − a)n f (n) (a) + (x − a)p ⋅ k (3) x −a avem: f ( x) = f (a) + f ' (a) + 1! 2! n!
Vom defini funcţia ϕ : I → R , derivabilă pe I astfel :
ϕ (t ) = f (t ) +
(x − t ) f ' ' (t ) + Κ + (x − t ) f ( n ) (t ) + (x − t ) p ⋅ k (4) x−t f ' (t ) + n! 1! 2! n
2
Evident ϕ ( x ) = f ( x ) şi f ( x ) = ϕ (a ) de unde obţinem ϕ ( x ) = ϕ (a ) . Presupunând că, de exemplu, a < x , avem:
♦ ϕ este continuă pe intervalul [ a , x ] ♦ ϕ este derivabilă pe intervalul ( a , x ) Þ (∃)α ∈ (a, x) , ϕ ' (α ) = 0 (5) ♦ ϕ (a ) = ϕ ( x )
(conform teoremei lui Rolle)
Pe de altă parte, derivând funcţia ϕ dată de (4) obţinem :
(x − t) f ' ' ' (t) − 2(x − t) f ' ' (t) + ( x − t) f IV (t) − x −t + f ' ' (t ) − f ' (t ) + 1! 2! 2! 3! 2 n−1 n−2 n (x − t) f ' ' ' (t) +Κ + (x − t) f (n) (t) − (x − t) f (n−1) (t) + (x − t) f (n+1) (t) − (x − t)n−1 f (n) (t) − − (n −1)! (n − 2)! (n −1)! 2! n! 2
ϕ' (t) = f ' (t) +
− p( x − t )
p −1
3
⋅k
Reducând termenii asemenea, se obţine : ( x − t )n f ( n+1) (t ) − p ⋅ ( x − t ) p −1 ⋅ k ϕ ' (t ) = n! ( x − α )n f ( n+1) (α ) − p ⋅ ( x − α ) p−1 ⋅ k = 0 , de unde Deci : ϕ ' (α ) = n! n ( n +1) ( x − α ) f (α ) , sau k = ( x − α )n− p+1 f ( n+1) (α ) şi rezultă astfel : k= p −1 p ⋅ n! n! p ⋅ ( x − α )
Rn ( x ) =
(x − a ) p ( x − α )n − p +1 p ⋅ n!
f ( n +1) (α ) , unde " α " este cuprins
între “a” şi “x”. Teorema este astfel demonstrată . Cazul când x < a se tratează analog.
Cazuri particulare ale expresiei restului : n Pentru p = 1 se obţine Rn ( x ) = ( x − a )( x − α ) f ( n +1) (α ) n! numeşte restul lui Cauchy. (x − a )n +1 f ( n +1) (α ) Pentru p = n+1 se obţine Rn ( x ) = (2) (n + 1)! numeşte restul lui Lagrange.
(1)
şi se
şi se
RESTUL IN FORMULA LUI MACLAURIN
Aşa cum am mai văzut, o serie Taylor pentru a = 0 se numeşte serie MacLaurin. Prin urmare, dezvoltarea unei funcţii f : I → R ( 0 ∈ I ) în serie MacLaurin este: x x2 x n (n) f ( x ) = f (0) + f ' (0) + f ' ' (0) + Κ + f (0) + Κ 1! 2! n! n x k (k ) Tn ( x ) = å f (0 ) k = 0 k!
Rn ( x ) =
∞
x k (k ) å f (0) k = n +1 k! în formula
Restul lui Cauchy are forma n x ( x − α ) ( n +1) (α ) , unde " α " este cuprins între “a” şi “x”. Rn ( x ) = f n! Restul în formula lui Lagrange are forma n +1 x Rn ( x ) = f ( n +1) (α ) , unde " α " este cuprins între “a” şi “x”. (n + 1)! EXEMPLU : 1)
Să se calculeze 1
1 cu trei zecimale exacte. e
− 1 æ 1ö æ 1ö = e 2 = Tn ç − ÷ + Rn ç − e è 2 è 2
:
:
Pentru Rn æç − 1 ö utilizăm formula restului lui Lagrange : è 2 n+1
æ 1ö ç− ÷ 1 æ 1ö è 2ø 1 Rn ç − ÷ = eα ≤ n+1 ⋅ 1 deoarece < eα < e 0 = 1 (n + 1)! 2 (n + 1)! e è 2ø Punând condiţia Rn æç − 1 ö÷ < 0,001 , adică è 2ø
1 1 sau < 2 n +1 (n + 1)! 1000
2 n +1 ( n + 1)! > 1000 rezultă n = 4 ( prima valoare naturală ). 2
3
4
1 1 1 1 æ 1ö æ 1ö 1 æ 1ö 1 æ 1ö 1 æ 1ö 1 T ç− ÷ = 1+ ç − ÷ + ç − ÷ + ç− ÷ + ç − ÷ = 1− + 2 − 3 + 4 = 2 2 ⋅ 2 2 ⋅ 6 2 ⋅ 24 è 2ø è 2 ø 1! è 2 ø 2! è 2 ø 3! è 2 ø 4! 233 1 = ≈ 0,606 . Deci ≈ 0,606 . 284 e
CAPITOLUL 5 FUNCŢII REALE DE MAI MULTE VARIABILE REALE
5.1. Mulţimi şi puncte din Rn Fie Rn spaţiul vectorial real n dimensional. Fie T T x = ( x1 , x 2 , Κ , x n ) ∈ R n şi y = ( y1 , y 2 , Κ , y n ) ∈ R n . DEFINIŢIA 5.1.1. : Aplicaţia , : R n × R n → R dată de n
relaţia x, y = å xi y i este un produs scalar real. i =1
Se arată uşor că ea verifică axiomele unui produs scalar real. PS1)
x, y = y, x , (∀) x, y ∈ R n
PS2)
λ x , y = λ x , y , ( ∀ ) λ ∈ R , ( ∀) x , y ∈ R n
PS3)
x + y , z = x , z + y , z , ( ∀) x , y , z ∈ R n
PS4)
x, x ≥ 0 , (∀) x ∈ R n şi
x, x = 0 ⇔ x = θ
(unde
θ este vectorul nul din R ) n
Deci Rn este un spaţiu euclidian. DEFINIŢIA 5.1.2. : Aplicaţia • : R n → R dată de relaţia x =
x, x =
n
åx i =1
2 i
este o normă şi deci Rn este un spaţiu
vectorial normat. Într-adevăr, se arată imediat că:
n1)
x ≥ 0 , (∀) x ∈ R n şi x = 0 ⇔ x = θ
n2)
λx = λ ⋅ || x | , (∀)λ ∈ R, (∀) x ∈ R n
n3)
x + y ≤ x + y , (∀) x , y ∈ R n
DEFINIŢIA 5.1.3. : Un spaţiu vectorial peste care s-a definit o normă se numeşte spaţiu vectorial normat.
DEFINIŢIA 5.1.4. : O aplicaţie d : X × X → R se numeşte distanţă dacă : d1) d ( x, y ) ≥ 0 , (∀) x, y ∈ X şi d ( x, y ) = 0 ⇔ x = y d2) d (x , y ) = d ( y , x ) , (∀) x , y , z ∈ X d3) d ( x, z ) ≤ d ( x, y ) + d ( y , z ) , (∀) x, y , z ∈ X DEFINIŢIA 5.1.5. : O mulţime nevidă X peste care s-a definit o distanţă se numeşte spaţiu metric. Vom arăta acum că Rn este un spaţiu metric. Într-adevăr,
d : Rn × Rn → R , d ( x, y ) = x − y =
n
å (x i =1
− yi )
2
i
verifică axiomele
unei distanţe ( metrice ). DEFINIŢIA 5.1.6. : Fie A ⊂ R n . Funcţia f : A → R este o lege prin care fiecărui element x ∈ A îi corespunde un număr real y şi numai unul singur. T y = f ( x1 , Κ x n ) , x ∈ A , x = ( x1 , x2 , Κ , x n ) ∈ R n Funcţia f : A → R se numeşte funcţie reală de n variabile reale. DEFINIŢIA 5.1.7. : Fie a ∈ R n şi fie r ∈ R, r > 0 . Mulţimea S r ( a ) = {x ∈ R n | x − a < r } se numeşte sfera deschisă cu centrul în punctul x0 , de rază “r”. DEFINIŢIA
5.1.8.
:
Fie x0 ∈ R n , x0 = (x01 ,Κ , x0n )
T
Fie
T a ∈ R n , a = (a1 , Κ , a n ) .
şi fie x ∈ R n , x = ( x1 , x 2 , Κ , x n )T .
{
Mulţimea Pa(x0) de forma Pa ( x0 ) = x ∈ R n | xi − x0i < ai , i = 1,..., n
}
se numeşte paralelogram deschis care conţine punctul “a”. DEFINIŢIA 5.1.9. : Prin vecinătatea V(a) , a ∈ R n , întelegem orice sferă deschisă de rază “r” cu centrul în punctul “a”. O vecinătate poate fi şi un paralelogram deschis . Mulţimea
{
C r ( x0 ) = x ∈ R n | xi − x0i < r, i = 1,..., n
numeşte hipercub. (r>0)
}
se
DEFINIŢIA 5.1.10. : Mulţimea M ⊂ R n este o mulţime deschisă dacă oricare ar fi x ∈ M există o vecinătate V(x) complet conţinută în M . DEFINIŢIA 5.1.11. : Mulţimea M ⊂ R n este mărginită dacă există un număr real “a” şi dacă există un număr “r” finit şi pozitiv astfel încât M ⊂ S r (a ) . DEFINIŢIA 5.1.12 : Punctul x ∈ M este un punct de acumulare al mulţimii M dacă pentru orice V(x) avem (V ( x ) − {x}) ∩ M ≠ ∅ . DEFINIŢIA 5.1.13. : Punctul x ∈ M care nu este punct de acumulare se numeşte punct izolat. DEFINIŢIA 5.1.14. : Funcţia f : A ⊂ R n → R este o funcţie mărginită dacă mulţimea valorilor funcţiei f(A) este o mulţime mărginită . 5.2.
Funcţii vectoriale Continuitate parţială.
de
Fie A ⊂ R n , (∀) x ∈ A ,
variabilă
reală
vectorială.
T x = ( x1 , Κ , x n ) . Fie funcţiile
f i : A → R, i = 1,..., m . Atunci pentru orice x ∈ A , obţinem
vectorul m dimensional ( f1 ( x ), f 2 ( x ), Κ , f m ( x ))T .
Funcţia f : A ⊂ Rn →Rm f (x1,Κ , xn ) = f ( x) = ( f1(x), f2(x),Κ , fm( x)) se numeşte funcţie vectorială de variabilă reală vectorială . Fie y ∈ R m , y = ( y1 , Κ , y i , Κ , y m ) . Prin proiecţia vectorului y în raport cu “i” înţelegem pri y = yi , i = 1,Κ , m . Prin urmare, studiul funcţiilor vectoriale de variabilă vectorială se reduce la studiul functiilor reale de variabilă vectorială.
OBSERVAŢIE : Mulţimea F = {f | f : A ⊂ R n → R m } formează un spaţiu vectorial în raport cu adunarea funcţiilor şi înmulţirea unei funcţii cu un scalar. DEFINIŢIA 5.2.1. :
f : A ⊂ R n → R m este mărginită,
dacă există a ∈ R m şi există 0 < r < ∞ astfel încât oricare ar fi x ∈ A să avem f ( x ) ⊂ V r (a ) . DEFINIŢIA 5.2.2. : Fie f : A ⊂ R n → R m . Fie a ∈ A , a = (a1 , Κ , ai , Κ ,a n ) . Funcţia f este continuă în punctul a ∈ A dacă : 1) există lim f ( x ) x→a
2)
lim f ( x ) = f (a ) x →a
DEFINIŢIA 5.2.3. : Funcţia f este continuă în punctul a ∈ A dacă pentru orice ε > 0 , există δ (ε ) > 0 astfel încât oricare ar fi a ∈ A , x − a < δ (ε ) , rezultă că f ( x ) − f (a ) < ε . OBSERVAŢIE: Definiţiile 5.2.2. şi 5.2.3. sunt echivalente. f : A ⊂ R 2 → R . Fie (a , b ) ∈ A . Fie Aa = {( x, b ) | ( x, b ) ∈ A} şi mulţimea Ab = {(a , y ) | (a , y ) ∈ A} .
Fie
Definim funcţiile ϕ : Aa → R , ψ : Ab → R , ψ (a , y ) = f (a , y ) .
ϕ ( x, b ) = f ( x , b )
Ab
x2
(a,b)
Aa
b
a
mulţimea
x1
şi
DEFINIŢIA 5.2.4. : Funcţia ϕ se numeşte funcţia parţială, în raport cu “x”, asociată funcţiei f în punctul (a,b) . DEFINIŢIA 5.2.5. : Funcţia ψ se numeşte funcţia parţială, în raport cu “y”, asociată funcţiei f în punctul (a,b) . DEFINIŢIA 5.2.6. : Funcţia f : A ⊂ R 2 → R este continuă parţial în raport cu “x” în punctul (a,b) dacă funcţia parţială ϕ ( x ) este continuă în punctul “a”. Funcţia f este continuă parţial în raport cu “y” în punctul (a, b) dacă funcţia parţială ψ ( y ) este continuă în punctul “b”.
f : A ⊂ R 2 → R este continuă parţial în punctul (a , b ) ∈ A dacă funcţiile parţiale ϕ ( x ) şi ψ ( y ) sunt continue în punctele “a”, respectiv “b” în raport cu “x”, respectiv “y”. DEFINIŢIA
5.2.7.
: Funcţia
În general : Fie f : A ⊂ R 2 → R şi fie a = (a1 , Κ ,a n ) ∈ A . Funcţia f este continuă parţial în punctul a ∈ A dacă funcţiile parţiale f i (a1 , Κ , ai −1 , xi , ai +1 , Κ , a n ) sunt continue în punctele ai , i = 1, Κ , n .
PROPOZIŢIA 5.2.1. : O funcţie f : A ⊂ R2 → R , continuă în punctul a ∈ A este continuă parţial în punctul “a” . DEMONSTRAŢIE : Prin ipoteză, funcţia f este continuă în punctul a = (a1 , Κ , ai , Κ ,a n ) , deci pentru orice ε > 0 , există
δ (ε ) > 0 astfel încât oricare ar fi a ∈ A , x − a < δ (ε ) , rezultă că f ( x ) − f (a ) < ε .
Fie x = (a1,Κ , ai−1, xi , ai+1,Κ , an ) , x ∈ A şi xi − ai < δ . Din ipoteză rezultă că f ( x) − f (a) = f (a1,Κ , ai −1, xi , ai+1,Κ , an ) − f (a1,Κ , ai−1, ai , ai +1,Κ , an ) < ε pentru orice i = 1,…,n şi deci f este continuă parţial în punctul “a”.
OBSERVAŢIE : În general, reciproca nu este adevărată. Adică, dacă o funcţie este parţial continuă într-un punct, ea nu este întotdeauna continuă în acel punct. EXEMPLU : ì xy , ( x, y ) ≠ (0,0) Fie funcţia f : R → R , f ( x, y ) = ïí x 2 + y 2 ï0, ( x, y ) = (0,0) î 2
Vom arăta că această funcţie nu este continuă în origine, dar este parţial continuă. (1) Funcţia nu este continuă în (0,0) în raport cu ansamblul variabilelor deoarece nu are limită în acest punct. Într-adevăr, pentru x ≠ 0 , avem : y x f ( x, y ) = 2 æ yö 1+ ç ÷ èxø Fie dreapta y = mx care trece prin origine. Dacă luăm şirul (xn , y n ) → 0 de pe această dreaptă, avem y n = mxn pentru m . orice n ∈ N * şi f ( x n , y n ) = 1 + m2 m depinde de dreapta pe care se află şirul de puncte Limita 1 + m2 (xn , y n ) → 0 . Astfel, pentru două drepte cu coeficienţi unghiulari diferiţi, m1 ≠ m2 , obţinem limite diferite; prin urmare, funcţia f nu are limită în origine, deci nu este continuă în raport cu ansamblul variabilelor. (2) Funcţia nu este parţial continuă în (0,0), dar funcţiile parţiale următoare sunt continue în origine. ì0, x ≠ 0 ϕ ( x ) = f ( x,0) = í î0, x = 0 ì0, y ≠ 0 ψ ( y ) = f (0, y ) = í î0, y = 0
DEFINIŢIA 2.2.8. : Funcţia f : A ⊂ R n → R este continuă pe mulţimea A, dacă este continuă în toate punctele a ∈ A . 5.3. Derivata parţială a unei funcţii
Fie funcţia f : A ⊂ R 2 → R , fie (a , b ) ∈ int A . DEFINIŢIA 5.3.1. : Funcţia f este derivabilă parţial în
raport cu x în punctul (a,b) dacă lim f ( x, b ) − f (a, b ) există şi este x−a
x →a
finită.
Notăm această limită cu ∂f (a, b) sau cu f ' x (a , b ) . ∂x
DEFINIŢIA 5.3.2. : Funcţia f este derivabilă parţial în raport cu y în punctul (a,b) dacă lim f (a, y ) − f (a, b) există şi este y →b y−b finită. Notăm această limită cu ∂f (a, b ) sau cu f ' y (a , b ) . ∂y
EXEMPLU : Fie funcţia f : R 2 → R , f ( x, y ) = e x Pornind de la definiţie, să se calculeze f ' x (1,1) şi f ' y (1,1) .
2
+ y3
.
f ( x,1) − f (1,1) ex +1 − e2 2 ex −1 −1 2 ex −1 −1 (x +1) = = lim = e lim = e lim 2 x→1 x→1 x→1 x −1 x→1 x −1 x −1 x −1 = 2e 2 ln e = 2e 2 3 3 3 f (1, y ) − f (1,1) e1+ y − e2 e y −1 − 1 2 e y −1 − 1 = lim = e2 lim = e lim 3 ⋅ f ' y (1,1) = lim y→1 y→1 y→1 y − 1 y→1 y − 1 y −1 y −1 ⋅ y 2 + y + 1 = e 2 3 ln e = 3e 2 2
f ' x (1,1) = lim
(
2
2
)
Funcţia f : A ⊂ R 2 → R este derivabilă parţial în raport cu x în punctul (a , b ) ∈ int A dacă şi PROPOZIŢIA
5.3.1. :
numai dacă funcţia parţială ϕ ( x ) este derivabilă în punctul “a”.
DEMONSTRAŢIE : ϕ ( x ) − ϕ (a ) ∂f (a , b ) f ( x, b ) − f (a , b ) = lim = lim = ϕ ' (a ) şi reciproc. x → a x → a ∂x x−a x−a
PROPOZIŢIA 5.3.2. : Funcţia f : A ⊂ R 2 → R este derivabilă parţial în raport cu y în punctul (a , b ) ∈ int A dacă şi numai dacă funcţia parţială ψ ( x ) este derivabilă în punctul “b”. EXEMPLE : 1.
f (x, y ) = x + y f ' x ( x, y ) = 1
f ' y ( x, y ) = 1
2.
f ( x, y ) = xy
f ' x ( x, y ) = y
f ' y ( x, y ) = x
3.
4.
x ,y≠0 y 1 f ' x ( x, y ) = , y ≠ 0 y x f ' y ( x, y ) = − 2 , y ≠ 0 y f ( x, y ) =
f ( x, y ) = x y , x > 0
f ' x ( x, y ) = yx y −1
f ' y ( x , y ) = x y ln x În general, fie f : A⊂Rn →R, fie x∈A, x = (x1,Κ , xi−1, xi , xi+1,Κ , xn ) Fie punctul a ∈ int A, a = (a1,Κ , ai−1, ai , ai+1,Κ , an ) . DEFINIŢIA 5.3.3. : Funcţia f este derivabilă parţial în raport cu xi , în punctul “a”, dacă :
lim
xi →ai
f (a1 , Κ , ai −1 , xi , ai +1 , Κ , a n ) − f (a1 , Κ , ai −1 , ai , ai +1 , Κ , a n ) xi − a i
există şi este finită.
Notăm această limită cu ∂f (a ) sau cu f ' x (a ) . ∂xi i
PROPOZIŢIA 5.3.3. : Fie f : A ⊂ R2 → R, (a, b) ∈ int A . Dacă f este derivabilă parţial în raport cu x în punctul (a,b), atunci f este continuă parţial în raport cu x în punctul (a,b). DEMONSTRAŢIE : Prin ipoteză, funcţia f este derivabilă parţial în raport cu x în punctul (a,b). Conform propoziţiei 5.3.1. , funcţia parţială ϕ ( x ) este derivabilă în punctul “a”, deci este continuă în acest punct. Prin urmare, funcţia f este continuă parţial în raport cu x în punctul (a,b). TEOREMA DE MEDIE A LUI LAGRANGE
Fie f : A ⊂ R 2 → R , (a , b ) ∈ int A . Dacă există f ' x şi f ' y într-o vecinătate a punctului (a,b), atunci
pentru orice punct ( x , y ) ∈ V (a , b ) ∩ A există un număr real α cuprins între a şi x şi există un număr β cuprins între b şi y, astfel încât : f ( x, y ) − f (a, b ) = f ' x (α , y )( x − a ) + f ' y (a, β )( y − b )
(1)
DEMONSTRAŢIE : Fie V(a,b) şi fie ( x, y ) ∈ V (a , b ) ∩ A un punct pe care îl fixăm. y y β b
(x,y) (α,β) (a,b) a α x
x
(2) f (x, y) − f (a, b) = f (x, y) − f (a, y) + f (a, y) − f (a, b) ìϕ ( t ) = f ( t , y ) Notez ( 3) , (t , y ) ∈ V , ( a , t ) ∈ V . í îψ ( t ) = f ( a , t ) Funcţiile ϕ şi ψ sunt derivabile, deci : (a) ϕ este derivabilă în intervalul cu capetele în a şi x, de unde rezultă că ϕ este continuă pe intervalul cu capetele în a şi x. (b) ψ este derivabilă pe intervalul cu capetele în b şi y, de unde rezultă că ψ este continuă pe intervalul cu capetele în b şi y. Din (a) rezultă că există α cuprins între a şi x astfel încât : (4) ϕ( x) −ϕ(a) =ϕ' (α)(x −a) Din (b) rezultă că există β cuprins între b şi y astfel încât : (4’) ψ ( y ) − ψ (b ) = ψ ' (β )( y − b )
ϕ ' (α ) = f ' x (α , y ) ; ψ ' (β ) = f ' y (a, β ) . Din (2) rezultă : f ( x, y ) − f (a, b) = [ϕ ( x ) − ϕ (a )] + [ψ ( y ) − ψ (b)] = = ϕ ' (α )( x − a ) + ψ ' (β )( y − b ) = f ' x (α , y ) + f ' y (a, β )( y − b ) Astfel, teorema este demonstrată. ìϕ (t ) = f (t , b) şi í îψ (t ) = f ( x, t ) raţionând ca şi în demonstraţia de mai sus, rezultă că există un număr α ' cuprins între a şi x şi un număr β ' cuprins între b şi y astfel încât :
OBSERVAŢIE:
(1’)
Notând
(3' )
f ( x, y ) − f (a, b ) = f ' x (α ' , b )( x − a ) + f ' y ( x, β ' )( y − b)
Egalităţile (1) şi (1’) vor fi scrise în continuare astfel : (5)
f ( x, y ) − f (a, b ) = f ' x (α , β )(x − a ) + f ' y (α , β )( y − b ) unde α este cuprins între a şi x şi β este cuprins între b şi y .
Relatia (5) se numeşte formula lui Lagrange . OBSERVAŢIE : Se poate da o formulă de tip Lagrange şi pentru o funcţie de n > 2 variabile. PROPOZIŢIA 5.3.4.: Fie f : A⊂ R2 →R, fie (a, b ) ∈ int A . Dacă funcţia f are derivate parţiale f ' x şi f ' y mărginite într-o vecinătate a punctului (a,b), atunci f este continuă în (a,b) în raport cu ansamblul variabilelor. DEMONSTRAŢIE : Din ipoteză ştim că există M > 0 astfel încât : f ' x ( x, y ) ≤ M üï ý (∀) ( x , y ) ∈ V ( a , b ) f ' y ( x, y ) ≤ M ïþ Conform teoremei lui Lagrange :
f ( x, y) − f (a, b) ≤ f ' x (α, β ) x − a + f ' y (α, β ) y − b ≤ M[ x − a + y − b ] Dar limM[ x − a + y − b] = 0 deci limf (x, y) − f (a,b) = 0 Þlimf (x, y) = f (a,b) x→a y→b
x→a y→b
x→a y→b
Deci funcţia f este continuă în punctul (a,b). 5.4. Derivate parţiale de ordin superior
Fie f : A ⊂ R 2 → R , fie (a , b ) ∈ int A . DEFINIŢIA 5.4.1. : Se numeşte derivata parţială de ordinul 2 a funcţiei f în raport cu x 2 în punctul (a,b) : ∂ é ∂f (a , b) ù ∂ 2 f ( a , b) = = f ' ' x 2 (a , b ) ∂x êë ∂x úû ∂x 2 DEFINIŢIA 5.4.2. : Se numeşte derivata parţială de ordinul 2 a funcţiei f în raport cu y 2 în punctul (a,b) : ∂ é ∂f ( a , b) ù ∂ 2 f (a , b) = = f ' ' y 2 (a , b ) ∂y êë ∂y úû ∂y 2
DEFINIŢIA 5.4.3. : Se numeşte derivata parţială de ordinul 2,mixtă, a funcţiei f în punctul (a,b) : ∂ é ∂f ( a, b) ù ∂ 2 f (a , b) = = f ' ' xy (a , b ) ∂y êë ∂x úû ∂x∂y ∂ é ∂f ( a, b) ù ∂ 2 f ( a , b) = = f ' ' yx (a , b ) ∂x êë ∂y úû ∂y∂x
EXEMPLE : 1) Fie f ( x, y ) = 2 x 3 y 3 − 3xy + 2 să se calculeze derivatele parţiale de ordinul doi ale acestei funcţii. ∂f = 4 xy 3 − 3 y ∂x ∂f = 6 x 2 y 2 − 3x ∂y
∂2 f = 12 x 2 y 2 ∂y
∂2 f = 4 y3 2 ∂x
∂2 f = 12 xy 2 − 3 ∂y∂x
∂2 f = 12 xy 2 − 3 ∂x∂y
2) Calculaţi derivatele parţiale de ordinul I şi II pentru funcţia f : R 2 → R , f ( x, y ) = 4 x 3 + 3x 2 y + 3xy 2 − y 3 ∂f = 12 x 2 + 6 xy + 3 y 2 ∂x
∂2 f ∂ æ ∂f ö = ç ÷ = 6x − 6 y 2 ∂y ∂y çè ∂y ÷ø
∂f = 3x 2 + 6 xy − 3 y 2 ∂y
∂f ∂ æ ∂f ö = çç ÷÷ = 6 x + 6 y ∂x∂y ∂x è ∂y ø
∂ æ ∂f ö ∂2 f = ç ÷ = 24 x + 6 y 2 ∂x ∂x è ∂x ø
∂f ∂ æ ∂f ö = ç ÷ = 6x + 6 y ∂y∂x ∂y è ∂x ø
CRITERIUL LUI SCHWARTZ
Dacă funcţia f ( x , y ) are derivate parţiale mixte de ordinul
2 f ' ' xy şi f ' ' yx într-o vecinătate V(a,b) , (a , b ) ∈ int A , şi dacă
f ' ' xy şi f ' ' yx sunt continue în (a,b), atunci f ' ' xy (a, b) = f ' ' yx (a, b) .
DEMONSTRAŢIE: Alegem ( x, y ) ∈V (a, b) ∩ A pe care îl fixăm.
un
punct
arbitrar
Notăm (1) R( x, y) = f ( x, y) − f ( x, b) − f (a, y) + f (a, b) . ( x − a)( y − b) y y
(a,y)
η b
(x,y) (ζ,η)
(a,b) a
(x,b) ζ
x
x
Considerăm funcţia ϕ definită pe intervalul cu capetele în a şi x, având forma următoare : ϕ ( x ) − ϕ (a ) (3) (2) ϕ (t ) = f (t , y ) − f (t , b) Þ R( x, y ) = x−a y −b Funcţia ϕ (t ) este derivabilă pe intervalul cu capetele în a şi x. f ' (t , y ) − f ' x (t , b) (4) ϕ ' (t ) = x y −b Aplicăm funcţiei ϕ teorema lui Lagrange. Rezultă că există ξ cuprins între a şi x astfel încât : ϕ ' (ξ ) = ϕ ( x ) − ϕ (a ) . x−a f ' ( , y ) − f ' x (ξ , b ) . ξ Deci (5) R ( x , y ) = ϕ ' (ξ ) = x y−b Considerăm funcţia ϕ 1 (τ ) definită pe intervalul cu capetele în b şi y, având forma următoare : ϕ1 (τ ) = f xy (ξ ,τ ) (6) Funcţia ϕ 1 (τ ) este derivabilă pe intervalul cu capetele în b şi y :
ϕ '1 (τ ) = f ' ' xy (ξ ,τ ) , adică f ' ' xy (ξ,η) = Deci : R( x, y ) = f ' ' xy (ξ ,η )
(*)
f ' 'x (ξ, y) − f ' ' x (ξ, b) . y −b
f ( x, t ) − f (a, t ) x−a Rezultă că există η ' cuprins între b şi y astfel încât : f ' y ( x, η ' ) − f ' y ( a ,η ' ) (5’) R ( x, y ) = x−a Folosim apoi funcţia (6’) ψ 1 (τ ) = f ' y (τ ,η ' ) Þ (∃)ξ '
Analog definim (2’)
ψ ' (t ) =
astfel încât obţinem: R( x, y ) = f ' ' yx (ξ ' ,η ' )
(**)
Fie şirul ( xn , y n ) → (a, b ) din vecinătatea V(a,b) , x n ≠ a , yn ≠ a , xn → a , y n → b . Pentru orice punct ( xn , y n ) , există două puncte ξ n şi ξ ' n cuprinse între a şi xn şi există două puncte η n şi η ' n cuprinse între b şi y n astfel încât : (*)
f ' ' xy (ξ n ,η n ) = f ' ' yx (ξ ' n ,η ' n ) (**)
(7)
Dar f ' ' xy şi f ' ' yx sunt continue şi, trecând la limită în relaţia (7), obţinem: f ' ' xy (ξ n ,η n ) → f ' ' xy (a, b) şi f ' ' yx (ξ ' n ,η ' n ) → f ' ' yx (a, b) . Deci : f ' ' xy (a, b) = f ' ' yx (a, b) . COROLAR : Dacă derivatele mixte există şi sunt continue pe mulţimea A , atunci sunt egale pe A . 5.5.
Funcţii diferenţiabile
Fie f : A ⊂ R 2 → R şi fie punctul (a, b ) ∈ int A . DEFINIŢIA 5.5.1. : Funcţia f este diferenţiabilă în punctul (a,b) dacă există două numere λ şi µ şi dacă există o funcţie ω : V ( a , b) → R , continuă şi nulă în (a,b) astfel încât, pentru orice
(x, y ) ∈ A să avem :
(1)
f ( x, y) − f (a, b) = λ( x − a) + µ( y − b) + ω( x, y) ( x − a)2 + ( y − b)2
OBSERVAŢIE : Funcţia ω este continuă şi nulă în (a,b), ceea ce înseamnă că : lim ω ( x, y ) = ω (a, b ) = 0 . x→a y →b
Notăm ρ ( x, y ) = ( x − a )2 + ( y − b )2 ( distanţa euclidiană de la punctul (x,y) la punctul (a,b) ). Vom obţine : (1’)
f ( x, y ) − f ( a , b ) = λ ( x − a ) + µ ( y − b ) + ω ( x , y ) ρ ( x , y )
DEFINIŢIA 5.5.2. : Dacă A este o mulţime deschisă, atunci f : A → R este diferenţiabilă pe A dacă este diferenţiabilă în orice punct (a, b ) ∈ A . PROPOZIŢIA 5.5.1.: Fie f : A ⊂ R 2 → R şi fie punctul (a, b ) ∈ int A . Dacă f este diferenţiabilă în (a,b), atunci f este continuă în punctul (a,b). DEMONSTRAŢIE: Trecând la limită când ( x, y ) → (a.b ) în relaţia (1) avem: lim[ f ( x, y) − f (a, b)] = λ lim( x − a) + µ lim( y − b) + limω( x, y) ρ( x, y) = 0 x→a y→b
x→a y→b
x→a y→b
x→a y→b
Deci f este continuă în punctul (a,b). PROPOZIŢIA 5.5.2: Fie f : A ⊂ R 2 → R şi fie punctul (a, b ) ∈ int A . Dacă f este diferenţiabilă în (a,b) , atunci există f ' x (a , b ) şi f ' y (a, b) şi λ = f ' x (a, b ) , µ = f ' y (a, b) . DEMONSTRAŢIE : Din ipoteză, f este diferenţiabilă în (a,b) , deci există λ şi µ şi există funcţia ω ( x, y ) continuă şi nulă în (a,b) astfel încât oricare ar fi ( x, y ) ∈ A , avem : f ( x , y ) − f ( a , b ) = λ ( x − a ) + µ ( y − b) + ω ( x , y ) ( x − a ) 2 + ( y − b) 2
Pentru punctul ( x, b) ∈ A , avem : f ( x , b ) − f ( a , b) = λ ( x − a ) + µ ( b − b) + ω ( x , y ) ( x − a ) 2 + ( b − b) 2 ,
deci : f ( x, b) − f ( a, b) = λ ( x − a ) + ω ( x, b) x − a . Împărţind cu (x-a) şi trecând la limită ( x → a ) , avem : ω ( x , b) x − a f ( x , b) − f ( a , b ) lim = λ + lim = λ = f ' x ( a , b) . x →a x →a x−a x−a
Pentru punctul (a, y ) ∈ A , avem: f ( a , y ) − f ( a, b) = µ ( y − b) + ω ( a, y ) y − b şi împărţind cu (y-b) şi trecând la limită ( y → b ) rezultă : µ = f ' y (a , b ) . DEFINIŢIA 5.5.3.: Fie f : A ⊂ R 2 → R şi fie punctul (a , b ) ∈ int A . Funcţia f este diferenţiabilă în (a,b) dacă există f ' x (a, b ) şi f ' y ( a, b) şi există ω : A → R , continuă şi nulă în (a,b) astfel încât : f (x, y) − f (a, b) = f 'x (a, b)(x − a) + f ' y (a, b)( y − b) + ω(x, y) (x − a)2 + ( y − b)2
OBSERVAŢIE : Fie f : A ⊂ R 2 → R şi fie (a, b ) ∈ int A . Dacă există f ' x (a, b ) şi f ' y ( a, b) nu rezultă întotdeauna că f este diferenţiabilă în (a,b). ì xy , x2 + y2 ≠ 0 , f : R2 → R . EXEMPLU : Fie f (x, y) = ïí x2 + y2 ï0, ( x, y) = (0,0) î Calculând derivatele parţiale ale funcţiei f în (0,0) , obţinem : f ( x,0) − f (0,0) = f ' x (0,0) = 0 x−0 f (0, y ) − f (0,0) lim = f ' y (0,0) = 0 y →0 y−0 Presupunem că f este diferenţiabilă în (0,0) , atunci : f ( x, y ) − f (0,0) = f ' x (0,0)( x − 0) + f ' y (0,0)( y − 0) + ω ( x, y ) ρ ( x, y ) lim x →0
xy care nu x + y2 este continuă în (0,0). În concluzie, f nu este diferenţiabilă în punctul (0,0).
Deci : f ( x, y ) = ω ( x, y ) x 2 + y 2 , adică ω ( x, y ) =
2
Definiţie echivalentă pentru proprietatea de diferenţiabilitate :
LEMĂ : Dacă ω : A ⊂ R 2 → R este continuă şi nulă în punctul (a , b ) ∈ int A , atunci există două funcţii ω1 , ω 2 : A → R , continue şi nule în (a,b) astfel încât : ω( x, y) ( x − a)2 + ( y − b)2 = ω1 ( x, y)(x − a) + ω2 ( x, y)( y − b) şi reciproc. DEMONSTRAŢIE : (i)
Prin ipoteză , lim ω ( x, y ) = ω (a, b) = 0 . x →a y →b
( x − a) ì ω ( x, y ) , ( x , y ) ≠ ( a , b) Definim : ω1 ( x, y ) = ïí ρ ( x, y ) ï0, ( x, y ) = ( a, b) î ( y − b) ì , ( x, y ) ≠ ( a, b) ïω ( x, y ) ρ ( x, y ) ω 2 ( x, y ) = í ï0, ( x, y ) = ( a, b) î
Atunci :
ω( x, y) [(x − a)2 + ( y − b)2 ] = ω(x, y)ρ(x, y) ρ( x, y) Vom arăta acum că ω 1 ( x, y ) este continuă în (a,b). Într-adevăr, x−a ω ( x, y )( x − a ) 0 ≤ ω1 ( x , y ) − 0 = = ω ( x, y ) ≤ ω ( x, y ) . ρ ( x, y ) ρ ( x, y ) lim ω1 ( x, y ) − 0 ≤ lim ω ( x, y ) = 0 ,deci funcţia ω 1 ( x , y ) este ω1 ( x, y)(x − a) + ω2 (x, y)(y − b) =
x →a y →b
x →a y →b
continuă în (a,b). Analog se demonstrează şi faptul că ω 2 ( x, y ) este continuă în (a,b). Fie ω 1 ( x, y ) şi ω 2 ( x, y ) continue şi nule în punctul (a,b). Notăm ω ( x, y ) astfel : x−a y−b ì , ( x, y ) ≠ ( a , b) + ω 2 ( x, y ) ïω1 ( x, y ) . ρ ( x, y ) ρ ( x, y ) ω ( x, y ) = í ï0, ( x, y ) = ( a, b) î Deci ω ( x, y )ρ ( x, y ) = ω1 ( x, y )( x − a ) + ω 2 ( x, y )( y − b ) pentru orice ( x, y ) ∈ A . (ii)
ω ( x , y ) ≤ ω1 ( x , y )
x−a
ρ ( x, y )
+ ω 2 ( x, y )
y−b
ρ (x, y )
≤ ω1 ( x , y ) + ω 2 ( x, y )
0 ≤ limω( x, y) − 0 ≤ limω1 (x, y) + limω2 ( x, y) = 0 Þ limω( x, y) = 0 = ω(a, b) x→a y→b
x→a y→b
x→a y→b
x→a y→b
Astfel am demonstrat că ω este continuă şi nulă în (a,b) . DEFINIŢIA 5.5.4. : Fie f : A ⊂ R 2 → R , (a, b ) ∈ int A . Funcţia f este diferenţiabilă în punctul (a,b) dacă există două funcţii ω1 , ω 2 : A → R , continue şi nule în (a,b) şi dacă există două numere λ şi µ astfel încât : f ( x, y) − f (a, b) = λ( x − a) + µ( y − b) + ω1 ( x, y)( x − a) + ω2 ( x, y)( y − b) PROPOZIŢIA 5.5.3. : Fie f : A ⊂ R 2 → R , (a , b ) ∈ int A . Dacă f admite derivate parţiale continue într-o vecinătate a punctului (a,b) , atunci f este diferenţiabilă în (a,b) . DEMONSTRAŢIE : Pentru orice ( x , y ) ∈ V (a , b ) , conform teoremei lui Lagrange, avem : f ( x, y ) − f ( a, b) = f ' x (α , y )( x − a ) + f ' y ( a, β )( y − b) , unde α este cuprins între a şi x , iar β este cuprins între b şi y. Adunăm şi scădem f ' x ( a, b)( x − a ) + f ' y ( a, b)( y − b) . Avem : f ( x, y) − f (a, b) = f ' x (a, b)(x − a) + f ' y (a, b)( y − b) + [ f ' x (α, y)(x − a) + + f ' y (a, β )( y − b) − f ' x (a, b)(x − a) − f ' y (a, b)( y − b)]
Notăm : ω1 ( x , y ) = [ f ' x (α , y ) − f ' x ( a, b)] ω 2 ( x, y ) = [ f ' y ( a, β ) − f ' y ( a, b)] Rezultă : f ( x, y ) − f (a, b) = f ' x (a, b)( x − a) + f ' y (a, b)( y − b) + ω1 ( x, y)( x − a) + + ω2 ( x, y )( y − b)
Prin ipoteză, f ' x şi f ' y sunt continue în V(a,b) , deci :
lim ω1 ( x, y ) = ω1 ( a , b) = 0 y→b
lim ω 2 ( x, y ) = ω 2 ( a, b) = 0 x →a
Am demonstrat astfel că ω1 şi ω 2 sunt continue şi nule în (a,b) , deci f este diferenţiabilă în punctul (a,b) . În general : Fie f : A ⊂ R n → R , a = (a1 , Κ , a n ) ∈ A . DEFINIŢIA 5.5.5. : Funcţia f este diferenţiabilă în punctul a ∈ int A dacă există numerele λ1 , λ2 , Κ , λn şi există ω : A → R continuă şi nulă în punctul a , astfel încât : f ( x ) − f ( a ) = λ1 ( x1 − a1 ) + Κ + λn ( x n − a n ) + ω ( x ) ρ ( x ) unde ρ ( x ) = ( x1 − a1 ) 2 + Κ + ( x n − a n ) 2 .
5.6. Diferenţiala unei funcţii
Fie
f : A ⊂ R 2 → R , (a , b ) ∈ int A , şi f diferenţiabilă în
(a,b) . DEFINIŢIA 5.6.1. : Se numeşte diferenţială a funcţiei f în punctul (a,b) , funcţia liniară : df ( x, y; a, b ) = f ' x (a, b )( x − a ) + f ' y (a, b )( y − b ) Notăm : x-a = dx , “creşterea” variabilei x y-b = dy , “creşterea” variabilei y Atunci: df ( x, y; a , b ) = f ' x (a, b )dx + f ' y (a, b )dy . Operatorul
∂ ö æ∂ d = çç dx + dy ÷÷ ∂ x ∂ y ø è
se numeşte operatorul de
diferenţiere. Deci, dacă f este diferenţiabilă în (a,b) , atunci : æ∂ ö ∂ d ( x, y; a, b ) = çç dx + dy ÷÷ f (a, b ) ∂y ø è ∂x
EXEMPLU : f : R 2 → R , f ( x, y ) = xe x
2
+ y2
, în punctul
(1,1) . f ' x ( x, y ) = e x
2
+ y2
f ' y ( x, y ) = 2 xye x
+ 2 x 2e x 2
+ y2
2
+ y2
Þ f ' x (1,1) = 3e 2
Þ f ' y (1,1) = 2e 2
Prin urmare, df ( x, y;1,1) = 3e 2 dx + 2e 2 dy . DEFINIŢIA 5.6.2 : Diferenţiala de ordinul doi a funcţiei f în punctul (a,b) d 2 f (x, y; a, b) = f ' ' x2 (a, b)(x − a) + 2 f ' 'xy (a, b)(x − a)( y − b) + f ' ' y2 (a, b)( y − b) 2
2
este notată simbolic astfel : 2
ö æ∂ ∂ d f ( x, y; a, b ) = çç dx + dy ÷÷ f (a , b ) . ∂y ø è ∂x 2
În general : n
ö æ∂ ∂ d f ( x, y; a , b ) = çç dx + dy ÷÷ f (a, b ) = ∂y ø è ∂x n n n ∂ f (a, b) n k ∂ f (a, b) n−k 1 ∂ f (a, b) n−1 = Cn0 d x C + d xdy C + + Κ d xd k y + Κ + n n ∂xn ∂xn−1∂y ∂xn−k ∂y k n
+ Cnn
∂n f (a, b) n d y ∂y n
5.7. Formula lui variabile
Taylor
pentru
funcţii
de
mai
multe
Fie f : A ⊂ R 2 → R , (a , b ) ∈ int A . Presupunem că f admite derivate parţiale de ordinul n în punctul (a,b) şi derivatele parţiale mixte nu depind de ordinea de derivare. Atunci: 1 1 1 Tn ( x, y ) = f (a, b) + df ( x, y; a, b) + d 2 f (x, y; a, b) + Κ + d n f ( x, y; a, b) 1! 2! n! se numeşte polinomul lui Taylor de ordinul n ataşat funcţiei f în punctul (a,b).
Notăm Rn ( x, y ) = f ( x, y ) − Tn ( x , y ) , numit restul lui Taylor de ordinul n în punctul (a,b) . se numeşte formula lui f ( x , y ) = Tn ( x, y ) + Rn ( x, y ) Taylor ataşată funcţiei f în punctul (a,b) . Dacă lim Rn ( x, y ) = 0 , atunci spunem că funcţia f este x→a y →b
dezvoltabilă în serie Taylor în jurul punctului (a,b) . 1 Se poate arăta că : Rn ( x, y ) = ω ( x, y )ρ n ( x, y ) n!
ρ ( x, y ) =
(x − a )2 + ( y − b )2
,
.
æ 2 1 æ ∂f (a, b) f ( x, y) = f (a, b) + çç (x − a) + ∂f (a,b) ( y − b)ö÷÷ + 1 çç ∂ f (a2,b) (x − a)2 + 1! è ∂x ∂y ø 2! è ∂x
+2
2 n ∂2 f (a, b) ( x − a)( y −b) + ∂ f (a2, b) ( y −b)2 ö÷÷ +Κ + 1 æççCn0 ∂ f (an, b) (x − a)n +Κ + n! è ∂x∂y ∂y ∂x ø
+ Cnk
n ö ∂n f (a, b) n−k n−k n ∂ f (a, b) ( ) ( ) ( y − b)n ÷÷ + 1 ω( x, y)ρn (x, y) x − a y − b + Κ + C n n n−k k ∂x ∂y ∂y ø n!
EXEMPLU : Să se scrie polinomul Taylor de gradul doi ataşat funcţiei f : R 2 → R , f ( x, y ) = x 2 + y 2 , în punctul (1,−1) . ö 1 æ ∂2 f (1,−1) 1 æ ∂f (1,−1) ∂f (1,−1) T2 (x, y) = f (1,−1) + çç (x −1) + ( y +1) + (x −1)2 + 1! è ∂x ∂y 2! ∂x2 ö ∂ 2 f (1,−1) ∂ 2 f (1,−1) +2 ( x − 1)( y − 1) + ( y + 1) 2 ∂x∂y ∂y 2
f (1,−1) = 2 ; ∂f (1,−1) = ∂x
x +y
∂f (1,−1) = ∂y
2 2
y x +y 2
2
|(1, −1) = −
x 2
2
|(1, −1) =
2 2
∂ 2 f (1,−1) 2 2 2 ; ∂f (1,−1) ∂ 2 f (1,−1) ; = = = 2 2 ∂x 4 4 ∂x∂y 4 ∂y
T2 ( x, y) = 2 +
2 2 ( x −1) − ( y + 1)) + ((x −1)2 + 2( x −1)( y −1) + ( y + 1)2 )2 2 8
5.8. Extremele funcţiilor de mai multe variabile
Fie f : A ⊂ R 2 → R , fie (a , b ) ∈ A . DEFINIŢIA 5.8.1. : Punctul (a,b) este un punct de maxim local (relativ) al funcţiei f dacă există o vecinătate a lui (a,b) astfel încât oricare ar fi ( x, y ) ∈ V (a , b ) să avem : f ( x, y ) ≤ f (a , b ) . DEFINIŢIA 5.8.2. : Punctul (a,b) este un punct de minim local (relativ) al funcţiei f dacă există o vecinătate a lui (a,b) astfel încât oricare ar fi ( x, y ) ∈ V (a , b ) să avem : f ( x, y ) ≥ f (a , b ) . DEFINIŢIA 5.8.3. : Un punct de minim local sau de maxim local se numeşte punct de extremum local. PROPOZIŢIA 5.8.1. : Fie f : A ⊂ R 2 → R şi fie (a , b ) ∈ A un punct de extremum local al funcţiei f . Dacă există f ' x (a , b ) şi f ' y (a, b ) , atunci f ' x (a , b ) = 0 şi f ' y (a, b ) = 0 . DEMONSTRAŢIE : Fie Ab = {x | x ∈ R, ( x, b ) ∈ A} şi fie g : Ab → R , g ( x ) = f ( x , b ) . Dacă punctul (a,b) este un punct de extremum local al funcţiei f , înseamnă că punctul x = a este punct de extremum local al funcţiei g . Atunci, conform teoremei lui Fermat, g ' (a ) = 0 , adică f ' x (a , b ) = 0 . Analog, fie Aa = {y | y ∈ R, (a , y ) ∈ A} şi fie h : Aa → R , h ( y ) = f (a , y ) . Dacă (a,b) este punct de extremum local pentru funcţia f , rezultă că y = b este punct de extremum local pentru h . Deci h ' (b ) = 0 , adică f ' y (a, b ) = 0 . DEFINIŢIA 5.8.4. : Punctul (a , b ) ∈ A în care se anulează derivatele parţiale ale funcţiei f : A ⊂ R 2 → R se numeşte punct staţionar.
OBSERVAŢIE : Conform propoziţiei 5.8.1. , orice punct de extrem este punct staţionar. Reciproca nu este adevărată. Nu orice punct staţionar este punct de extrem. EXEMPLU : Fie f : R 2 → R , f ( x, y ) = x 2 − y 4 . f ' x ( x, y ) = 2 x
üï ý Þ punctul (0,0) este punct staţionar. El nu este f ' y ( x, y ) = −4 y ïþ punct de extrem deoarece : Ø oricare ar fi x ≠ 0 , f ( x,0) − f (0,0) = x 2 , deci f ( x,0) ≥ f (0,0) Ø oricare ar fi y ≠ 0 , f (0, y) − f (0,0) = −y4 ≤0 , deci f (0, y ) ≤ f (0,0) 3
TEOREMA 5.8.1. : Fie f : A ⊂ R 2 → R şi fie (a , b ) ∈ A un punct staţionar al lui f . Dacă f admite derivate parţiale de ordinul doi continue în (a,b) şi dacă : 2 ∆ (a, b ) = f ' ' x 2 (a , b ) ⋅ f ' ' y 2 (a, b ) − [ f ' ' xy (a, b )] , atunci : 1)
Dacă
2)
Dacă
3)
∆ (a, b ) > 0 ü ý Þ (a,b) este punct de minim local. f ' ' x 2 (a, b ) > 0þ
∆ (a, b ) > 0 ü Þ (a,b) este punct de maxim local. f ' ' y 2 (a, b ) < 0ý þ Dacă ∆ (a , b ) < 0 Þ (a,b) este punct “şa”.
DEMONSTRAŢIE : Scriem formula lui Taylor de ordinul 2 pentru funcţia f în punctul (a,b) : 1 1 f ( x, y ) − f ( a , b) = [ f ' x ( a, b)( x − a ) + f ' y ( a , b)( y − b)] + [ f ' ' x 2 ( a , b)( x − a ) 2 + 1! 2! 1 2 + 2 f ' ' xy ( a , b)( x − a )( y − b) + f ' ' y 2 ( a, b)( y − b) ] + ω ( x, y ) ρ 2 ( x, y ) 2!
Dăm factor comun pe ρ 2 şi avem :
f ( x, y ) − f ( a , b) = + f ' ' y 2 ( a , b)
x−a y −b 1 ( x − a)2 [ f ' ' x 2 ( a , b) + 2 f ' ' xy ( a , b) + 2 ρ ρ ρ 2!
( y − b) 2 + ω ( x, y )]ρ 2 ( x, y ) ρ2
Deoarece (a,b) este un punct staţionar, f ' x (a, b ) = 0 şi f ' y (a, b) = 0 . Notăm : α = x − a , β = y − b , A = f ' ' x2 (a, b ) , B = f ' ' xy (a , b ) , ρ ρ C = f ' ' y 2 (a , b ) Cu aceste notaţii, din relaţia de mai sus, obţinem : 1 f ( x, y) − f (a, b) = [ f ' ' x2 (a, b)α 2 + 2 f ' ' xy (a, b)αβ + f ' ' y2 (a, b)β 2 + (*) 2! + ω( x, y)]ρ 2 ( x, y) Expresia notată E(α, β ) = f ' ' x2 (a, b)α 2 + 2 f ' ' xy (a, b)αβ + f ' ' y2 (a, b)β 2 este o funcţională cu variabilele α şi β .
Observaţie : α 2 + β 2 = ( x − 2a ) + ( y − 2b ) = 1 pentru orice punct ρ ρ (x, y ) ≠ (a, b ) . Matricea formei pătratice E (α , β ) este : 2
2
æ f ' ' 2 (a, b ) f ' ' xy (a , b ) ö , f ' ' xy (a , b ) = f ' ' yx (a, b ) pentru că ÷ A = çç x f ' ' (a , b ) f ' ' y 2 (a, b )÷ ø è xy derivatele parţiale sunt continue.
Presupunând că f ' ' x 2 (a , b ) ≠ 0 şi det A ≠ 0 , aducem forma pătratică E (α , β ) la forma canonică prin metoda lui Iacobi.
∆0 = 1 ∆1 = f ' ' x2 (a, b )
∆ 2 = ∆ (a , b ) = f ' ' x 2 (a , b ) f ' ' y 2 (a , b ) − ( f ' ' xy (a , b ))
2
Atunci : E (γ , δ ) = Prin urmare : 1)
Dacă
1 f ' ' x2
(a, b )
γ2 +
f ' ' x 2 (a , b ) ∆ (a , b )
δ2
∆ (a , b ) > 0 ü ý Þ funcţionala pătratică E (γ , δ ) este f ' ' x 2 (a , b ) > 0 þ
pozitiv definită ( deci şi E (α , β ) este pozitiv definită ).
Fie m>0 minimul funcţionalei pătratice E (α , β ) pe mulţimea {(α , β ) ∈ R 2 | α 2 + β 2 = 1} . Prin urmare există V1 (a, b) astfel încât din (*) avem : f ( x, y ) − f (a, b ) ≥ 1 [m + ω ( x, y )]ρ 2 ( x, y ) . 2 Deoarece lim ω ( x, y ) = 0 , rezultă că (m + ω ( x, y ))ρ 2 ( x, y ) ≥ 0 şi x→a y →b
deci f ( x, y ) ≥ f ( a, b) , oricare ar fi ( x , y ) ∈ V1 ( a , b) , deci (a,b) este un punct de minim local pentru funcţia f . 2)
∆ (a, b ) > 0 ü Þ funcţionala pătratică E (γ , δ ) este f ' ' y 2 (a , b ) > 0ýþ
Dacă
negativ definită ( deci şi E (α , β ) este negativ definită ).
Fie M 0 , deci ecuaţia At 2 + 2 Bt + C = 0 are două rădăcini reale şi diferite t1 ≠ t 2 .
Când punctul (x,y) înconjoară punctul (a,b) , α şi β iau toate valorile cuprinse între –1 şi 1 , deci t = α ia valori între t1 şi t 2 şi β în afara lor. E (α , β ) este o formă pătratică nedefinită şi deci punctul (a,b) nu este nici punct de minim local, nici de maxim local. Este punct “şa” . EXEMPLE : 1) Să se determine punctele de extrem ale funcţiei f : R 2 → R , f ( x , y ) = x 3 + y 3 + 3xy f ' x ( x, y ) = 3x 2 + 3 y = 0 üï ý Þ A(0,0), B (− 1,−1) sunt puncte staţionare f ' y ( x, y ) = 3 y 2 + 3x = 0þï
f ' ' x 2 ( x, y ) = 6 x , f ' ' xy ( x, y ) = 3 , f ' ' y 2 ( x, y ) = 6 y .
Pentru punctul A : f ' ' x 2 (0,0) = 0 , f ' ' xy (0,0) = 3 , f ' ' y 2 (0,0) = 0 ,
deci ∆ (0,0 ) = 0 ⋅ 0 − 9 < 0 , prin urmare A este punct “şa”. Pentru punctul B : f ' ' x2 (− 1,−1) = −6 , f ' ' xy (− 1,−1) = 3 , f ' ' y 2 (− 1,−1) = −6 , deci ∆ (− 1,−1) = (− 6 ) ⋅ (− 6 ) − 9 = 27 ≥ 0
f ' ' x 2 (− 1,−1) = −6 < 0 , prin urmare, B este punct de maxim local.
2) Să se determine extremele funcţiilor : a)
f ( x, y ) = x 2 − xy + y 2 − 2 x + y ì f ' x ( x, y ) = 0 ì2 x − y − 2 = 0 Þí Þ x = 1, y = 0 í î f ' y ( x, y ) = 0 î − x + 2 y + 1 = 0 Deci A(1,0) este punct staţionar . f ' ' x2 = 2; f ' ' y 2 = 2; f ' ' xy = −1
( f ' ' xy (1,0)) 2 − f ' ' x 2 (1,0 ) ⋅ f ' ' y 2 (1,0) = −3 < 0 Þ (1,0) este un
punct de extrem f ' ' x 2 (1,0 ) = 2 > 0 , deci punctul este de minim. Minimul funcţiei este f (1,0 ) = −1 .
b)
f ( x, y ) = x 6 + 4 y 6 + 5 y 2 − 4 x 3 y 3 ìï f ' x ( x, y) = 6x5 −12x2 y3 = 0 ì6x2 ( x3 − 2 y3 ) = 0 Þ Þ í í 5 3 2 ïî f ' y ( x, y) = 24y + 10y −12x y = 0 î2 y(12y4 + 5 − 6x3 y) = 0 ìx = 0 Þí îy = 0 ìx = 0 Þí 4 3 î12 y + 5 − 6 x y = 0
nu are soluţii.
ìx3 − 2 y 3 = 0 ìx = 0 Þí Þí îy = 0 îy = 0
ìx3 − 2 y 3 = 0 nu are soluţii. Þí 4 3 12 y + 5 − 6 x y = 0 î
Deci punctul (0,0) este punct staţionar. f ' ' x 2 ( x , y ) = 30 x 4 − 24 xy 3 f ' ' xy ( x , y ) = −36 x 2 y 2 f ' ' y 2 ( x, y ) = 120 y 2 − 24 x 3 y + 10 ( f ' ' xy (0,0)) 2 − f ' ' x 2 (0,0) ⋅ f ' ' y 2 (0,0) = 0
f ( x, y) − f (0,0) = ( x 3 − 2 y 3 )2 + 5 y 2 ≥ 0 , (∀)( x, y) ∈ R2 Þ (0,0) este punct de minim.
3) Să se găsească extremele funcţiei : f ( x, y) = ax2 + 2xy + ay2 + 1, a fiind un parametru real. ì f ' x = 2(ax + y ) = 0 ìax + y = 0 Þí Þ (0,0) este punct staţionar. í î f ' y = 2(ay + x) = 0 îay + x = 0
f ' ' xy = 2;
f ' ' x 2 = 2 a;
f ' ' y 2 = 2a .
( f ' ' xy ) 2 − f ' ' x 2 ⋅ f ' ' y 2 = 4 − 4a 2 = −4( a 2 − 1)
Dacă a 2 − 1 < 0 ⇔ a ∈ ( −1,1) , nu avem punct de extrem în (0,0) .
Dacă a 2 − 1 > 0 ⇔ a ∈ (− ∞,−1) ∪ (1, ∞) , există extrem în (0,0 ) , astfel : Ø a ∈ (− ∞,−1) Þ (0,0 ) este punct de maxim Ø a ∈ (1, ∞ ) Þ (0,0 ) este punct de minim Dacă a = 1 Þ f ( x, y ) = x 2 + 2 x + y 2 + 1 = ( x + y )2 + 1 şi are cea mai mică valoare pentru x = y = 0 , dar aceeaşi valoare o are pentru orice x şi y pentru care x + y = 0 , deci (0,0 ) nu este singurul punct de minim. Dacă a = −1 Þ f ( x, y) = 1 − ( x − y)2 şi are în origine cea mai mare valoare. Aceeaşi valoare o are şi când x = y , deci există extreme în toate aceste puncte. 5.9. Metoda celor mai mici pătrate
Să presupunem că funcţia f : [a , b] → R este cunoscută în punctele x1 < x 2 < Κ < x n . Fie yi = f ( xi ) , i = 1, 2, …, n. Altfel spus, să presupunem că cunoaştem “norul” de puncte
xi
x1
x2
…
xn
yi
y1
y2
…
yn
y2 y3
y1
x1
yn-1
yn
x2 x3 … xn-1 xn
Ne punem problema să determinăm un polinom de gradul m ( m a . ∞
DEFINIŢIA 6.2.1. : I 1 = ò f ( x )dx este convergentă dacă a
lim ò f ( x )dx există şi este finită. b
b →∞ a
∞
Deci I 1 = ò f ( x )dx = lim ò f ( x )dx dacă limita există şi este b
b →∞ a
a
finită .
Dacă limita nu există sau este ± ∞ , atunci I 1 este divergentă. DEFINIŢIA 6.2.2. : I 2 = ò
b
−∞
lim
ò f (x )dx b
a → −∞ a
f ( x )dx este convergentă dacă
există şi este finită.
Deci I 2 = ò
b
−∞
f ( x )dx = lim
ò f (x )dx b
a → −∞ a
dacă limita există şi
este finită. Dacă limita nu există sau este ± ∞ , atunci I 2 este divergentă. DEFINIŢIA 6.2.3. : Dacă I 1 şi I 2 sunt convergente, atunci şi I 3 = ò
∞
−∞
f ( x )dx = ò
c
−∞
∞
f ( x )dx + ò f ( x )dx , unde c ∈ R , este c
convergentă şi are ca valoare suma I 2 + I 1 .
Dacă cel puţin una din integralele I 1 sau I 2 este divergentă, atunci şi I 3 este divergentă. EXEMPLE :
[
]
b ∞ é 1 ù I 1 = ò e − x dx = lim ò e − x dx = lim − e − x |b0 = lim ê− b + 1ú = 1 0 b→ ∞ 0 b→ ∞ b→ ∞ ë e û ∞ 1 2) Să se arate că dacă a > 0 , integrala improprie I = ò p dx este a x convergentă pentru p > 1 şi divergentă pentru p ≤ 1 .
1)
Ø Dacă p > 1 : b 1 a1−p é 1 1−p ù b 1 dx = limò x−pdx = limê x ú |a = limb1−p − a1−p = p b→∞ a x b→∞ a b→∞ 1− p p −1 û 1− p b→∞ ë şi este convergentă. b
I = limò
Ø Dacă p = 1 :
I = lim[ln x ] |ba = ∞ , deci este divergentă. b→∞
[
]
Ø Dacă p < 1 : b 1 1 [x1− p ] |ba = 1 −1 p lim [b1− p − a1− p ] = ∞ , I = lim ò p dx = lim b→ ∞ a x b→∞ 1 − p b→ ∞ deci este divergentă. 6.3. Integrale în care funcţia f este nemărginită într-un punct al intervalului de integrare Fie funcţia f : [a, b] → R .
|
a a +ε b 1) lim f ( x ) = ±∞ x →a x >a
DEFINIŢIA 6.3.1. : Integrala I1 = f ( x )dx = lim ò ò b
b
ε →0 a +ε ε >0
a
f ( x)dx
este convergentă dacă limita există şi este finită. Dacă limita nu există sau este ± ∞ , atunci I 1 este divergentă . 2) lim f ( x ) = ±∞ x →b x 0
f (x)dx
este convergentă dacă limita există şi este finită. Dacă limita nu există sau este ± ∞ , atunci I 2 este divergentă . 3) Există c ∈ (a, b ) astfel încât lim f ( x )dx = ±∞ x →c
c−ε
I3 = ò f ( x)dx = ò f ( x)dx + ò f ( x)dx = limò b
c
b
a
a
c
ε →0 a ε >0
f ( x)dx + limò f ( x)dx = I2 + I1 b
ε →0 c−ε ε >0
Dacă I 1 şi I 2 sunt convergente, atunci şi I 3 este convergentă şi I 3 = I 1 + I 2 . Dacă cel puţin una din integralele I 1 sau I 2 este
divergentă, atunci I 3 este divergentă. EXEMPLE : 1)
5
I1 = ò
2
5 dx dx = lim ò = limln(x − 2) |52+ε = lim(ln 3 − lnε ) = + ∞ , 2 + ε 0 0 ε → ε →0 x − 2 ε >0 x + 2 εε → >0 ε >0
deci este divergentă. 2)
3)
1
1
0
1− x
I2 = ò
2
dx = lim[arcsin x] |10−ε = lim(arcsin(1 − ε ) − arcsin0) = ε →0 ε >0
ε →0 ε >0
π 2
2 1−ε 2 I 3 = ò ln x − 1 dx = lim é ò ln(1 − x )dx + ò ln( x − 1)dx ù úû 0 1−ε ε →0 ê ë0 ε >0 1−ε
I1 = limò ln(1− x)dx= lim[(1− x) ln(1− x) −(1− x)] |10−ε = lim[ε lnε −ε +1ln1−1] = −1 ε→0 0 ε>0
ε→0 ε>0
ε→0 ε>0
I2 = limò ln(x −1)dx= lim[(x −1) ln(x −1) − (x −1)] |12+ε = lim[1ln1−1−ε lnε +ε] = −1 2
ε→0 1−ε ε>0
ε→0 ε>0
ε→0 ε>0
Deci I 3 = I 1 + I 2 = −2 . CRITERIU DE CONVERGENŢĂ : ( fără demonstraţie ) Fie f , g : [a , b ) → R , [a, x ] ⊂ [a, b) . Dacă : 1)
0 ≤ f ( x ) ≤ g ( x ) şi
ò f (x )dx b
a
integrabile
ò g (x )dx b
a
este convergentă.
pe
orice
interval
este convergentă, atunci şi
2)
0 ≤ f ( x ) ≤ g ( x ) şi
ò g (x )dx b
ò f (x )dx b
este divergentă, atunci şi
a
este divergentă.
a
6.4. Integrale Euleriene Ø Integrala Gamma ( integrală Euler de speţa a-2-a ) ∞
(1) Γ(a ) = ò x a −1e − x dx 0
Aceasta este o integrală improprie (generalizată) şi depinde de parametrul “a”. PROPRIETĂŢI : Γ(a ) este convergentă pentru a>0 . Γ (1) = 1 . Formula de recurenţă : Γ(a ) = (a − 1)Γ(a − 1) , oricare ar fi a>1 . Γ(n ) = (n − 1)⋅! P5. Γæç 1 ö÷ = π è2ø
P1. P2. P3. P4.
DEMONSTRAŢIE : P1. Pentru a studia convergenţa integralei o vom descompune în două integrale. Γ(a ) = I 1 + I 2
∞
1
, I 1 = ò x a −1e − x dx , I 2 = ò x a −1e − x dx 0
1
1
I 1 = ò x a −1e − x dx este convergentă deoarece : 0
lim( x − 0) ⋅ f ( x) = limxα α
x→0 x>0
x→0 x>0
e−x = 1 dacă α = 1 − a . Cum a>0, rezultă x1−a
α < 1. Pentru I 2 aplicăm criteriul corespunzător integralelor generalizate cu limite infinite. Criteriul este următorul :
Fie f : [a, ∞ ) → R, a > 0, f ( x ) > 0 , oricare ar fi x ∈ [a, ∞ ) . Dacă lim x α f ( x ) = L (finit), atunci : x→∞
∞
ò f ( x )dx este convergentă.
1)
pentru α > 1 ,
2)
pentru α ≤ 1 şi L ≠ 0 integrala este divergentă.
a
Calculăm lim x β f ( x ) = lim x β x a −1e − x = lim x
β +a −1
= 0 , dacă β > 1 . ex Deci, funcţia Γ(a ) este convergentă oricare ar fi a>0 . x →∞
P2.
Γ(1) =
x →∞
ò
∞
0
x →∞
e − x dx , F (u ) = ò e − x dx , u ∈ [0, ∞ ) u
0
F (u ) = −e − x |u0 = −e − u + 1 , lim F (u ) = 1 . u →∞
P3.
∞
∞
∞
0
0
0
Γ(a) = ò xa−1e−xdx = −xa−1e−x |0∞ +ò (a −1)xa−2e−xdx = (a −1)ò xa−2e−xdx Þ
Þ Γ(a ) = (a − 1)Γ(a − 1) .
Integrarea o vom face prin părţi. f = x a −1 , f ' = ( a − 1) x a − 2 g ' = e − x , g = −e − x P4.
P5.
Γ(n) = (n −1)Γ(n −1) = (n −1)(n −2)Γ(n −2) =Κ = (n −1)(n −2) ⋅Κ ⋅1⋅ Γ(1) Þ Þ Γ(n ) = ( n − 1)! 1
−x
∞ − ∞ e æ1ö Γç ÷ = ò x 2 e − x dx = ò dx 0 0 x è2ø
∞ 2 Schimbarea de variabilă x = t 2 conduce la : Γæç 1 ö÷ = 2 ò e −t dt = π 0 è2ø ∞
EXEMPLU : Să se calculeze : Γ(a ) = ò x 2 n e − ax dx , a > 0 2
0
Notăm ax2 = y Þ x 2 = y Þ x = y = 1 y Þ dx = 1 ⋅ 1 dy a a a a 2 y Dacă x = 0 Þ y = 0 . Dacă x → ∞ Þ y → ∞ .
2n+1 2n 2n+1 1 1 æ 1 ö æ 2n +1ö æ 1 ö −y æç 1 1 ö÷ æ 1 ö ∞ n−2 −y Γ(a) = ò ç y÷ e ç ⋅ dy÷ = ç ÷ ò y e dy= ç ÷ Γç ÷= 0 0 2è a ø è 2 ø è a ø è a 2 y ø è aø ∞
2 n +1
1æ 1 ö ( 2n − 1)! = ç π ÷ 2 n −1 2è a ø 2 ( n − 1)! æ 2n +1ö 2n −1 æ 2n −1ö 2n −1 2n −3 æ 2n −3ö 2n −1 2n −3 1 æ 1ö ⋅ ⋅Κ ⋅ ⋅ Γç ÷ = Γç Γç ⋅ Γç ÷= ÷= ÷= 2 è 2 ø 2 2 2 è 2ø è 2 ø 2 è 2 ø 2 =
π ( 2n − 1)! ( 2n − 1)! π ⋅ = 2 n −1 n 2 2 ⋅ 4 ⋅ 6 ⋅ Κ ⋅ ( 2n − 2) 2 ( n − 1)!
Ø Integrala Beta (2) β (a , b ) = ò x a −1 (1 − x )b−1 dx 1
0
PROPRIETĂŢI : P1. β (a, b ) este convergentă pentru a>0 , b>0 . P2. β (a , b ) = β (b, a ) P3. Formula de recurenţă în raport cu primul parametru : a −1 β (a, b ) = β (a − 1, b ) a + b −1 P4. Formula de recurenţă în raport cu ambii paramentrii : a −1 b −1 β (a, b ) = β (a − 1, b − 1) ⋅ a + b −1 a + b − 2 P5. Integrala Beta are următoarele forme : ∞
(i)
β (a , b ) = ò y a −1 (1 + y ) −( a +b ) dy
(ii)
β (a, b ) = 2 ò 2 (cos t )
0
P6. β (a, b ) = Γ(a ) ⋅ Γ(b ) Γ(a + b )
π
0
2 a −1
(sin t )2b−1 dt
DEMONSTRAŢIE : P1. Pentru a>1 şi b>1, funcţia f ( x ) = x a −1 (1 − x )b−1 este continuă pe [0,1] şi deci integrabilă.
Pentru 0 < a ≤ 1 , 0 < b ≤ 1 ( observaţie : într-unul din cazuri, integrala este improprie ) , lim f ( x ) = ∞ , lim f ( x ) = ∞ . x →0 x >0
Fie c ∈ (0,1) . β (a, b) =
c 0
x →1 x a
convergentă pentru 1 − a < 1 Þ a > 0 . Pentru I 2 , lim(1 − x )1−b f ( x ) = 1 . Deci integrala I 2 este x →b x 0 . P2. β(a, b) = ò xa−1(1 − x)b−1dx = −ò (1 − y)a−1 yb−1dy = ò yb−1(1− y)a−1dy = β(a, b) 1
0
1
0
1
0
Notăm x = 1 − y Þ dx = −dy . x = 0 Þ y = 1, x = 1Þ y = 0
1 1 P3. β (a, b) = ò xa−1 (1 − x)b−1 dx = − 1 x a−1 (1 − x)b |10 + a − 1 ò xa−2 (1 − x)b dx = 0 b b 0 1 a − 1 1 a −2 a − 1 a − 1 1 a −1 b b −1 b −1 = x (1 − x ) dx = x a −2 (1 − x ) dx − x (1 − x ) dx = ò ò b 0 b 0 b ò0 a −1 a −1 = β (a − 1, b ) Þ β (a, b ) = β (a − 1, b ) b a + b −1
f = x a −1 , f ' = ( a − 1) x a − 2 1 b −1 g ' = (1 − x ) , g = − (1 − x )b b
P4. β (a, b ) =
=
a −1 a −1 β (a − 1, b ) = β (b, a − 1) = a + b −1 a + b −1
a −1 b −1 a −1 b −1 ⋅ β (b − 1, a − 1) = ⋅ β (a − 1, b − 1) a + b −1 a + b − 2 a + b −1 a + b − 2
P6.
β (a, b ) =
Γ(a ) ⋅ Γ(b ) Γ(a + b ) ∞
Pentru t>0 , I 1 = ò x a −1e −tx dx . 0
Notăm tx = y Þ x = y Þ dx = 1 dy . Dacă x = 0 Þ y = 0 , t t dacă x → ∞, y → ∞ .
ò
∞
0
x a −1e −tx dx = ò
∞
0
Înlocuim
pe
∞ y a −1 − y 1 1 e dy Þ ò x a −1e −tx dx = a Γ(a ) a −1 0 t t t t cu t+1 şi pe a cu a+b
:
1 Γ(a + b ) . Înmulţim această relaţie cu (t + 1) a +b t b−1 şi apoi integrăm de la 0 la ∞ în raport cu t. ∞ ∞ ∞ 1 b−1 a + b−1 − ( t +1) x b−1 ò0 t éêëò0 x e dx ùúûdt = Γ(a + b) = ò0 t (t + 1) a+b dt
ò
∞
0
x a +b−1e −( t +1) x dx =
∞ t b−1 é ò x a +b−1e −( t +1) x dx ùdt = Γ(a + b )β (a, b ) êë 0 úû ∞ ∞ ∞ a +b−1 − x b −1 −tx a +b−1 − x 1 ò0 x e éêëò0 t e dtùúûdx = ò0 x e x b Γ(b)dx = Γ(a + b)β (a, b) Þ
ò
∞
0
∞
Þ Γ(b) ⋅ ò x a−1e − x dx = Γ(a + b)β (a, b) Þ Γ(b) ⋅ Γ(a ) = Γ(a + b)β (a, b) Þ 0
Þ β (a, b ) =
Γ(a ) ⋅ Γ(b ) Γ(a + b )
EXEMPLU : Să se calculeze integralele : 1 3 ln x ⋅ (1 − ln x ) 4 dx 1 x 1 Notăm ln x = t şi deci dx = dt . x 1 Γ( 4)Γ(5) 3!⋅4! 1 . I = ò t 3 (1 − t ) 4 dt =β ( 4,5) = = = 0 Γ( 9) 8! 280
1.
I =ò
2.
I =ò
e
x4 dx 0 1 + x6 8
∞ − Notăm x 6 = t Þ I = 1 ò t 6 (1 + t ) −1 dt = 1 β æç 5 , 1 ö÷ = π 6 0 6 è6 6ø 3 1
Ø Integrala Euler – Poisson I=
∞ 0
2
e − x dx
(funcţia
f ( x ) = e − x este 2
continuă,
deci
integrabilă) x 2 = y Þ 2 xdx = dy Þ dx =
dacă x → ∞ Þ y → ∞ ∞
I =ò e 0
−y
dy 2x
.
Dacă x = 0 Þ y = 0 ,
π 1 ∞ − 1 æ1ö dy = ò y 2 e − y dy = Γç ÷ = 0 2 2 è2ø 2 2 y 1
1
EXEMPLU: æ 7ö æ 5ö Γç ÷ ⋅ Γç ÷ 1 5 3 1 æ 1ö 3 1 1 æ 7 5ö 1 2 2 ⋅ ⋅ ⋅ ⋅ Γç ÷ ⋅ ⋅ ⋅ I = ò sin6 x ⋅ cos4 xdx= βç , ÷ = è ø è ø = 2 ⋅ 5! 2 2 2 è 2 ø 2 2 Γ(6) 2 è 2 2ø 2 π 2 0
5⋅ 9π 3π æ 1ö ⋅ Γç ÷ Þ I = 6 = 9 2 ⋅ 5! 2 è 2ø
CAPITOLUL 7 CÂMP DE EVENIMENTE. CÂMP DE PROBABILITATE 7.1.
Noţiuni fundamentale: evenimente; probabilitatea de producere a evenimentelor.
DEFINIŢIE : Experienţa reprezintă orice act care poate fi repetat în condiţii date. Aplicarea experienţei asupra unei populaţii date se numeşte probă. DEFINIŢIE : Evenimentul reprezintă orice rezultat al unei experienţe. Noţiunea de eveniment în teoria probabilităţilor este legată de producerea sau neproducerea unui fenomen (într-o experienţă dată) şi nu de natura fenomenului. EXEMPLUL 1 : La controlul de recepţie a mărfurilor : Ø Experienţa constă în cercetarea unui lot de marfă, dacă corespunde sau nu din punct de vedere al calităţii. Ø Proba constă în cercetarea calităţii unei unităţi (unui articol) din marfa respectivă. Ø Evenimentele rezultate sunt : -articolul este corespunzător; -articolul nu este corespunzător. EXEMPLUL 2 : La aruncarea unui zar : Ø Experienţa constă în crearea condiţiilor de aruncare a zarului (masă, zar). Ø Proba constă în aruncarea zarului şi citirea feţei. Ø Evenimentele sunt asociate feţelor 1, 2, 3, 4, 5 sau 6. DEFINIŢIE : Se numeşte eveniment elementar evenimentul care se poate realiza printr-o singură probă. Dacă o experienţă are n rezultate posibile, vom nota evenimentele elementare cu ω1 , Κ , ω n . DEFINIŢIE : Notăm cu Ω mulţimea tuturor evenimentelor elementare, Ω = {ω1 , Κ , ω n } .
De exemplu, în cazul aruncării zarului, Ω = {1,2,3,4,5,6} . OBSERVAŢIE : Mulţimea Ω este evenimentul sigur (adică evenimentul care se poate realiza prin oricare din probe). DEFINIŢIE : Evenimentul care nu se produce la nici o efectuare a experienţei se numeşte evenimentul imposibil, pe care îl notăm cu Φ . DEFINIŢIE : Evenimentul care poate fie să se producă fie să nu se producă în efectuarea unei experienţe se numeşte eveniment aleator (întâmplător). Vom nota evenimentele aleatoare cu litere mari A, B, C, … Dacă evenimentele aleatoare pot fi observate de mai multe ori în condiţii identice se constată că ele se supun unor legităţi statistice. Teoria probabilităţilor studiază aceste legităţi, care permit să se prevadă desfăşurarea evenimentelor. Fiecărui eveniment A îi corespunde un eveniment contrar (opus, complementar) care se realizează atunci şi numai atunci când nu se realizează evenimentul A. Vom nota evenimentul contrar cu A sau C(A). OBSERVAŢIE : Ω = Φ ; Φ = Ω . DEFINIŢIE : Evenimentul A implică evenimentul B, dacă realizarea evenimentului A atrage după sine realizarea evenimentului B. Notăm A ⊂ B . OBSERVAŢIE : Dacă A este un eveniment şi Ω este evenimentul sigur, evident A ⊂ Ω . DEFINIŢIE : Dacă A ⊂ B şi B ⊂ A , atunci evenimentele A şi B sunt echivalente. 7.2. Operaţii cu evenimente Fie evenimentele A şi B. DEFINIŢIE : Evenimentul a cărui producere constă în producerea a cel puţin unuia din evenimentele A şi B se numeşte
reuniunea (suma) evenimentelor. Se notează cu A ∪ B şi se citeşte A sau B. DEFINIŢIE : Evenimentul care constă în producerea simultană a evenimentelor A şi B se numeşte intersecţia (produsul) evenimentelor. Se notează cu A ∩ B şi se citeşte A şi B. n
n
i =1
i =1
În general, S = Υ Ai şi I = Ι Ai . DEFINIŢIE : Două evenimente sunt incompatibile dacă nu se pot produce simultan. Deci A ∩ B = Φ . OBSERVAŢIE : A ∩ A = Φ . DEFINIŢIE : Diferenţa evenimentelor A–B este evenimentul care se produce atunci şi numai atunci când se produce A şi nu se produce B. Avem : A − B = A ∩ B . Proprietăţi ale operaţiilor cu evenimente : A∪ B = B ∪ A ( A ∪ B) ∪ C = A ∪ ( B ∪ C ) A∪ A = A A∪Φ = A A∪Ω = Ω A∪ A = Ω ( A) = A
Φ =Ω æ n çç Υ A i è i =1
ö ÷÷ = ø
A∩ B = B ∩ A ( A ∩ B) ∩ C = A ∩ ( B ∩ C ) A∩ A = A A∩Φ = Φ A∩Ω = A A∩ A = Φ
n
Ι
Ai
i =1
DEFINIŢIE : O mulţime nevidă K de părţi ale lui Ω se numeşte corp de evenimente dacă : a) oricare ar fi evenimentul A din mulţimea K, atunci şi evenimentul A aparţine mulţimii K. b) oricare ar fi evenimentele A şi B din mulţimea K, A ∪ B aparţime mulţimii K. CONSECINŢE :
a) Ω ∈ K Demonstraţie : dacă A ⊂ K , atunci şi A ∈ K , iar A ∪ A = Ω ∈ K , conform proprietăţilor operaţiilor cu evenimente. b) Φ ∈ K Demonstraţie : deoarece Ω ∈ K , şi Ω = Φ ∈ K . c) Dacă A, B ∈ K , atunci A − B ∈ K Demonstraţie : A − B = A ∩ B = A ∪ B ∈ K . d) Dacă A, B ∈ K , atunci A ∩ B ∈ K DEFINIŢIE : O mulţime nevidă K de părţi ale lui Ω se numeşte corp borelian de evenimente, dacă : a) oricare ar fi evenimentul A din mulţimea K, atunci şi evenimentul A aparţine mulţimii K. b)
oricare ar fi A j ∈ K , j = 1,2,... , atunci
∞
ΥA
j
∈K.
j =1
DEFINIŢIE : Se numeşte câmp finit de evenimente, o mulţime finită de evenimente elementare Ω pe care s-a definit un corp de evenimente K. Se notează (Ω, K ) . DEFINIŢIE : Se numeşte câmp borelian de evenimente o mulţime finită de evenimente elementare Ω peste care s-a definit un corp borelian de evenimente. OBSERVAŢIE : Din definiţia anterioară rezultă că în mulţimea evenimentelor câmpului (Ω, K ) există o submulţime {ω i }, i = 1,..., n numită mulţimea evenimentelor elementare. Această mulţime are următoarele proprietăţi : 1) ω i ≠ Φ , i = 1,..., n . 2) ω i ∩ ω j = Φ , i ≠ j . 3)
n
Υω
i
=Ω.
i =1
4)
există cel puţin un eveniment A ∈ (Ω, K ) , A ≠ ω i , i = 1,..., n , astfel încât A = ω i1 ∪ ... ∪ ω i p , 1 ≤ p ≤ n .
DEFINIŢIE : E1, E2 ,...,En formează un sistem complet de evenimente, deoarece :
1)
n
ΥE
i
=Ω
i =1
2)
Ei ∩ E j = Φ , i ≠ j .
7.3. Conceptul de probabilitate Pentru măsurarea şanselor de realizare a unui eveniment aleator s-a introdus noţiunea de probabilitate. Sunt cunoscute trei definiţii ale noţiunii de probabilitate. 1. Definiţia axiomatică introduce probabilitatea ca o funcţie p definită pe un câmp de evenimente cu valori în mulţimea numerelor reale. 2. Definiţia clasică a probabilităţii reduce conceptul de probabilitate la cazul evenimentelor egal posibile. 3. Definiţia statistică exprimă probabilitatea cu ajutorul frecvenţei de realizare a unui eveniment într-un număr mare de experienţe realizate în aceleaşi condiţii. DEFINIŢIA AXIOMATICĂ A PROBABILITĂŢII: Fie (Ω, K ) un câmp de evenimente. Funcţia P : (Ω, K ) → R , care asociază oricărui eveniment A ∈ (Ω, K ) numărul real P(A), cu proprietăţile : 1) P( A) ≥ 0 , oricare ar fi A ∈ (Ω, K ) , 2) P(Ω) = 1 , 3) P( A ∪ B) = P( A) ∪ P( B ) , oricare ar fi A, B ∈ (Ω, K ) , A∩ B = Φ , se numeşte probabilitate. Această definiţie a fost enunţată de A.N.Kolmogorov (1929). DEFINIŢIE : Un câmp de evenimente (Ω, K ) înzestrat cu o probabilitate P se numeşte câmp de probabilitate, şi se notează cu (Ω, K , P) .
DEFINIŢIE : Se numeşte probabilitate σ - aditivă (sau complet aditivă) pe câmpul borelian de evenimente (Ω, K ) o funcţie P : (Ω, K ) → R cu proprietăţile : 1) P( A) ≥ 0 , oricare ar fi A ∈ (Ω, K ) , 2) P(Ω) = 1 , ∞ ∞ 3) Pæçç Υ Ai ö÷÷ = å P ( Ai ) , oricare ar fi şirul è i =1 ø i =1 Ai ∩ A j = Φ , oricare ar fi i ≠ j .
( Ai )i∈N
*
∈ (Ω, K ) şi
DEFINIŢIE : Un câmp borelian de evenimente (Ω, K ) înzestrat cu o probabilitate σ - aditivă se numeşte câmp borelian de probabilitate şi se notează (Ω, K , P) . Consecinţe ale definiţiei axiomatice a probabilităţii: C1. P( A ) = 1 − P( A) Demonstraţie : Din proprietăţile operaţiilor cu evenimente ştim că Atunci deoarece A∪ A = Ω. P( A ∪ A ) = P( A) + P( A ) , A ∩ A = Φ . Rezultă că P( A ) = 1 − P( A) . C2. Dacă Ai ∈ (Ω, K ) , i = 1,..., n cu proprietatea că Ai ∩ A j = Φ , ∞ ∞ oricare ar fi i ≠ j , i, j = 1,..., n , atunci : Pæçç Υ Ai ö÷÷ = å P ( Ai ) . è i =1 ø i =1
Demonstraţie : - folosim inducţia matematică . Pentru n=2, relaţia este adevărată, conform proprietăţii numarul 3 din definiţia lui Kolmogorov. Presupunem că propoziţia este adevărată pentru n-1, adică n −1 æ n −1 ö n −1 Pçç Υ Ai ÷÷ = å P ( Ai ) . Notăm A = Υ Ai . Rezultă astfel că putem i =1 è i =1 ø i =1 scrie
n −1
ΥA
i
= A ∪ An .
i =1
n −1 n Atunci P æçç Υ Ai ö÷÷ = P( A) + P( An ) = å P( Ai ) . i =1 è i =1 ø
C3.
n
å P(ω ) = 1 , unde ω , ω i =1
1
i
2
,..., ω n sunt evenimentele elementare
ale mulţimii Ω . n
Υω
Demonstraţie:
i
şi
=Ω
ωi ∩ωj = Φ,
i ≠j.
Atunci
i =1
æn ö PççΥωi ÷÷ = P(Ω) = 1, deci è i=1 ø
n
åP(ω ) =1. i=1
i
C4. Dacă A, B ∈ (Ω, K ) şi A ⊂ B , atunci P( A) ≤ P( B) . p
Demonstraţie: Dacă A ⊂ B , atunci A = Υω i şi B = i =1
ω i ∩ ω j = Φ , i≠j. Deci :
p
P( A) = å P(ω i ) i =1
şi
p
P ( B ) = å P(ω i ) + i =1
p+q
Υω
i
. Ştim că
i =1
q
å P(ω ) .
i = p +1
i
Dar
P(ω i ) ≥ 0 , de unde rezultă că P( A) ≤ P( B) .
C5. Oricare ar fi evenimentul A ⊂ (Ω, K ) , este adevărată relaţia 0 ≤ P( A) ≤ 1 . Demonstraţie: Oricare ar fi A ∈ (Ω, K ) , Φ ⊂ A ⊂ Ω , deci vom avea P(Φ ) ≤ P( A) ≤ P(Ω) , adică 0 ≤ P( A) ≤ 1 . C6. Să considerăm o experienţă în care mulţimea evenimentelor elementare cuprinde evenimente egal posibile (exemplu: aruncarea unui zar). Din C3. rezultă că P(ωi ) = 1 . Fie A ∈ (Ω, K ) , unde n k A = ω i1 ∪ ... ∪ ω ik . Atunci P( A) = P(ωi1 ) + ... + P(ωik ) , deci P( A) = . n
DEFINIŢIA CLASICĂ A PROBABILITĂŢII: Probabilitatea unui eveniment A ⊂ (Ω, K ) este egală cu raportul dintre numărul cazurilor favorabile producerii evenimentului A şi numărul total de cazuri posibile. 7.4. Probabilităţi condiţionate DEFINIŢIE : Fie (Ω, K , P ) un câmp borelian de probabilitate. Fie A, B ∈ (Ω, K , P ) cu P( A) ≠ 0 . Să presupunem că apariţia evenimentului B este condiţionată de apariţia evenimentului A. Vom nota această probabilitate condiţionată cu PA (B ) sau P( A ∩ B ) P( B / A) . Atunci PA ( B ) = = P ( B / A) . P ( A) Proprietăţi ale probabilităţilor condiţionate: Proprietatea 1 : {Ω, K , PA ( B )} este probabilitate.
un
câmp
(chiar
borelian)
Demonstraţie: Verificăm ipotezele : 1. PA ( B ) ≥ 0 deoarece P( A ∩ B ) ≥ 0 şi P( A) > 0 2. PA (Ω ) = 1 P ( A ∩ Ω) P( A) PA (Ω) = = =1 P ( A) P( A) 3. PA ( B1 ∪ B2 ) = PA ( B1 ) + PA ( B2 ) P[(B1 ∪ B2 ) ∩ A] P[(B1 ∩ A) ∪ (B2 ∩ A)] = = PA ( B1 ∪ B2 ) = P( A) P( A) P ( B1 ∩ A) P( B2 ∩ A) = + = PA ( B1 ) + PA ( B2 ) P( A) P ( A) În această demonstraţie avem în vedere faptul B1 ∩ B2 = Φ şi ( B1 ∩ A) ∩ ( B2 ∩ A) = B1 ∩ B2 ∩ A . Proprietatea 2 : Dacă P( A) ≠ 0 şi P(B) ≠ 0 , relaţia P( A) ⋅ PA ( B) = P( B) ⋅ PB ( A) .
atunci
este
de
că
adevărată
Demonstraţie: P( A ∩ B ) , de unde P ( A ∩ B ) = P ( A) ⋅ PA ( B ) PA ( B ) = P ( A) P( B ∩ A) , de unde P ( B ∩ A) = P ( B ) ⋅ PA ( A) PB ( A) = P( B ) Cum P( A ∩ B ) = P( B ∩ A) , avem P( A) ⋅ PA(B) = P(B) ⋅ PB ( A) şi proprietatea 2 este demonstrată. DEFINIŢIE : Evenimentele independente dacă P( A ∩ B ) = P ( A) ⋅ P( B ) .
A, B ∈ (Ω, K )
sunt
7.5. Formule de calcul ale probabilităţilor în cazul operaţiilor cu evenimente 1) Reuniunea evenimentelor incompatibile: ö n æ n P çç Υ Ak ÷÷ = å P ( Ak ) , dacă Ai ∩ A j = Φ , i ≠ j . è k =1 ø k =1 Demonstraţia este imediată, prin metoda inducţiei matematice, utilizând axioma 3 din definiţia axiomatică a probabilităţii. 2) Reuniunea evenimentelor compatibile: P( A ∪ B ) = P ( A) + P( B ) − P( A ∩ B ) (*) Demonstraţie : Evenimentele A şi B se mai pot scrie astfel: A = ( A ∩ B) ∪ ( A ∩ B ) B = ( B ∩ A) ∪ ( B ∩ A ) Deci A ∪ B = ( A ∩ B ) ∪ ( A ∩ B ) ∪ ( A ∩ B ) . Evenimentele din paranteze sunt independente două câte două. (α ) P( A ∪ B ) = P( A ∩ B ) + P( A ∩ B ) + P( A ∩ B ) P ( A) = P ( A ∩ B ) + P ( A ∩ B ) P( B ) = P( A ∩ B ) + P( A ∩ B ) Din relaţia ( α ) scădem cele două relaţii de mai sus şi obţinem: P( A ∪ B ) − P( A) − P( B ) = − P ( A ∩ B ) , de unde rezultă P( A ∪ B ) = P ( A) + P( B ) − P( A ∩ B ) .
În general, fie sistemul de evenimente compatibile { A1 ,..., An } ⊂ K . Probabilitatea producerii a cel puţin unuia dintre aceste evenimente este: æn ö n Pçç Υ Ai ÷÷ = å P( Ai ) − å P( Ai ∩ Aj ) + å P( Ai ∩ Aj ∩ Ak ) + ... + i< j i< j 0 şi p + q = 1 . X : çç x−1 ÷ è f ( x) = p ⋅ q ø
Evident: 1) f ( x ) ≥ 0 ; ∞ p 1 = = 1 , deoarece seria å q x −1 1− q p x =1 x =1 x =1 este seria geometrică de raţie 0 < q < 1 , convergentă, cu suma 1 . 1− q
2)
∞
å p⋅q
x −1
∞
= p ⋅ å q x −1 = p ⋅
8.1.1. Operaţii cu variabile aleatoare discrete; variabile aleatoare independente x Κ Fie X : æç 1 çp Κ è 1
pi = f ( x i ) ≥ 0 ;
n i =1
pi = 1 ;
xi Κ pi Κ
xn ö æy Κ ; Y :ç 1 çq Κ pn è 1
qj = f (yj ) ≥ 0 ;
m j =1
yj Κ qj Κ
ym ö . qm
q j = 1.
Evenimentul care constă în faptul că : Ø X ia valoarea xi îl notăm ( X = xi ), i=1, … , n , P( X = xi )=pi ;
Ø Y ia valoarea
îl notăm ( Y = y j ), j=1, … , m,
yj
P( Y = y j )=qj . Evenimentul care constă în faptul că X = xi şi Y = y j este ( X = xi ) ∩ (Y = y j ) , i=1, … , n; j=1, … , m . P[(X = xi );(Y = y j )] = P[(X = xi ) ∩(Y = y j )] are o probabilitate
bine determinată, notată pij . DEFINIŢIE: Variabilele aleatoare X şi Y se numesc independente dacă evenimentele ( X = xi ) şi ( Y = y j ), i=1, … , n; j=1, …, m sunt independente. În acest caz: P[( X = xi ); (Y = y j )] = P[( X = xi ) ∩ (Y = y j )] = pij = pi ⋅ q j . OPERAŢII: æx + yj ö 1) X + Y : ç i , unde pij = pi ⋅ q j , i=1, … , n; j=1, … , m . ç p ÷÷ ij è ø
æx ⋅ y ö 2) X ⋅ Y : ç i j ÷ , i=1, … , n; j=1, … , m , unde, dacă X şi Y sunt ç p ÷ è ij ø independente, pij = pi ⋅ q j . æ a ⋅ xi ö 3) a ⋅ X = çç ÷÷ , i=1, … , n . è pi ø æ xk Κ 4) X k : ç 1 çp Κ è 1
xik pi
Κ Κ
x nk ö ÷. p n ÷ø
EXEMPLU: Fie variabilele aleatoare discrete X şi Y cu repartiţiile: 1 2 ö æ−1 1 ö æ 0 X : çç ÷÷ ÷÷ şi Y : çç è 0,3 0,5 0,2 ø è 0,5 0,5 ø
1 0 2 1 3 ö æ −1 ÷÷ Þ X + Y : çç è 0,3⋅ 0,5 0,3⋅ 0,5 0,5⋅ 0,5 0,5⋅ 0,5 0,2 ⋅ 0,5 0,2 ⋅ 0,5ø 0 1 2 3 ö æ −1 ÷÷ . Þ X + Y : çç è 0,15 0,25 0,25 0,25 0,10 ø 0 −1 1 −2 2 ö æ 0 X ⋅ Y : çç ÷÷ Þ è 0,15 0,15 0,25 0,25 0,1 0,1ø 1 2ö æ− 2 −1 0 Þ X ⋅ Y : çç ÷÷ . è 0,1 0,25 0,3 0,25 0,1ø
3 6 ö æ 0 ÷÷ . 3 ⋅ X : çç 0 , 3 0 , 5 0 , 2 è ø 1 8 ö æ 0 ÷÷ . X 3 : çç è 0,3 0,5 0,2 ø
Reprezentarea grafică a funcţiilor de probabilitate: 0 1 2 æ ö EXEMPLU: X : çç ÷÷ , pi = f ( xi ) . è f (0) = 0,3 f (1) = 0,5 f (2) = 0,2 ø
Atunci graficul funcţiei de probabilitate a variabilei aleatoare X definit anterior este:
0,5 0,3 0,2 0
1
2
8.2. Variabile aleatoare continue x ö Fie variabila aleatoare X : æçç , unde x ∈ [a, b] , iar f (x ) è f ( x) este probabilitatea de apariţie a lui x.
DEFINIŢIE: Funcţia f (x ) se numeşte densitatea de probabilitate a variabilei aleatoare X. Proprietăţile densităţii de probabilitate: f ( x) ≥ 0 ;
1)
b
2)
ò f ( x )dx = 1 . a
EXEMPLE: I. Să se determine constanta „c”, astfel încât funcţia f : [a, b] → R , f ( x ) = c , să fie densitate de probabilitate a unei variabile aleatoare X. 1) f ( x ) ≥ 0 , oricare ar fi x ∈ [a, b] , deci c ≥ 0 ; b
2)
b
f ( x )dx = c ⋅ dx = c ⋅ x |ba = c (b − a ) = 1 a
a
c=
1 . b−a
x æ ö Deci: X : ç 1 , x ∈ [a, b] este o variabilă aleatoare ç f ( x) = b−a è numită variabilă aleatoare continuă uniformă pe intervalul [a , b] .
II. Să se determine constanta „k”, astfel încât funcţia f : [0, ∞) → R , f ( x ) = k ⋅ e − x , să fie densitate de probabilitate a unei variabile aleatoare X. 1) f ( x ) ≥ 0 , oricare ar fi x ≥ 0 , deci k ≥ 0 , f fiind o funcţie exponenţială 2)
∞
ò 0
∞
∞
a −1 − x f ( x )dx = k ⋅ ò e − x dx = k ⋅ Γ(1) = k = 1 , unde Γ( a ) = ò0 x e dx 0
este integrala Γ a lui Euler.
x ö Deci X : æçç ÷ , x ≥ 0 este o variabilă aleatoare pe −x ÷ è f (x) = e ø intervalul [0, ∞) .
Reprezentarea grafică a densităţii de probabilitate: Pentru funcţia de la exemplul I, reprezentarea grafică este: funcţia este continuă pe [a , b] 1 b−a
A =1
0
a
b
Pentru funcţia de la exemplul II, reprezentarea grafică este:
1 -
A =1
Într-adevăr, derivata funcţiei f este
f ' ( x ) = −e − x < 0 ,
oricare ar fi x > 0 ; şi lim f ( x ) = 0 ; f (0) = 1 . x →∞
X
f' f
0 - 1
∞ - - - - -
- - - -
- - - 0
şi deci graficul densităţii de probabilitate f (x ) este cel de mai sus.
Funcţia de repartiţie a unei variabile aleatoare: Prezentarea unei variabile aleatoare prin funcţia de probabilitate f ( xi ) sau prin densitatea de probabilitate prezintă aspecte diferite. Considerăm evenimentul ( X < x ) , x ∈ R . DEFINIŢIE: Se numeşte funcţie de repartiţie a variabilei aleatoare X, funcţia F : R → R dată de F ( x ) = P( X < x ) . OBSERVAŢIE: Variabila aleatoare X este discretă (continuă), după cum funcţia de repartiţie F (x ) este o funcţie discretă (continuă). Calculul funcţiei de repartiţie: 1) Fie variabila aleatoare discretă : x
æx Κ X : çç 1 è p1 Κ
xi pi
xi +1 Κ pi +1 Κ
xn ö pn
pi =
f ( xi )
F ( x ) = P( X < x ) = xi < x
xi < x
Reprezentarea grafică este următoarea:
1p1 +...+pn−1-
p1 + p2 p1 0
( (
( (
x1
x2
x3 ……….. x n −1
xn
0 1 2 ö EXEMPLU: X : æçç è 0,3 0,5 0,2
F (x ) 10,3+0,5-
( (
0,3 -(
x 0
1
2
2) Fie variabila aleatoare continuă: æ x ö, X : çç ÷÷ x ∈ [a, b] . è f ( x) ø F (x ) f (x )
) a
( b
Putem lărgi domeniul de definiţie al funcţiei f deoarece F se consideră pe R . x
F ( x) =
ò f (t )dt
. Reprezentarea grafică a funcţiei de
−∞
repartiţie continuă F (x ) are următoarea formă: F (x ) 1-
0
x
x æ ö EXEMPLU: X : çç , x ≥ 0. −x è f ( x) = e x
F ( x) =
x
f (t )dt = e−t dt = −e−t |0x = −e− x + 1 = 1 − e− x ;
−∞
0
F ' ( x ) = e − x > 0 ; F ' ' ( x ) = −e − x < 0 . Prin urmare, graficul funcţiei F este:
1
0 F (0) = 0 ; lim F ( x ) = 1 . x→∞
Proprietăţi ale funcţiei de repartiţie: P1. 0 ≤ F ( x ) ≤ 1 , oricare ar fi x ∈ R . Demonstraţie: F ( x ) = P( x < 1) , şi deci fiind o probabilitate, rezultă proprietatea P1. P2. F (x ) este nedescrescătoare, adică, oricare ar fi x1 ≥ x 2 , rezultă că F ( x1 ) ≥ F ( x 2 ) . Demonstraţie: ( X < x1 ) = ( X < x1 ) ∪ ( x1 ≤ X < x 2 ) . P ( X < x ) = P ( X < x1 ) + P ( x1 ≤ X < x 2 ) . 1 4 2 4 32 1 4 2 43 1 4 4 2 4 43 F ( x2 )
≥0
F ( x1 )
ì F ( x ) = 0, x ≤ a P3. Dacă x ∈ [a, b] , atunci í î F ( x ) = 1, x > b Consecinţe: lim F ( x ) = 0 , lim F ( x ) = 1 . x → −∞
x →∞
CAPITOLUL 9 CARACTERISTICI NUMERICE ALE VARIABILELOR ALEATOARE 9.1. Media; definiţie, proprietăţi Fie X variabilă aleatoare pe câmpul de probabilitate (Ω, K , P ) . xi æ ö ÷÷ , unde i = 1, Κ , n . X : çç = ( ) p f x i ø è i Atunci valoarea medie variabilei aleatoare discrete X este
DEFINIŢIE : Fie
M (X ) =
n i =1
xi f ( xi ) .
x ö , unde x ∈ [a, b] . Atunci DEFINITIE : Fie X : æçç è f ( x) valoarea medie a variabilei aleatoare continue X este
M (X ) =
b a
x ⋅ f ( x )dx .
OBSERVAŢIE ∞
i =1
:
Pentru
n → ∞,
trebuie
ca
seria
xi f ( xi ) să fie convergentă. Pentru a sau b tinzând către − ∞ sau
+ ∞ , trebuie ca integrala improprie să fie convergentă. EXEMPLE: 1 2 3 ö 1) X : æçç ÷÷ , M ( X ) = 1 ⋅ 0,2 + 2 ⋅ 0,5 + 3 ⋅ 0,3 = 2,1 . è 0,2 0,5 0,3 ø ∞ x æ ö −x 2) X : çç ÷ , x ≥ 0 , M ( X ) = ò0 xe dx = Γ( 2) = 1 . −x ÷ ( ) f x = e è ø
Proprietăţi ale mediei: æ x ö P1. Fie X : çç i ÷ , i = 1, Κ , n . Dacă λ ≤ xi ≤ µ , atunci : ÷ è f ( xi ) ø λ ≤ M(X ) ≤ µ .
n
Demonstraţie: M ( X ) = å xi f ( xi ) i =1
Adunând aceste relaţii pentru valorile indicelui i = 1, Κ , n , obţinem: n
n
i =1
i =1
λ ⋅ f ( xi ) ≤ xi ⋅ f ( xi ) ≤ µ ⋅ f ( xi ) ⋅ λ ⋅ å f ( xi ) ≤ M ( X ) ≤ µ ⋅ å f ( xi ) ,deci λ ≤ M(X ) ≤ µ , deoarece
n
å f (x ) = 1. i =1
i
P2. M ( k ) = k , adică media unei constante este o constantă. k Demonstraţie: X : æçç ö÷÷ , M (k ) = k ⋅ 1 = k . è1ø P3. Media unei constante înmulţită cu o variabilă aleatoare este egală cu constanta înmulţită cu media variabilei aleatoare. Adică: M ( a ⋅ X ) = a ⋅ M ( X ) . æx Demonstraţie: Fie X : çç 1 è p1 a ⋅ x1 Κ Atunci a ⋅ X : æç ç p è 1 Κ
Κ xn ö ÷, Κ pn ÷ø a ⋅ xn ö ÷. p n ÷ø
n
n
åp i =1
i
= 1 , M ( X ) = å xi ⋅ pi . i =1
M(a ⋅ X) = a ⋅ x1 ⋅ p1 +Κ + a ⋅ xn ⋅ pn = a ⋅ (x1 ⋅ p1 +Κ + xn ⋅ pn ) = a ⋅ M(X) .
P4. Dacă X şi Y sunt două variabile aleatoare, atunci : M ( X + Y ) = M ( X ) + M (Y ) . x Fie X : æç i ö÷ , çp ÷ è iø æ yj ö şi fie Y : çç ÷÷ , è qj ø
Demonstraţie: n
åp
i
=1
i =1
i = 1, Κ , n ,
n
M ( X ) = å xi ⋅ pi , i =1
j = 1, Κ , m ,
m
M (Y ) = å y j ⋅ q j , j =1
æ xi + y j ö ÷÷ , i = 1, Κ , n , j = 1, Κ , m . q j = 1 . Atunci X + Y : çç å j =1 è pi ⋅ q j ø m
n m
n m
n m
n
m
i=1 j=1
i=1 j=1
i=1 j=1
i=1
j=1
M(X +Y) = åå(xi + yj ) ⋅ pi ⋅ qj =ååxi ⋅ pi ⋅ qj +ååyj ⋅ pi ⋅ qj =åxi ⋅ pi åqj + n
m
i =1
j =1
+ å pi å y j ⋅ q j = M ( X ) + M (Y ) .
P5. Dacă X şi Y sunt independente, atunci: M(X ⋅Y) = M(X) ⋅ M(Y) . æx ⋅ y ö Demonstraţie: X ⋅ Y : ç i j ÷ , i = 1, Κ , n , j = 1, Κ , m . çp ⋅q ÷ è i jø n
m
n
m
i =1
j =1
M ( X ⋅ Y ) = å å xi y j pi q j = å xi pi å y j q j = M ( X ) ⋅ M (Y ) i =1 j =1
9.2. Dispersia; definiţie, proprietăţi − 2 −1 1 2ö Fie X : æçç ÷÷ , M ( X ) = 0 . Observăm că è 0,1 0,4 0,4 0,1ø valorile lui X nu diferă mult de medie. − 1000 − 5 5 1000 ö Fie Y : æçç ÷ , M (Y ) = 0 . Observăm că 0,4 0,4 0,1 ÷ø è 0,1 valorile lui Y diferă mult de medie. Împrăştierea valorilor lui Y este mai mare decât împrăştierea valorilor lui X. x x2 Κ xn ö Fie X : æç 1 şi fie M(X) media sa. Construim ç p p Κ p ÷÷ 2 nø è 1 variabila aleatoare ξ = X − M ( X ) , numită abaterea variabilei aleatoare X de la media sa. Fie m=M(X).
æ x − m x2 − m Κ ξ : çç 1 p2 Κ è p1
xn − m ö ÷ pn ÷ø
OBSERVAŢIE: M(ξ) = M[ X − m] = M( X) − M(m) = M(x) − m = 0. Deci nu putem utiliza media variabilei aleatoare abatere pentru a determina împrăştierea faţă de media sa. Din acest motiv, ca o măsură a împrăştierii valorilor unei variabile aleatoare X faţă de media sa, vom lua dispersia, notată cu D(X), unde: D( X ) = σ 2 = M (ξ 2 ) . Dispersia este media pătratului variabilei aleatoare de abatere ξ .
æ ( x − m) 2 ξ 2 : çç 1 p1 è
( x2 − m) 2 Κ p2
Κ
( xn − m) 2 ö ÷. ÷ pn ø
ξ 2 = [ X − M ( X )]2 = X 2 − 2 M ( X ) ⋅ X + M 2 ( X ) . Atunci dispersia va fi : D(X) = M(ξ 2 ) = M(X 2 ) − 2M( X)M(X) + M2 (X) = M(X 2 ) − M 2 (X) . Rezultă astfel că D( X ) = M ( X 2 ) − M 2 ( X ) . EXEMPLE : −1 0 1 ö æ1 0ö 2 1) X : æçç ÷÷ , M( X ) = 0 ; X 2 : çç ÷÷ , M( X ) = 0,6 è 0,3 0,4 0,3ø è 0,6 0,4ø 2 2 D( X ) = M ( X ) − M ( X ) = 0,6 .
æ 0 106 ö æ−1000 0 1000ö 2) Y : çç ÷÷ , M (Y 2 ) = 600000 ÷÷ , M(Y) = 0; Y 2 : çç 0 , 3 0 , 4 0 , 3 è ø è0,4 0,6 ø 2 2 D (Y ) = M (Y ) − M (Y ) = 600000 . ∞ x æ ö −x 3) X : çç ÷ , x ≥ 0 , M ( X ) = ò0 xe dx = Γ( 2) = 1 −x ÷ f ( x ) = e è ø 2 ∞ æ ö x ÷ , x ≥ 0 , M ( X ) = ò x 2 e − x dx = Γ(3) = 2! = 2 X 2 : çç −x ÷ 0 è f ( x) = e ø
D( X ) = M ( X 2 ) − M 2 ( X ) = 2 − 1 = 1 .
Proprietăţi ale dispersiei: P1. Dispersia unei constante este egală cu zero. Adică D( a ) = 0 , unde a este o constantă. Demonstraţie: D ( a ) = M ( a 2 ) − M 2 ( a ) = a 2 − a 2 = 0 . P2. Dispersia unei constante înmulţită cu o variabilă aleatoare este egală cu produsul dintre pătratul constantei şi dispersia variabilei aleatoare. Adică: D ( a ⋅ X ) = a 2 ⋅ D ( X ) Demonstraţie: D(a ⋅ X ) = M (a2 ⋅ X 2 ) − M 2 (a ⋅ X ) = a2 M ( X 2 ) −
− a 2 M 2 ( X ) = a 2 [ M ( X 2 ) − M 2 ( X )] = a 2 D( X ) .
P3. Dacă X şi Y sunt independente, atunci D(X +Y) = D(X) + D(Y) Demonstraţie: D( X + Y ) = M [( X + Y ) 2 ] − M 2 ( X + Y ) = = M( X 2 + 2XY + Y 2 ) − [M( X ) + M(Y )]2 = M( X 2 ) + 2M( X )M(Y ) + + M (Y 2 ) − M 2 ( X ) − 2 M ( X ) M (Y ) − M 2 (Y ) = D( X ) + D(Y ) . r r Consecinţa 1: D æç å X i ö÷ = å D ( X i ) , unde variabilele X i è i =1 ø i =1 sunt independente, i = 1, Κ , r . Consecinţa 2: D( a + X ) = D( X ) . Consecinţa 3: Dacă Y = a ⋅ X + b , atunci D (Y ) = a 2 D( X ) . Consecinţa 4: Dacă Z = X − Y , atunci D(Z) = D( X ) + D(Y ) . Într-adevăr, putem scrie şi deci Z = X − Y = X + ( −Y ) 2 D(Z) = D( X ) + D[(−1)Y ] = D( X ) + (−1) D(Y ) şi deci D(Z) = D( X ) + D(Y ) .
TEOREMĂ:
Fie X 1 , X 2 , Κ , X n variabile aleatoare cu n
aceeaşi medie şi dispersie. Fie Y =
åX i =1
i
=
1 n å X i , media n i =1
n n aritmetică a veriabilelor X i . Atunci D(Y ) = 1 å D( X i ) . n i =1
n n Demonstraţie: D(Y ) = Déê 1 å X i ùú = 12 ⋅ n ⋅ åD( X i ) = 1 D( X i ) . n i =1 ë n i=1 û n
9.3. Abaterea medie pătratică DEFINIŢIE: Se numeşte abatere medie pătratică a unei variabile aleatoare X, rădăcina pătrată din dispersia variabilei aleatoare. Abaterea medie pătratică, σ = D ( X ) , are în principiu proprietăţi corespunzătoare dispersiei.
9.4. Momentele unei variabile aleatoare X Momentele unei variabile aleatoare sunt valori tipice ale variabilei. Există două tipuri de momente: momente iniţiale şi momente centrate. DEFINIŢIE: Momentul iniţial de ordinul k al unei variabile aleatoare X este media variabilei aleatoare X k . mk = M ( X k ) , k = 1,2, Κ Cazuri particulare: m1 = M ( X ) , m2 = M ( X 2 ) , deci D ( X ) = m2 − m12 . DEFINIŢIE: Momentul centrat de ordinul k al unei variabile aleatoare X este media variabilei aleatoare [( X − M ( X )) k ] . µ k = M [( X − M ( X )) k ] , k = 1,2, Κ Cazuri particulare: µ1 = M[ X − M ( X )] = 0 , µ2 = [X − M( X)]2 = D( X) . æx Κ xn ö În cazul unei variabile aleatoare discrete, fie X:ç 1 , çp Κ p n è1 æxk Κ xnk ö atunci Xk : ç 1 şi ( X − m) k çp Κ p n è1
Prin urmare mk = M( X k ) =
n i=1
( x n − m) k ö ÷. ÷ pn ø n
xik pi şi µk = M[(X − m)k ] = å( xi − m)k pi , i=1
k = 1,2, Κ , n .
æ X : çç è
æ ( x − m) k Κ : çç 1 Κ p1 è
În cazul unei variabile aleatoare continue, fie x ö ì0, x ∈ ( −∞, a ) ∪ (b, ∞) , x ∈ [ a , b] , f ( x ) = í , momentele f ( x ), x ∈ [a , b] f ( x)
vor fi mk =
b a
x k f ( x )dx şi µ k =
ò
b
a
( x − m ) k f ( x ) dx , k = 1,2, Κ , n . ∞
Fie F(X) funcţia de repartiţie. Atunci mk = ò x k dF (x) şi −∞
∞
µk = ò ( x − m) dF ( x) . −∞
k
Relaţia dintre momentele iniţiale şi cele centrate: ék ù k µk = M[X − M(X)]k = M[X −m]k = Mêå(−1)k Ckjmj X k− j ú = å(−1) j Ckjmj M(X k− j ) ë j=0 û j=0 j
Dar M ( X k − j ) = m k − j . Deci avem: µ k = å ( −1) j Ckj m j mk − j . k =0
OBSERVAŢIE : Pentru k=2 , obţinem : 2
µ2 = åC2j m j mk− j = C20m2 − C21m1m1 + C22m2m0 . j=0
Dar m0 = M ( X 0 ) = M (1) = 1 şi m1 = m . Atunci µ 2 = m2 − m12 + 0 = m2 − m12 = D ( X ) . 9.5. Funcţia generatoare de momente a unei variabile aleatoare Funcţia generatoare de momente a unei variabile aleatoare se introduce pentru simplificarea calculului momentelor. DEFINIŢIE: Se numeşte funcţie generatoare de momente a unei variabile aleatoare X, valoarea medie a variabilei e tX , unde t∈R. Notăm funcţia generatoare de momente cu g : R → R , dată de g (t ) = M ( e tX ) .
deci
x x2 Κ xn ö Fie X : æç 1 o variabilă aleatoare discretă, ç p p Κ p ÷÷ 2 nø è 1 æ e tx1 e tx2 Κ e txn ö ÷ , iar funcţia generatoare de e tX = çç ÷ è p1 p 2 Κ pn ø n
momente este g(t) = M (etX ) = åetxi pi . i =1
Fie æ deci e tX = ç ç è
æ x ö, X : çç ÷÷ x ∈ [a, b] , o variabilă aleatoare continuă, è f ( x) ø e tx ö ÷ , x ∈ [a, b] , iar funcţia generatoare de momente f (x ) ÷ø b
este g(t ) = M (etX ) = ò etx f ( x)dx . a
Proprietăţi ale funcţiei generatoare de momente: P1. g (0) = 1 Demonstraţie: g (0) = M ( e t⋅0 ) = M (1) = 1 P2. Dacă X 1 , X 2 , Κ , X n sunt variabile aleatoare independente cu funcţiile generatoare de momente g1 (t ), g 2 (t ),Κ , gn (t ) , atunci funcţia generatoare de momente a variabilei aleatoare X = X 1 + X 2 + Κ + X n , este g(t ) = g1 (t ) ⋅ g2 (t ) ⋅ Κ ⋅ gn (t ) . Demonstraţie: g (t ) = M ( e tX ) = M ( e t ( X 1 + X 2 +Κ + X n ) ) = M [e tX1 ⋅ ⋅e tX 2 ⋅ Κ ⋅ e tX n ] = = M(etX1 ) ⋅ M(etX2 ) ⋅Κ ⋅ M(etXn ) = g1(t) ⋅ g2 (t) ⋅Κ ⋅ gn (t) . P3. Dacă variabila aleatoare X admite momente finite de orice ∞ tk ordin, atunci g (t ) = ⋅ mk . k = 0 k! Demonstraţie: Dezvoltăm în serie Taylor (Mc Laurin) pe e tX . Ştim t t2 tk că e t = 1 + + + Κ + + Κ . k! 1! 2! Atunci e tX va avea forma : ∞ t t2 tk tk k . e tX = 1 + X + X 2 + Κ + X k + Κ = X k! 1! 2! k =0 k! é ∞ tk k ù ∞ tk g(t ) = M (etX ) = M ê X = M( X k ) ! ! k k k =0 ëk =0
g(t ) =
∞
tk mk . k =0 k!
P4. Funcţia generatoare de momente este de n ori derivabilă în raport cu t şi g ( k ) (0) = mk sau g ( k ) (t ) |t =0 = mk . Demonstraţie: x a) Fie variabila aleatoare discretă X : æç 1 çp è 1 n
g (t ) = å e txi ⋅ pi i =1
x2 Κ p2 Κ
xn ö ÷. pn ÷ø
n
g ' (t ) = å xi ⋅ e txi ⋅ pi i =1 n
g ' ' (t ) = å xi2 ⋅ e txi ⋅ pi i =1
…………………………. n
g ( k ) (t ) = å xik ⋅ e txi ⋅ pi i =1
Înlocuind pe t cu zero, obţinem: n
g ( k ) (0) = å xik ⋅ pi = mk i =1
x ö b) Fie variabila aleatoare continuă X : æçç ÷÷ , x ∈ [a, b] . è f ( x) ø b
g(t ) = ò etx f ( x)dx a
b
b
g' (t ) = ò x ⋅ etx f ( x)dx Þ g' (0) = ò x ⋅ e0 f ( x)dx = m1 a
a
b
b
g' ' (t) = ò x ⋅ e f ( x)dx Þ g' ' (0) = ò x 2 f ( x)dx = m2 2
tx
a
a
…………………………………………………… b
b
a
a
g (k ) (t ) = ò x k ⋅ etx f ( x)dx Þ g (k ) (0) = ò x k f ( x)dx = mk
9.6. Funcţia caracteristică a unei variabile aleatoare Funcţia caracteristică a unei variabile aleatoare X se foloseşte tot pentru calculul momentelor. DEFINIŢIE: Se numeşte funcţie caracteristică a variabilei aleatoare X , valoarea medie a variabilei e itX , adică c(t) = M(eitX ) , unde t ∈ R . æ x x2 Κ xn ö Fie X : çç 1 ÷÷ o variabilă aleatoare discretă, Κ p p p 2 nø è 1 deci
æ eitx1 eitx2 Κ eitxn ö ÷ , iar funcţia caracteristică este eitX = çç ÷ è p1 p2 Κ pn ø n
c (t ) = M ( e itX ) = å e itX ⋅ p j . j =1
deci
x ö Fie X : æçç ÷÷ , x ∈ [a, b] , o variabilă aleatoare continuă, è f ( x) ø æ e itx ö ÷÷ , x ∈ [a, b] , iar funcţia caracteristică este e itX = çç è f (x ) ø b
c (t ) = M ( e itX ) = ò e itX f ( x ) dx . a
−1 1 ö æ e −it e it ö EXEMPLU: Fie X : æçç ÷÷ . ÷÷ , iar e itX = çç è 0,5 0,5 ø è 0,5 0,5 ø Funcţia caracteristică este : c(t) = M(eitX ) = e−it ⋅ 0.5 + eit ⋅ 0,5 = 0,5⋅ (e−it + eit ) . Dar e iθ = cos θ + i sin θ şi e − iθ = cos θ − i sin θ , deci putem scrie e iθ + e − iθ e iθ + e − iθ şi sin θ = . cos θ = 2 2i Astfel, funcţia caracteristică va fi : c(t ) = 0,5 ⋅ (cost − i sin t ) + 0,5 ⋅ (cost + i sin t ) = cost .
Proprietăţi ale funcţiei caracteristice: P1. Funcţia caracteristică c(t) este o funcţie uniform continuă pe R P2. c(0) = 1 Demonstraţie: c(0) = M ( e i 0 t ) = M ( e 0 ) = M (1) = 1 . P3. Dacă X 1 , X 2 , Κ , X n sunt variabile aleatoare independente cu funcţiile caracteristice c1 (t ), c2 (t ), Κ , cn ( t ) , atunci funcţia caracteristică a variabilei aleatoare X = X 1 + X 2 + Κ + X n este c(t ) = c1 (t ) ⋅ c2 (t ) ⋅Κ ⋅ cn (t ) Demonstraţie: c(t ) = M ( e itX ) = M [e it ( X1 + X 2 +Κ + X n ) ] = M [e itX1 ⋅ e itX 2 ⋅ Κ ⋅ e itX n ] = = M ( e itX 1 ) ⋅ M ( e itX 2 ) ⋅ Κ ⋅ M ( e itX n ) = = c1 (t ) ⋅ c2 (t ) ⋅Κ ⋅ cn (t ) .
Consecinţa 1:
n
Dacă Y = å λk ⋅ X k ,
λk ∈ R , unde
k =1
X1, X2,Κ , Xn sunt variabile aleatoare independente cu funcţiile n
caracteristice c1 (t ), c2 (t ), Κ , cn ( t ) , atunci cY (t ) = ∏ c X ( λk t ) . k k =1
Consecinţa 2: Un produs de funcţii caracteristice este tot o funcţie caracteristică. În particular, dacă c(t) este funcţia caracteristică a variabilei aleatoare X , atunci [c(t )]n este tot o funcţie caracteristică. P4. Fie c X (t ) funcţia caracteristică a variabilei aleatoare X şi fie Y = α ⋅ X . Atunci cY (t ) = c X (α ⋅ t ) . Demonstraţie: cY (t ) = M ( e itY ) = M ( e itαX ) = c X (α ⋅ t ) . P5. Fie variabila aleatoare X şi c X (t ) funcţia sa caracteristică. Fie Y = aX + b . Atunci cY ( t ) = c X ( at )e ibt . Demonstraţie: cY (t) = M(eitY ) = M(eit(aX+b) ) = M[ei(at) X ⋅ eitb] = e itb M [e i ( at ) X ] = e itb c X ( at ) . P6. Fie variabila aleatoare X şi c(t) funcţia caracteristică. Atunci ∞ (it ) k c (t ) = å ⋅ mk . k = 0 k! Demonstraţie: ∞ é ∞ (it) k k ù ∞ (it) k (it ) k mk , c(t) = M (eitX ) = M êå X ú=å M( X k ) = å k =0 k ! û k =0 k! ëk =0 k! ∞ (it ) k k . e itX = å X k =0 k !
P7. mk = 1k [c ( k ) (t )] |t =0 = 1k c ( k ) (0) i i Demonstraţie:
unde
x a) Fie variabila aleatoare discretă X : æç 1 çp è 1 itx1 itx2 itxn æe e Κ e ö ÷ eitX = çç ÷ è p1 p2 Κ pn ø n
c( t ) = å e
itx j
j =1
x2 Κ p2 Κ
xn ö ÷. pn ÷ø
⋅ pj
n
c' (t ) = å ix j ⋅ e
itx j
j =1
⋅ pj
…………………………. n
c ( k ) (t ) = å i k x kj ⋅ e j =1
itx j
⋅ pj
Înlocuind pe t cu zero, obţinem: n
c ( k ) (0) = i k å x kj ⋅ p j Þ c ( k ) (0) = i k M ( X k ) = i k ⋅ mk j =1
Deci mk =
1 (k ) c (0) , k = 1,2, Κ , n . ik
x ö c) Fie variabila aleatoare continuă X : æçç ÷÷ , x ∈ [a, b] . è f ( x) ø æ e itx ö ÷÷ e itX = çç è f (x ) ø b
c(t ) = ò eitx f ( x)dx a
b
c' (t ) = ò i ⋅ x ⋅ eitx f ( x)dx a
……………………………. b
c(k ) (t ) = ò i k ⋅ x k ⋅ eitx f ( x)dx a
Înlocuind pe t cu zero, obţinem: b
c(k ) (0) = i k ⋅ ò ⋅ x k ⋅ eitx f ( x)dx = i k mk a
Deci mk =
1 (k ) c (0) , k = 1,2, Κ , n . ik
9.7. Normarea (reducerea) unei variabile aleatoare X Fie variabila aleatoare X cu M ( X ) = m şi D ( X ) = σ 2 .
X −m se numeşte σ variabila normată a variabilei aleatoare X (sau redusa variabilei aleatoare X).
DEFINIŢIE: Variabila aleatoare Z =
Proprietăţi ale variabilei normate: P1. M ( Z ) = 0 Demonstraţie: M ( Z ) = M æç 1 X − m ö÷ = 1 M ( X ) − m = 0 σø σ σ èσ P2. D( Z ) = 1 Demonstraţie: D(Z) = Dæç X − mö÷ = 12 [D(x) − D(m)] = 12 ⋅σ2 =1, deoarece σ è σ ø σ D(m) = 0 . 9.8. Valoarea mediană DEFINIŢIE: Se numeşte valoare mediană a variabilei aleatoare X numărul Me care satisface relaţia P( X < Me) = P( X > Me) , adică valoarea pentru care variabila aleatoare X are aceeaşi probabilitate de a fi mai mare şi mai mică decât ea. Relaţia P( X < Me) = P( X > Me) se mai scrie şi sub forma 1 F ( Me) = 1 − F ( Me) sau 2 F ( Me) = 1 sau F ( Me) = . 2 1 Deci Me este soluţia ecuaţiei F ( x ) = . În cazul unei 2 x ö æ variabile aleatoare continue X : çç ÷÷ , x ∈ [a, b] , mediana se va è f ( x) ø Me determina din ecuaţia ò f ( x )dx = 1 . a 2 EXEMPLU:
Să se determine mediana variabilei aleatoare continue x æ ö ÷ , x ∈ [0,3] . X :ç 1 ç (2 x + 1) ÷ è 12 ø Me 1 1 1 2 2 ò0 12 (2 x + 1)dx = 12 [ Me + Me] = 2 Þ Me + Me − 6 = 0 . Me1 = −3 ∉ [0,3] şi Me2 = 2 . Deci Me = 2 . 9.9. Modul (valoarea cea mai probabilă) DEFINIŢIE: Se numeşte modul (valoarea cea mai probabilă) a variabilei aleatoare X acea valoare pentru care funcţia de probabilitate f ( xi ) , pentru variabila aleatoare discretă, respectiv densitatea de probabilitate f (x ) este maximă. OBSERVAŢIE: În cazul variabilei aleatoare continue, maximul funcţiei f (x ) se obţine prin rezultatele cunoscute ale analizei matematice În cazul variabilelor aleatoare discrete se procedează astfel: EXEMPLU: Să se determine modul variabilei aleatoare binomiale. æ x ö, x x n− x X : çç ÷÷ x = 0,1,..., n , f ( x ) = Cn p q . f ( x ) ø è Presupunem că funcţia f (x ) are o valoare maximă x * . Atunci f (x* −1) < f (x* ) şi f ( x * ) > f ( x * + 1) . f ( x* ) >1 f ( x * − 1)
Deci obţinem (1) *
*
şi
(2)
f ( x * + 1) < 1. f ( x* )
*
Cx px qn−x f ( x* ) n!(n − x* + 1)!(x* −1)! p n − x* + 1 p = x*−n1 x*−1 n−x*+1 = ⋅ = ⋅ >1Þ * f ( x −1) Cn p q x*!(n − x* )!n! q x* q Þ x*q < np− x* p + p Þ x* ( p + q) < np+ p Þ x* < np+ p , deoarece p+q =1.
f ( x* + 1) n − x* p ⋅ < 1 Þ x* ( p + q) > np − q Þ x* > np − q . = * f ( x* ) x +1 q
Deci np − q ≤ Mo ≤ np + p .
9.10. Covarianţa (corelaţia) Fie variabilele aleatoare X, cu media M ( X ) = m X şi dispersia D( X ) = σ x2 şi Y, cu media M (Y ) = mY şi dispersia D (Y ) = σ y2 . Calculând dispersia sumei celor două variabile aleatoare obţinem: D( X + Y ) = M[(X + Y − mX − mY )2 ] = M{[(X − mX )2 + (Y − mY )2 ]} = = M [( X − m X ) 2 ] + M [(Y − mY ) 2 ] + 2 M [( X − m X )(Y − mY )] .
DEFINIŢIE: Media M[( X − mX )(Y − mY )] se numeşte covarianţa celor două variabile şi se notează cov( X , Y ) . Efectuând produsul, obţinem şi o altă expresie a coverianţei: cov(X,Y) = M[XY−mY X −mXY + mX mY ] = M(XY) −mY M(X) −mX M(Y) + mX mY = = M ( XY ) − m X mY deoarece M( X ) = mX şi M (Y ) = mY . OBSERVAŢIE: Dacă X şi Y sunt variabile aleatoare independente, atunci cov( X , Y ) = 0 . Reciproc nu este adevărat. 9.11.
Coeficientul de corelaţie
Fie X, Y două variabile aleatoare cu dispersiile σ X2 şi X − m X şi σ Y2 finite şi nenule şi mediile m X şi mY . Fie X ' = σX Y − mY variabilele aleatoare normate corespunzătoare. Y'= σY (M(X’)=0, M(Y’)=0, D(X’)=1, D(Y’)=1) . DEFINIŢIE: Se numeşte coeficient de corelaţie a variabilelor aleatoare X şi Y, coverianţa variabilelor aleatoare normate X’ şi Y’ şi îl notăm cu ρ ( X , Y ) . ρ ( X , Y ) = cov( X ' , Y ' ) Avem: é X − mX Y − mY ù M[(X − mX )(Y − mY )] cov(X,Y) ρ(X,Y) = cov(X' ,Y' ) = Mê , = = σXσY σXσY σY úû ë σX
Proprietăţi ale coeficientului de corelaţie: P1. Dacă X şi Y sunt independente, atunci ρ ( X , Y ) = 0 . Deoarece cov( X , Y ) = 0 în cazul unor variabile aleatoare independente, şi ρ ( X , Y ) = cov( X , Y ) = 0 . σ XσY
Demonstraţie:
P2. − 1 ≤ ρ ( X , Y ) ≤ 1 , pentru orice X şi Y. Demonstraţie: M(X’)=0, M(Y’)=0, D(X’)=0, D(Y’)=0 , deci M ( X ' 2 ) = 1 şi M (Y ' 2 ) = 1 . Din egalitatea ( X '±Y ' ) 2 = ( X ' 2 ±2 X ' Y '+Y ' 2 ) obţinem : M [( X '±Y ' )2 ] = M ( X ' 2 ) ± 2M ( X ' Y ' ) + M (Y ' 2 ) = 2 ± 2M ( X ' Y ' ) . Cum M ( X 'Y ' ) = cov(X ' ,Y ' ) , obţinem: 1 ± ρ ( X , Y ) ≥ 0 , adică − 1 ≤ ρ( X ,Y ) ≤ 1. P3. Dacă pentru două constante reale a şi b variabila aleatoare ì1, a > 0 . Y = aX + b , atunci ρ ( X , Y ) = í î− 1.a < 0 Demonstraţie: Ştim că M(Y ) = mY = amX − b şi D(Y ) = σY2 = a2σ X2 . Atunci vom obţine: cov(X ,Y ) = M[(X − mX )(Y − mY )]M[(X − mX )(aX + b − amX − B)] = = M[(X −mX )(aX−amX )]= aM[(X −mX )(X −mX )]= M[(X −mX )2 ] = aD( X ) = aσ X2 .
ρ ( X ,Y ) =
aσ X2 aσ X2 cov( X , Y ) a = = = = ±1 . 2 σ Xσ Y σ Xσ Y | a | σ X | a |
9.12. Caracteristici ale formei de repartiţie. Simetrie şi asimetrie. DEFINIŢIE: Variabila aleatoare X definită de funcţia f(x) este simetrică faţă de valoarea medie m dacă f (m − ε ) = f (m + ε ) , oricare ar fi ε > 0 .
SIMETRICĂ
m −ε
m
m +ε
ASIMETRICĂ m −ε
m
m +ε
Proprietăţi: P1. Pentru o repartiţie simetrică, media, mediana şi modul coincid. P2. Momentele centrate de ordin impar pentru o repartiţie simetrică sunt nule µ 2 k +1 = 0 . Coeficienţi utilizaţi pentru măsurarea asimetriei: Coeficientul lui Pearson: α1 = M ( X ) − M 0 ( X ) . σX Coeficientul lui Fisher: α 2 = µ 3 . σX
CAPITOLUL 10 REPARTIŢII CLASICE 10.1.
Repartiţii discrete
10.1.1. Repartiţia binomială DEFINIŢIE: Variabila aleatoare X are o repartiţie binomială de parametrii n şi p dacă funcţia sa de probabilitate este dată de probabilitatea pn (x ) din schema urnei lui Bernoulli, adică f ( x ) = Cnx p x q n− x , x ∈ {0, Κ , n} , p ∈ (0,1) , p + q = 1 . Deci : x æ ö X : çç x x n − x ÷÷ è Cn p q ø
I. f (x ) este o funcţie de probabilitate, deoarece: 1) f ( x ) ≥ 0 , evident deoarece Cnx > 0 , p ≥ 0 , q ≥ 0 . 2)
n x =0
f ( x) =
n x =0
Cnx p x q n − x = ( p + q) n = 1n = 1 .
II. Pentru calculul mediei şi dispersiei vom folosi funcţia generatoare de momente. æ e tx ö . g (t ) = M ( e tX ) ; e tX : ç ç f ( x ) , x = 0,1, Κ , n è
Deci g(t) = M (etX ) =
n
etxCnx p x qn−x =
x=0 n −1
g ' ( t ) = npe t ( pe t + q )
m1 = g ' (0) = np( p + q )
n x=0
Cnx ( pet ) x qn−x = ( pet + q)n .
;
n −1
= np .
g ' ' (t ) = n ( n − 1) p e ( pe + q ) n − 2 + npe t ( pe t + q ) n −1 ; 2 2t
t
m2 = g' ' (0) = n(n −1) p2 ( p + q)n−2 + np( p + q)n−1 = n2 p2 − np2 + np =
= n 2 p 2 + np(1 − p ) = n 2 p 2 + npq
Deci: M ( X ) = np şi D( X ) = m2 − m12 = n 2 p 2 + npq − n 2 p 2 = npq.
Funcţia caracteristică: n
n
x =0
x=0
c(t ) = M (eitX ) = å eitxCnx p x qn−x = åCnx ( p ⋅ eit ) x qn−x = ( p ⋅ eit + q)n
Evident, m1 = M ( X ) = c ' ( 0) = np . 1 Analog se calculează m2 = 2 c' ' (0) = m2 p 2 + npq . Prin urmare, i D( X ) = m2 − m12 = npq. 10.1.2.
Repartiţia hipergeometrică
DEFINIŢIE: Variabila aleatoare X are repartiţie hipergeometrică dacă funcţia sa de probabilitate este dată de probabilitatea Pn ( X ) din schema urnei cu bilă nerevenită (Această schemă presupunea că dintr-o urnă cu N bile, din care a erau albe şi b erau negre, se extrag n bile. Pn este probabilitatea ca din cele n x n−x bile extrase x să fie albe.). Deci f ( x ) = C a CnN −a , x ∈{0,Κ , n} . CN x ö æ x n− x ÷ ç C C X : ç a N −a ÷ ç Cn ÷ N è ø
I. f (x ) este o funcţie de probabilitate, deoarece: 1) f (x) ≥ 0 , evident deoarece toate combinările sunt mai mari ca zero. x n− x n n n 2) å f ( x ) = å Ca CnN −a = 1n å Cax C Nn −−xa =1 . CN C N x =0 x =0 x =0 Pentru a calcula suma
n
åf (x) am folosit egalitatea x=0
n
åC C x=0
x a
n−x N −a
= CNn pe
care o vom demonstra în continuare. (1 + y ) a (1 + y ) b = (1 + y ) a + b (1 + y ) a = Ca0 1 + C a1 y + ... + C an −1 y n −1 + C an y n + ... + C aa y a (1 + y ) b = Cb0 1 + Cb1 y + ... + Cbn −1 y n −1 + Cbn y n + ... + Cbb y b (1 + y ) a +b = Ca0+b 1 + Ca1+b y + ... + Can+−b1 y n −1 + Can+b y n + ... + Caa++bb y a +b
Coeficientul lui y n din membrul stâng al ultimei relaţii este :
n
y n [Ca0Cbn + Ca1Cbn −1 + ... + Can −1Cb1 + Can Cb0 ] = å Cax Cbn − x . x =0
Deci
n
åC C x =0
x a
n− x b
=C
n
n a +b
Þ åC C x a
x =0
n−x N −a
=C . n N
II. Media şi dispersia: n C xC n−x M ( X ) = å x a nN −a CN x =0 (a − 1)! a! a(a − 1)! xCax = x =x =a = aCax−−11 ( x − 1)!(a − x)! x! (a − x)! x( x − 1)!(a − x)! n
n
n
x =0
x =1
x =1
å Cax C Nn−−xa = å xCaxC Nn−−xa = a å Cax−−11C Nn−−xa = aC Nn−−11 a aCn−1 ( N − 1)!n! ( N − n)! n a M ( X ) = Nn −1 = a = a = n = np , p = . N (n − 1)!( N − n)! N! CN N N
Pentru a calcula dispersia, vom calcula momentul de ordinul doi. 1 n 1 n 1 n M( X 2 ) = n x2CaxCNn−−xa = n x( x −1)CaxCNn−−xa + n xCaxCNn−−xa , unde CN x=0 CN x=0 CN x=0 2 x = x ( x − 1) + x . n n n n a! (a − 2)! x(x −1)Cax = x(x −1) = a(a −1) = a(a −1) Cax−−22 x!(a − x)! x=0 x=2 x=2 (x − 2)!(a − x)! x=2 a(a −1) n x−2 n−x a(a −1) n−2 Ca−2 CN −a + M ( X ) = CN −2 + M ( X ) = n CN x=0 CNn a ( a − 1)n! ( N − n )! ( N − 2)! a n( n − 1) n = + n = a ( a − 1) +a = N ! ( n − 2)! ( N − n )! N N ( N − 1) N na é ( a − 1)( n − 1) ù na an − a − n + N . ⋅ = +1 = N êë N −1 N N −1
M(X 2 ) =
na an − a − n + N n 2 a 2 ⋅ − 2 = N N −1 N 2 na é an − a − n + N na ù na anN − aN − nN + N − nN + na = ê − = ⋅ Në N −1 N N N ( N − 1) a ( N − a )( N − n ) n N −a N −n . =n ⋅ =a ⋅ ⋅ N N ( N − 1) N N N −1 D( X ) = M ( X 2 ) − M 2 ( X ) =
a N −a . = N N N −n . Obţinem astfel D( X ) = npq N −1
Dar
a =p N
q = 1− p = 1−
OBSERVAŢIE: Pentru N suficient de mare în raport cu n N −n N −n n putem face aproximarea Atunci ≈ = 1− . N −1 N N n ö. æ D( X ) ≈ npqç1 − N è Deci dispersia variabilei aleatoare hipergeometrice diferă de dispersia variabilei aleatoare binomiale cu un factor subunitar ce tinde către 1 când N → ∞ . 10.1.3. Repartiţia uniformă discretă DEFINIŢIE: O variabilă uniformă discretă dacă funcţia sa 1 f ( x) = . n æ1 2 Κ X :ç1 1 Κ ç èn n
aleatoare X are o repartiţie de probabilitate este de forma
x Κ 1 Κ n
nö 1÷ ÷ nø
I. f (x ) este o funcţie de probabilitate, deoarece: 1) f (x) ≥ 0 , evident n 2) å f ( x ) = n 1 = 1 n x =1 II. Media şi dispersia n 1 1 n 1 n( n + 1) n + 1 M (X ) = å x = å x = = n n x =1 n 2 2 x =1 n n 1 1 1 n(n + 1)(2n + 1) (n + 1)(2n + 1) M ( X 2 ) = å x2 = å x2 = ⋅ = n n x=1 n 6 6 x=1 2 (n +1)(2n +1) (n +1) (n +1)(4n + 2 − 3n − 3) − = = D( X) = M( X 2 ) − M2 ( X) = 6 4 12
=
( n + 1)( n − 1) n 2 − 1 = 12 12
10.1.4. Repartiţia Poisson DEFINIŢIE: O variabilă aleatoare X are repartiţie Poisson x dacă funcţia sa de probabilitate este de forma f (x) = e−λ λ , x! x ∈ N , λ > 0. æ x ö X : ç −λ λx ÷ çe ÷ x! ø è I. f ( x ) este o funcţie de probabilitate deoarece: x 1) e −λ λ ≥ 0 evident. x! x x x ∞ ∞ ∞ 2) å e −λ λ = e −λ å λ = e −λ ⋅ e λ = 1 , unde å λ este dezvoltarea x! x =0 x =0 x! x =0 x! λ lui e în serie McLaurin. II. Media şi dispersia le putem determina prin calcul direct: ∞ ∞ λx λx −1 = e −λ λ =λ. M (X ) = xe −λ x! x =0 x = 0 ( x − 1)! ∞ ∞ λx ∞ λx λx M(X 2 ) = x2e−λ = x(x −1) ⋅ e−λ + M(X) = e−λ + M(X) = x! x=0 x! x=0 x=2 (x − 2)! ∞ λ x −2 = λ2 ⋅ e −λ + M ( X ) =λ2 ⋅ e −λ e λ + M ( X ) = λ2 + λ . x = 2 ( x − 2 )! D( X ) = M ( X 2 ) − M 2 ( X ) = λ2 + λ − λ2 = λ . Funcţia caracteristică a variabilei aleatoare Poisson: ∞ ∞ it (λ ⋅ eit ) x − λ (1− eit ) . = e−λ eλ⋅e . Prin urmare c(t ) = e c(t) = åeitx f ( x) = e−λ å x! x=0 x=0 c' ( t ) = e − λ (1−e ) λ ⋅ i ⋅ eit Þ c' (0) = e − λ (1−1) λ ⋅ i ⋅ e0 1 1 M ( X ) = m1 = c' (0) = λ ⋅ i ⋅ e −λ⋅0 = λ i i it
c ' ' ( t ) = e − λ (1−e ) ( λ ⋅ i ⋅ e it ) 2 + e − λ (1−e ) λ ⋅ i 2 ⋅ e it c' ' (0) = e − λ (1−1) λ2 ⋅ i 2 ⋅ e 0 + e − λ (1−1) λ2 ⋅ i 2 ⋅ e 0 = i 2 ( λ2 + λ ) 1 m2 = 2 c' ' (0) = λ2 + λ . i Prin urmare: D( X ) = m2 − m12 = λ2 + λ − λ2 . it
it
10.2.
Repartiţii continue
10.2.1.
Repartiţia continuă uniformă
DEFINIŢIE: O variabilă aleatoare X , continuă, are repartiţie uniformă dacă funcţia sa de probabilitate este de forma 1 , x ∈ ( a , b) . f ( x) = b−a I. f (x ) este o funcţie de probabilitate deoarece: 1) f ( x ) ≥ 0 evident, deoarece b > a . b b 1 1 b b−a 2) =1 f ( x )dx = dx = dx = a a b−a a − b a b−a II. Media şi dispersia: b
M ( X ) = ò xf ( x )dx = a
1 b 1 x 2 b b2 − a 2 a + b xdx = ⋅ |a = = 2(b − a) 2 b − a òa b−a 2
b3 − a 3 a 2 + ab + b 2 = a 3(b − a ) 3 2 2 2 a + ab+ b a + 2ab+ b2 D( X ) = M( X 2 ) − M 2 ( X ) = − = 3 4 4a 2 + 4ab + 4b 2 − 3a 2 − 6ab − 3b 2 ( a − b) 2 . = = 12 12 b
M ( X 2 ) = ò x 2 f ( x) =
10.2.2. Repartiţia exponenţială negativă DEFINIŢIE: O variabilă aleatoare X are o repartiţie exponenţială negativă de parametru µ dacă funcţia sa de probabilitate este de forma f (x) = µ ⋅ e−µ⋅x , x ≥ 0 , µ > 0 .
I. f (x ) este o funcţie de probabilitate deoarece: 1) f ( x ) ≥ 0 evident. 2)
∞
∞
0
0
ò f ( x )dx = ò
µ ⋅ e − µ ⋅x dx = − e − µ ⋅x |0∞ = 0 + 1 = 1
II. Media şi dispersia: ∞
∞
∞
0
0
0
M ( X ) = ò xf ( x )dx = ò xµ ⋅ e − µ ⋅ x dx = − xe − µ ⋅ x |0∞ + ò e − µ ⋅x dx =
1 1 − e − µ ⋅x |0∞ = . µ µ În rezolvarea integralei am folosit metoda integrării prin părţi, unde u( x ) = x , du = dx , v( x ) = −e − µ ⋅x , dv = µ ⋅ e − µ ⋅ x dx ∞ ∞ 2 ∞ M ( X 2 ) = ò x2 µ ⋅ e−µ⋅xdx = −x2e−µ⋅x |0∞ +2ò xe−µ⋅x = 0 + ò xµ ⋅ e−µ⋅x = 0 0 µ 0 2 1 2 = ⋅ = 2. µ µ µ Integrala a fost calculată tot prin metoda integrării prin părţi, unde u( x ) = x 2 , du = 2 xdx , v( x ) = −e − µ ⋅x , dv = µ ⋅ e − µ ⋅ x dx . 2 1 1 D( X ) = M ( X 2 ) − M 2 ( X ) = 2 − 2 = 2 . µ µ µ 1 σ ( X ) = D( X ) = . µ Putem calcula media şi dispersia şi astfel: ∞
∞
0
0
M ( X ) = ò xf ( x )dx = ò x ⋅ µ ⋅ e − µ ⋅ x dx
Făcând schimbarea de variabilă µ ⋅ x = y Þ x = y Þ dx = 1 dy şi µ µ observând că limitele de integrare se păstrează, obţinem: ∞ y 1 1 ∞ 1 1 M (X ) = µò ⋅ e − y ⋅ dy = ò ye − y dy = Γ( 2) = 0 µ 0 µ µ µ µ 2 ∞ ∞ ∞ y La fel, M ( X 2 ) = ò x 2 f ( x )dx =µ ò x 2 e − µ⋅ x dx = µ ò 2 e − y 1 dy = 0 0 0 µ µ 1 ∞ 2 −y 1 2 . = 2 ò y e dy = 2 Γ(3) = 2 µ 0 µ µ Prin urmare, D ( X ) = M ( X 2 ) − M 2 ( X ) = 22 − 12 = 12 . µ µ µ
Repartiţia exponenţială are proprietatea M(X) =σX = 1 . µ Repartiţiile exponenţială şi Poisson sunt utilizate în modelarea şi rezlovarea problemelor legate de firele de aşteptare care apar în activitatea economică. 10.2.3. Repartiţia normală DEFINIŢIE: O variabilă aleatoare X are o repartiţie normală dacă funcţia sa de probabilitate este de forma 1 æ x −m ö
2
− ç ÷ 1 f ( x) = e 2 è σ ø , unde m ∈ R , σ > 0 (1) σ 2π Pentru a pune în evidenţă parametrii m şi σ , densitatea de probabilitate se mai notează n( x; m, σ ) , x ∈ R , σ > 0 . I. f (x ) este funcţie de probabilitate, deoarece: 1) n( x; m, σ ) ≥ 0 , evident, din definiţie.
2)
ò
∞
−∞
n ( x; m, σ )dx = 1 sau
Notăm
2
dx = 1 .
1 x−m = y , dx = dy Þ dx = σ ⋅ dy . σ σ 2
∞
1
−∞
σ 2π
ò
1 æ x −m ö ÷ σ ø
− ç 1 2 ⋅ e ò−∞ σ 2π è ∞
⋅e
1 æ x −m ö − ç ÷ 2è σ ø
∞
1
−∞
σ 2π
dx = ò
⋅e
1 − y2 2
ò 2π
σ ⋅ dy =
deoarece se ştie că integrala Euler-Poisson
1 ∞ − y2 2 −∞
1
ò
∞
−∞
e
e
1 − y2 2
dy =
2π 2π
= 1,
dy = 2π .
Graficul funcţiei de probabilitate depinde de parametrii m şi σ , forma curbei rămânând (structural) aceeaşi, şi anume forma cunoscută sub numele de clopotul lui Gauss. EXEMPLU: n( x;0, σ ) - ≈ 0,4 =
-1
0
1
1 σ 2π
1) Faţă de parametrul m , curbele n( x, m, σ ) reprezintă de fapt translaţii de-a lungul axei ox, menţinându-şi forma şi mărimea.
| 3 m = − 2
| m=0 m = 3 2
2) Faţă de parametrul σ , curbele sunt mai ascuţite sau mai plate, astfel încât aria cuprinsă între graficul curbei şi axa ox să fie egală cu 1 (unitatea de suprafaţă). Aici σ 1 < σ 2 < σ 3 .
σ1 σ2
m =
σ3
3 2
OBSERVAŢIE: Curba se apropie repede de axa ox . În raport cu o abatere x − m < 3σ , diferenţa faţă de ox este de ordinul a 0,003 unităţi. Astfel, repartiţia normală poate fi considerată definită într-un interval închis şi finit. Pentru determinarea mediei şi dispersiei vom utiliza funcţia caracteristică a variabilei aleatoare normale. ∞
c (t ) = M ( e itX ) = ò e itx n ( x; m, σ )dx −∞
(2)
Calculăm pentru început funcţia caracteristică a variabilei 1 − y2 (3) aleatoare normale normate: n( y;0,1) = 1 e 2 2π
y æ ö ç ÷ 1 Y : ç 1 − 2 y 2 ÷ Þ e itY e ç ÷ è 2π ø ∞
c(t) = ò e−ityn( y;0,1)dy = −∞
1 = 2π 1 = 2π
ò
∞
e
ö æ e ity 1 ÷ ç : ç 1 − 2 y2 ÷ . e ÷ ç ø è 2π
1 2π
1 1 − ( y 2 − 2 ity +i 2t 2 ) + i 2t 2 2 2
−∞
1 1 ∞ − ( y −it )2 − t 2 2 2 −∞
ò
e
e
1 − t2 2
dy =
e
∞
ò
eitye
−∞
−
y2 2
1 dy = 2π
1 − t2 2
2π
ò
∞
−∞
e
1 2π
dy =
ò
∞
−∞
1 − ( y −it )2 2
e
1 ∞ − ( y 2 −2ity) 2 −∞
ò
e
1 1 − ( y −it ) 2 + i 2t 2 2 2
dy =
e
1 − t2 2
2π
∞ −
ò
dy =
dy = z2 2
e dz =
−∞
− t2 2π = e 2 , unde am folosit substituţia y − it = z Þdy = dz. 2π Observăm, de asemenea, că utilizând această substituţie limitele de integrare nu se schimbă.
e
=
1
Ultima integrală este integrala Euler-Poisson. Ea este egală 2π şi se calculează astfel:
cu e
−
z2 2
∞
dz = 2 ò e
−
z2 2
1
∞ − dt = 2 ò t 2 e −t dt = 2π . ò−∞ 0 0 0 2t În calculul de mai sus am folosit substituţia : 1 2 dt z2 dt . z = t Þ zdz = dt Þ dz = ; = t Þ z = 2t Þdz = 2 z 2 2t Prin urmare, funcţia caracteristică a variabilei aleatoare ∞
∞
dz = 2 ò e it
normale normate n ( y ; 0 ,1 ) este cY (t ) = e
1 − t2 2
(4)
Fie variabila aleatoare X=α⋅Y+β. Atunci cX (t) = eiβ⋅tcY (α⋅ t)
(5)
Demonstraţie: c X = M (e itX ) = M [eit (α ⋅Y + β ) ] = M [e itα ⋅Y eitβ ] = e itβ M [e i ( tα )Y ] = e itβ cY (t ) . 1 æ x −m ö ÷ σ ø
− ç Fie variabila aleatoare normală n( x; m, σ ) = 1 e 2 è σ 2π
2
.
x −m = y Þx =σ ⋅ y + m Þ X =σ ⋅Y + m, unde σ Y = N ( y;0,1) . Aşa cum am văzut, pentru variabila aleatoare
Facem substituţia
normală normată, funcţia caracteristică este cY ( t ) = e Deci conform (5) avem:
1 − t2 2
.
1 − σ 2t 2
c X ( t ) = cσY + m (t ) = e imt cY (σ ⋅ t ) = e imt e 2 . În concluzie, funcţia caracteristică a variabilei normale n( x; m, σ ) este c X (t ) = e
1 imt − σ 2t 2 2
(6)
Calculul mediei: M ( X ) = m1 c ' ( 0) m1 = i c' X (t ) = (im − σ 2 t )e Deci M ( X ) = m .
1 itm − σ 2t 2 2
Þ c' X ( 0) = ime 0 = im Þ m1 = m .
Calculul dispersiei: D ( X ) = M ( X 2 ) − M 2 ( X ) = m2 − m12 c ' ' ( 0) m2 = 2 i c' ' (t ) = −σ 2 e
1 itm − σ 2t 2 2
+ (im − σ 2 t ) 2 e
1 itm − σ 2t 2 2
c' ' (0) = −σ 2 e 0 + (im )e 0 = −σ 2 − m 2 c ' ' (0) − σ 2 − m 2 2 = = σ 2 + m 2 (întrucât, evident, i = −1 ) i2 i2 Deci D ( X ) = σ 2 + m 2 − m 2 = σ 2 . m2 =
OBSERVAŢIE: Parametrii m şi σ ai repartiţiei normale reprezintă media şi respectiv abaterea medie pătratică. Funcţia de repartiţie ; funcţia integrală a lui Laplace: Fie variabila aleatoare normală de parametrii m şi σ : x æ ö m ∈ R , unde, aşa cum ştim, ÷÷ , σ > 0 , X : çç è n ( x; m, σ ) ø
1 æ x −m ö ÷ σ ø
− ç 1 n ( x; m , σ ) = e 2è σ 2π
2
.
Funcţia
de
repartiţie 1 æ t −m ö ÷ σ ø
− ç 1 F ( x ) = P ( X < x ) = ò n (t ; m, σ )dt = ò e 2è −∞ −∞ σ 2π x
x
este
:
2
dt
(7)
x
Notăm: N ( x; m, σ ) = ò n (t ; m, σ )dt funcţia de repartiţie a −∞
variabilei aleatoare normale.
Fie X o variabilă aleatoare normală cu densitatea de probabilitate n( x; m, σ ) şi funcţia de repartiţie N ( x; m, σ ) . Dacă facem schimbarea de variabilă Z = X − m , ştim că Z este o σ variabilă aleatoare normală normată cu media m = 0 şi dispersia σ = 1 . Deci Z are densitatea de probabilitate n (z;0,1) şi funcţia de repartiţie N ( z;0,1) . 1 æ t −m ö
2
− ç ÷ 1 (8) F ( x ) = P ( X < x ) = N ( x; m, σ ) = ò e 2 è σ ø dt −∞ σ 2π Pentru calculul integralei (8) facem substituţia: t−m x−m , iar pentru t = y Þ dt = σ ⋅ dy .Dacă t = x , atunci y = σ σ tinzând către − ∞ şi y tinde către − ∞ . Astfel, vom obţine: 1 − y2 y 1 æx−m ö ;0,1÷ . F ( x) = ò e 2 σ ⋅ dy = N ( y;0,1) = N ç −∞ σ σ 2π è ø Prin urmare, putem scrie: x−m . P( X < x ) = N ( x; m, σ ) = N ( z;0,1) , unde z = σ Reprezentarea grafică a funcţiei de repartiţie normală 1 − y2 z normată de forma N ( z;0,1) = 1 ò e 2 dy , unde z = x − m este: σ 2π −∞ x
N ( z;0,1)
1 1
2
OBSERVAŢIE: Curba N(z;0,1) este simetrică faţă de punctul 1 æ 1 ö . Dacă facem o translaţie de axe: Φ ( z ) = N ( z;0,1) − ç 0, ÷ 2 è 2ø (translaţie datorată lui Laplace), obţinem: Φ (z ) 1
2
z − 12
OBSERVAŢIE: Φ (z ) este o funcţie simetrică faţă de origine, şi deci funcţia Φ este o funcţie impară . Prin urmare este suficient să cunoaştem Φ (z ) pentru z > 0 . n (z;0,1) z
Φ ( z ) = n(t;0,1)dt 0
z
În toate cărţile şi manualele de teoria probabilităţilor şi statistică matematică, funcţia Φ(z ) este tabelată. Prin urmare, avem: N ( z;0,1) = 1 + Φ ( z ) este funcţia de 2 repartiţie a variabilei aleatoare normală normată şi 1 æ x − m ö este funcţia de repartiţie a variabilei N ( x; m, σ ) = + Φç ÷ 2 è σ ø aleatoare normală nenormată (de parametrii m şi σ ).
Calculul momentelor centrate : Momentele centrate ale variabilei aleatoare normale sunt des utilizate, în special în statistica matematică. Astfel, momentul centrat de ordinul r : 1 æ x −m ö ÷ σ ø
− ç 1 µ r = ò ( x − m ) n( x; m, σ )dx = ò ( x − m ) e 2è −∞ −∞ σ 2π ∞
∞
r
r
2
dx
Am văzut că: ∞
µ 0 = ò ( x − m ) 0 n( x; m, σ )dx = 1 Þµ 0 = 1 . −∞
2
1æ x−m ö ÷ σ ø
1 −2çè µ1 = ò (x − m) e −∞ σ 2π ∞
dx −
2
1 æ x −m ö ÷ σ ø
− ç 1 mò e 2è −∞ σ 2π ∞
2
1æ x−m ö ÷ σ ø
1 −2çè dx = ò x e −∞ σ 2π ∞
dx = 0 Þµ1 = 0
x−m = y Þ x − m = σ ⋅ y Þ dx = σ ⋅ dy şi întrucât σ σ > 0 , limitele de integrare se păstrează. Obţinem:
Notăm :
2
1æ x−m ö ÷ σ ø
σ r ∞ r −12 y σ r é r −12 y ∞ ù y e dy = ê− y e |−∞ ú + 2π ò−∞ 2π ë û 1 1 r − y y − ∞ σ ∞ 1 2 + (r − 1) y r−2e 2 dy = σ2(r −1)ò σr−2 yr−2 e dyÞµr =σ2(r −1)µr−2 ò −∞ −∞ 2π 2π
1 −2çè µr = ò σ y e −∞ σ 2π ∞
r r
σ ⋅ dy =
2
2
2
2
În rezolvarea acestei integrale am aplicat metoda integrării prin părţi, unde f = y r −1 Þ f ' = (r − 1) y r−2 , g ' = ye Deci:
µ 2 = σ 2 (2 − 1) = σ 2 µ 3 = σ 2 (3 − 1) µ1 = 0
µ 4 = σ 2 (4 − 1) µ 2 = 1 ⋅ 3 ⋅ σ 4 µ5 = 0 ………………………………. µ 2 q+1 = 0 µ 2 q = 1 ⋅ 3 ⋅ Κ ⋅ ( 2q − 1)σ 2 q
1 − y2 2
Þ g = −e
1 − y2 2
.
10.2.4. Repartiţia Gamma DEFINIŢIE: O variabilă aleatoare X are repartiţie Gamma dacă funcţia sa de repartiţie este de forma: x − ì 1 a b ∞ x e , x > 0 , unde ï Γ(a + 1) = ò x a e − x dx f ( x; a, b) = í Γ( a + 1)b a +1 0 ï0, x ≤ 0 î şi a > −1 , b > 0 . I. f (x ) este funcţie de probabilitate, deoarece: 1) f ( x; a, b) ≥ 0 , evident 2)
∞
ò
−∞
∞
f (x; a, b)dx = ò
0
x
x
− − ∞ 1 1 1 xae b dx = xae b dx = a+1 a+1 ò 0 Γ(a +1)b Γ(a + 1) b
Notăm x = y Þ x = b ⋅ y Þ dx = b ⋅ dy b ∞ 1 ∞ Γ(a + 1) 1 1 = =1 ba y a e− y b ⋅ dy = y a e− y dy = 1 a + ò ò Γ(a + 1) 0 b Γ(a + 1) 0 Γ(a + 1) Amintim câteva proprietaţi ale integralei Γ : P1. Γ(a ) = (a − 1)Γ(a − 1) P2. Γ(n ) = (n − 1)! P3. Γæç 1 ö÷ = π è2ø Demonstraţiile acestor proprietăţi se găsesc în cursurile de analiză matematică. Funcţia generatoare de momente pentru variabila aleatoare Gamma: g(t) = M(etX ) =
∞ 0
∞
etx f (x; a, b)dx = etx 0
x
− 1 xa e b dx, a > −1 b > 0 a+1 Γ(a + 1)b
Facem substituţia : y = x Þ x = b ⋅ y Þ dx = b ⋅ dy . b
Avem: ∞
g (t ) = ò e bty 0
∞ 1 1 b a y a b ⋅ dy = e bty y a ⋅ e − y ⋅ dy = a +1 ò 0 Γ(a + 1) Γ(a + 1)b
∞ ∞ 1 1 = e−y(1−bt) yady = a + 1 ò ò Γ(a +1) 0 (1− bt) 0
deoarece
ò
a+1
æ 1 ö Γ(a +1)ç ÷ è1− btø −
1
∞
a +1
e
y 1 1−bt
y 1 1−bt a
−
1
e
y dy =
1 , (1− bt)a+1
y a dy =1 , fiind densitatea de
æ 1 ö Γ( a + 1)ç ÷ è 1 − bt ø probabilitate a repartiţiei Γ . Prin urmare, putem scrie că funcţia generatoare de momente pentru Γ este g ( t ) = (1 − bt ) − ( a +1) . 0
Momentele iniţiale: Calculăm momentele iniţiale din relaţia g ( r ) (t ) |t =0 = mr , r = 1,2,.... g' (t) = −(a + 1)(1 − bt)−(a+2) (−b) = b(a + 1)(1 − bt)−(a+2) Þ m1 = g' (0) = b(a + 1) g ' ' (t ) = b 2 ( a + 1)(a + 2)(1 − bt ) − ( a +3) Þ m2 = g ' ' (0) = b 2 ( a + 1)( a + 2) ………………………………………………………………………. g(r) (t) = br (a +1)(a + 2) ⋅Κ ⋅ (a + r)(1− bt)−(a+r+1) Þmr = g(r) (0) = = b r ( a + 1)( a + 2) ⋅ Κ ⋅ ( a + r ) Deci M ( X ) = m1 = b(a + 1) şi D( X ) = m2 − m12 = b2 (a + 1)(a + 2) − b2 (a + 1)2 = b2 (a + 1)
Momentele centrate: ék ù µ k = M [ X − M ( X )]k = M [ X − m]k = M êå ( −1) j Ckj m j X k − j ú = ë j =0 û k
= å ( −1) j C kj m j M ( X k − j ) j =0
k
Deci : µ k = å ( −1) j C kj m j mk − j . j =0
OBSERVAŢIE: Pentru k = 2 obţinem: 2
µ2 = åC2jmjm2−j =C20m0m2 −C21m1m`1 +C22m2m0 = m2 −m`21 = D(X) ,
unde :
j=0
m0 = M ( X 0 ) = M (1) = 1 şi m1 = M ( X 1 ) = M ( X ) = m . Pentru k = 1 obţinem: µ1 = M ( X − m ) = M ( X ) − M ( m ) = m − m = 0
În cazul repartiţiei Γ , vom obţine: µ1 = 0 ; µ 2 = D ( X ) = b 2 ( a + 1) ; 3
µ 3 = å ( −1) j C3j m j m3− j = m3 − 3m ⋅ m2 + 3m 2 m1 − m 3m0 = j =0
= b (a + 1)(a + 2)(a + 3) −3b(a +1)b2 (a +1)(a +2) +3b2 (a +1)2 b(a +1) −b3(a +1)3 = = b 3 ( a + 1)[( a + 2)( a + 3) − 3( a + 1)( a + 2) + 3( a + 1) 2 − ( a + 1) 2 ] = 3
= b3 (a +1)[(a2 +5a + 6 −3a2 −9a −6 + 2a2 + 4a + 2] = b3(a +1)2 Þ µ3 = 2b3(a +1)
µ 4 = 3b 4 ( a + 1)( a + 3) . 10.2.5. Repartiţia Beta DEFINIŢIE: O variabilă aleatoare X are repartiţie Beta dacă densitatea sa de probabilitate este de forma: ì 1 xa−1 (1 − x)b−1 , x ∈[0,1] ï , unde a > 0 , b >0 şi f ( x; a, b) = í β (a, b) ï0 , x ∈ (−∞,0) ∪ (1, ∞) î 1
β (a, b) = x a−1 (1 − x)b−1dx 0
I. f (x ) este funcţie de probabilitate, deoarece: 1) f ( x; a , b) ≥ 0 , evident oricare ar fi x ∈ [a, b] 1 1 1 2) f ( x; a, b)dx = 1 x a −1 (1 − x ) b−1 dx = β ( a , b) = 1 0 β ( a , b) 0 β ( a , b) Reamintim câteva proprietăţi ale integralei β ( a, b) :
P1. β ( a, b) = β (b, a ) Demonstraţie: facem substituţia 1 − x = y Þ x = 1 − y Þ dx = −dy . 1
0
1
0
1
0
β (a, b) = ò xa−1(1 − x)b−1 dx = −ò (1 − y)a−1 yb−1dy = ò yb−1(1 − y)a−1 dy = β (b, a) P2. β (a, b) =
a −1 β ( a − 1, b − 1) a + b −1
P3. β (a, b) =
a −1 b −1 ⋅ β ( a − 1, b − 1) a + b −1 a + b − 2
∞ P4. β ( a, b) = Γ( a ) Γ(b) , unde Γ( a ) = ò x a −1e − x dx 0 Γ( a + b)
II. Calculul momentelor pentru calculul mediei şi dispersiei: 1 1 1 a+r−1 xa−1 (1− x)b−1 dx = x (1− x)b−1 dx = ò 0 0 0 β (a,b) β (a,b) β ( a + r , b ) Γ ( a + r ) Γ (b ) Γ ( a + b) Γ( a + r ) Γ( a + b) = = ⋅ = Γ ( a + r + b) Γ ( a ) Γ( b) Γ( a + r + b) Γ( a ) β ( a , b) 1
1
mr = ò xr f (x;a, b)dx =ò xr
Dar Γ ( a + 1) = a Γ ( a ) Þ Γ ( a + r ) = ( a + r − 1) Γ ( a + r − 1) = = (a + r − 1)(a + r − 2)Γ(a + r − 2) = Κ = (a + r − 1)(a + r − 2) ⋅ Κ ⋅ aΓ(a ) Γ(a + r + b) = Γ(a + b + r) = (a + b + r −1)Γ(a +b + r −1) = (a + b + r −1)(a + b + r − 2) ⋅ ⋅ Γ(a + b + r − 2) = Κ = (a + b + r − 1)(a + b + r − 2) ⋅ Κ ⋅ (a + b)Γ(a + b) Deci (a +r −1)(a +r −2)⋅Κ ⋅ aΓ(a)Γ(a +b) a(a +1)⋅Κ ⋅ (a +r −1) = mr = (a +b+r −1)(a +b+r −2)⋅Κ ⋅ (a +b)Γ(a +b)Γ(a) (a +b)(a +b+1)⋅Κ ⋅ (a +b+r −1) a a ( a + 1) = M ( X ) , m2 = = M (X 2) a+b ( a + b)( a + b + 1) Deci dispersia este : (a + b)(a2 + a) − a2 (a + b +1) a(a +1) a2 − = D( X ) = m2 − m12 = = (a + b)(a + b +1) (a + b)2 (a + b)2 (a + b +1)
Prin urmare, m1 =
=
a 3 + a 2 + a 2 b + ab − a 3 − a 2 b − a 2 ab . = 2 2 ( a + b) ( a + b + 1) ( a + b) ( a + b + 1)
10.2.6. Repartiţia χ 2 DEFINIŢIE: O variabilă aleatoare X are repartiţie χ 2 dacă funcţia sa de repartiţie este de forma: k x −1 − ì 1 2 2 x e , x>0 ï k ï æk ö 2 , unde k ∈ N * reprezintă f ( x; k ) = í Γ ç ÷ 2 ï è2ø ïî0 , x ≤ 0 numărul gradelor de libertate. Mai jos prezentăm graficele funcţiei k = 2,4,6,15 .
f ( x; k )
pentru
k=2 k=4 0,20,15-
k=6
0,1-
k=15
0,05| 5
0
| 10
| 15
| 20
| 25
Se vede că graficele sunt asimetrice, dar, pentru valori mari ale gradelor de libertate ( k > 30) , graficul repartiţiei de graficul repartiţiei normale. OBSERVAŢIE: şi b = 2 .
χ 2 se poate obţine din
χ 2 se apropie
Γ pentru a =
k −1 2
Funcţia generatoare de momente a variabilei aleatoare Γ 1 (r) este de forma g(t) = = (1 − bt)−(a+1) şi g (0) = mr , r = 1,2,.... . a+1 (1 − bt) Prin urmare, pentru a = k − 1 şi b = 2 , vom obţine funcţia 2 generatoare
de
momente
a
variabilei
χ
2
de
forma:
k − 2
g (t ) = (1 − 2t ) . k
k
− −1 − −1 k g ' (t ) = − (1 − 2t ) 2 ( −2) = k (1 − 2t ) 2 g ' (0) = m1 = k 2 k k − −1 − −1 æk +2ö g ' ' (t ) = − k ç (1 − 2t ) 2 ( −2) = k ( k + 2)(1 − 2t ) 2 è 2 g ' ' ( 0) = m 2 = k ( k + 2 )
D ( χ 2 ) = m2 − m12 = k 2 + 2k − k 2 = 2k
10.2.7. Repartiţia Student DEFINIŢIE: O variabilă aleatoare X are repartiţie Student dacă funcţia sa de repartiţie este de forma: æ k + 1ö k +1 Γç ÷ 2 − 2 ö æ t 2 è ø ç1 + ÷ f (t , k ) = , t ∈ℜ k ÷ø æ k ö çè k π ⋅ Γç ÷ è2ø
Se poate arăta că variabila aleatoare „t” este dată de raportul t=
z k , unde z este variabila aleatoare n( x;0,1) , iar variabila V
aleatoare V este un
χ 2 cu k grade de libertate, independentă de z.
Se arată că lim f (t , k ) = n(t;0,1) , deci t este aproximată k →∞
suficient de bine de n(x;0,1) pentru k > 30 . M (t ) = 0 , iar D(t ) =
k . k −2
n (x;0,1) t
x
CAPITOLUL 11 TIPURI DE CONVERGENŢĂ. LEGILE NUMERELOR MARI. TEOREME LIMITĂ CENTRALĂ 11.1. Inegalitatea lui Cebîşev DEFINIŢIE: Fie (Ω, K , P ) un câmp (borelian) de probabilitate şi X : Ω → ℜ o variabilă aleatoare cu media M ( X ) = m şi dispersia D( X ) finite. Atunci pentru orice ε > 0 , are loc inegalitatea: D( X ) (1) P( X − m ≥ ε ) ≤ ε2 echivalentă cu inegalitatea : D( X ) . (1’) P( X − m < ε ) ≥ 1 − ε2 Formula (1) [respectiv (1’) ] poartă numele de Inegalitatea lui Cebîşev . M
(
X
Demonstraţie: ∞
D( X ) = ò ( x − m) 2 f ( x)dx = −∞
≥
ò (εx − m)
x −m ≥
2
f ( x )dx ≥ ε 2
ò (εx − m)
2
f ( x)dx +
x −m <
ò fε ( x )dx = ε
ò (εx − m)
2
f ( x)dx ≥
x −m ≥ 2
P( X − m ≥ ε ) .
x −m ≥
) D(X) Deci D(X) ≥ ε 2P( x − m ≥ ε) ÞP( x − m ≥ ε) ≤ D(X ÞP( x − m < ε) ≥1− 2 2 ε ε Luând ε = k ⋅ σ , unde k ∈ N şi σ = D ( X ) , rezultă că D( X ) 1 σ2 = 2 2 = 2 şi deci inegalitatea lui Cebîşev se poate scrie : 2 k σ k ε 1 P( X − m ≥ kσ ) ≤ 2 , unde k ∈ N , (2) sau: k 1 (2’) P ( X − m < kσ ) ≥ 1 − 2 k
OBSERVAŢIE: Pentru k = 1 , inegalitatea este banală. De aceea vom lua k ∈ N , k ≥ 2 .De exemplu:
Ø Pentru
k = 3,
avem
P( X − m < 3σ ) ≥ 1 −
1 P( X − m ≥ 3σ ) ≤ ≈ 0,1 9
sau
1 8 = ≈ 0,9 9 9
1 ≈ 0,06 16 Observăm deci că abaterile mai mari decât 3σ şi cu atât mai mult decât 4σ au probabilităţile de producere foarte mici, deci şansele acestor evenimente de a se produce sunt extrem de reduse.
Ø Pentru k = 4 , avem P( X − m ≥ 4σ ) ≤
EXEMPLE: 1) Variabila aleatoare X , continuă, reprezintă lungimea unor piese fabricate la o maşină. Se ştie că M ( X ) = m = 50 cm şi D ( X ) = σ 2 = 0,1 . Utilizând inegalitatea lui Cebîşev, să se determine probabilitatea ca lungimea X a pieselor să fie cuprinsă între 49,5 cm şi 50,5 cm. Soluţie: Deoarece m = 50 , condiţia 49,5 < X < 50,5 se poate scrie − 0,5 < X − 50 < 0,5 , sau X − 50 < 0,5 Þ ε = 0,5 . Aplicăm inegalitatea lui Cebîşev : 0,1 P ( X − 50 < 0,5) ≥ 1 − = 1 − 0,4 = 0,6 . 0,25 2)
Aplicând inegalitatea lui Cebîşev, să se găsească limita inferioară a probabilităţii inegalităţii α 5 − 1 < 10 −2 , unde α 10 6
reprezintă numărul de apariţii ale feţei 5 în 105 aruncări ale zarului. Soluţie: Variabila aleatoare α are repartiţie binomială, cu media M (α ) = np şi dispersia D (α ) = npq . 1 1 reprezintă probabilitatea de apariţie a M (α ) = np = 105 ⋅ , unde 6 6 feţei 5. 1 5 5 ⋅ 105 D (α ) = npq = 10 5 ⋅ ⋅ = 6 6 36
Fie variabila aleatoare X = α 5 − 1 . Atunci : 10 6 5 1 1 10 1 1 1 1 æ ö M ( X ) = M (α ) ⋅ 5 − M ç ÷ = ⋅ 5 − = − =0 10 6 10 6 6 6 è6ø 2 éæ α 1 ö ù æ α2 α 1ö D( X) = M[(X − m)2 ] = Mêç 5 − − 0÷ ú = Mçç 10 − 5 + ÷÷ = êëè10 6 ø úû è10 10 ⋅ 3 36ø 1 1 1 1 105 (105 + 5) 1 105 1 M (α 2 ) − 5 M (α ) + = 10 ⋅ − 5 ⋅ + = 10 10 10 ⋅ 3 36 10 36 10 ⋅ 3 6 36 1 5 1 1 5 . = + − + = 36 105 ⋅ 36 18 36 10 5 ⋅ 36
=
Aplicăm inegalitatea lui Cebîşev: 5 355 71 5 ⋅ 10 4 1 ö æ α P ç 5 − − 0 < 10 −2 ÷ ≥ 1 − 5 =1− = = 360 360 72 ⋅ 10 36 10 6 ø è
11.2.
Tipuri de convergenţă
Am văzut că unele repartiţii (sau unele caracteristici ale unor variabile aleatoare) pot fi aproximate, în condiţiile unui volum mare de probe (n → ∞) , prin alte repartiţii sau carecteristici. EXEMPLU: Repartiţia Student: æ k +1ö k +1 Γç ÷ 2 − 2 ö æ t 2 è ø ç1 + ÷ f (t; k ) = , t ∈ℜ k ÷ø æ k ö çè kπ ⋅ Γ ç ÷ è2ø
Se arată că lim f (t; k ) = n(t;0,1) . Practic, pentru k > 30 , k →∞
f (t; k ) ≈ n(t;0,1) .
Prin urmare este util să cunoaştem în ce condiţii un şir de variabile aleatoare ( X n ) tinde (converge) către o variabilă aleatoare X.
a)
Convergenţa în probabilitate DEFINIŢIE: Şirul de variabile aleatoare ( X n ) n∈N converge
P în probabilitate către variabila aleatoare X ( X n → X ) , dacă pentru orice ε > 0 , avem : lim P{ X n − X < ε } = 1 . n→∞
b)
Convergenţa în medie de ordinul r , ( r ∈ N * )
DEFINIŢIE: Şirul de variabile aleatoare ( X n ) n∈N converge în medie de ordinul r către variabila aleatoare X dacă: r lim M ( X n − X ) = 0 . n →∞
OBSERVAŢIE: Pentru r = 2 se obţine definiţia convergenţei în medie pătratică, foarte utilizată în statistica metematică. c)
Convergenţa în repartiţie (sau în sens Bernoulli)
Fie X n variabila aleatoare cu funcţia de repartiţie Fn (x ) şi X variabila aleatoare cu funcţia de repartiţie F (x ) . DEFINIŢIE: Şirul de variabile aleatoare ( X n ) n∈N converge în repartiţie către variabila aleatoare X dacă: lim Fn ( x ) = F ( x ) în n→∞
toate punctele x unde funcţia de repartiţie F (x ) este continuă.
11.3.
Legi ale numerelor mari
Cu toate că despre orice variabilă aleatoare nu se poate şti dinainte valoarea pe care aceasta o ia într-o anumită experienţă, totuşi, media aritmetică a unui număr sufucient de mare de variabile aleatoare, în condiţii destul de puţin restrictive, îşi pierde caracterul întâmplător. Astfel de condiţii se dau în teoremele cunoscute sub denumirea comună de legi legi ale numerelor mari .
11.3.1. Teorema lui Cebîşev Dacă X 1 , X 2 , Κ , X n sunt variabile aleatoare independente două câte două, şi au dispersiile mai mici decât o constantă „c”, atunci, pentru orice ε > 0 avem: n ì n ü ïï å X k å M ( X k ) ïï lim P í k =1 − k =1 < ε ý = 1 (1) n→∞ n ï n ï îï þï Demonstraţie: n Fie variabila aleatoare X = 1 å X k . Această variabilă are n k =1 n n media M( X ) = 1 åM( Xk ) şi dispersia D( X ) = 12 å D( X k ) ≤ nc2 = c . n n n k=1 n k =1 n 1 Aplicăm inegalitatea lui Cebîşev pentru variabila X = å X k , adică n k =1 D( X ) . P( X − m < ε ) ≥ 1 − ε2 n ì n ü X M( Xk ) å å k ï ïï k =1 De aici rezultă : 1 − D( X ) ≤ Pïí k =1 − < ε ý ≤1 . ε2 n n ï ï ïî ïþ c şi trecând la limită pentru n → ∞ , Înlocuind D( X ) = n n ì n ü X M (X k ) å å k ïï ïï rezultă: 1 ≤ lim P í k =1 − k =1 < ε ý ≤ 1 , şi teorema este n→ ∞ n ï n ï ïî ïþ demonstrată. COROLAR: Dacă variabilele aleatoare X 1 , X 2 , Κ , X n au toate aceeaşi medie „m”, deci M ( X k ) = m , k = 1,2,..., n , atunci relaţia (1) devine:
ì ïï lim P í n→∞ ï ïî
n
åX k =1
n
k
ü ì ï ïï n ⋅m ï − < ε ý = 1 Þ lim P í n→ ∞ n ï ï ïþ ïî
n
åX k =1
n
k
ü ïï − m < εý =1. ï ïþ
Rezultă deci că media aritmetică a unui număr suficient de mare de variabile aleatoare, cu dispersiile mărginite, îşi pierde caracterul de variabilă aleatoare. Aceste rezultate dau o justificare regulei mediei aritmetice, care se aplică în mod curent în măsurători. Dacă trebuie măsurată o mărime „a”, repetând de n ori măsurătorile, obţinem n rezultate x1 , x 2 ,..., x n , în general diferite. Drept valoare aproximativă luăm 1 media aritmetică a rezultatelor: a = ( x1 + ... + xn ) . n 11.3.2. Teorema lui Bernoulli (legea numerelor mari a lui Bernoulli) Teorema lui Bernoulli stabileşte o legătură între frecvenţa relativă a unui eveniment şi probabilitatea sa. Să considerăm o experienţă în care probabilitatea de apariţie a unui eveniment A este p . Se fac n experienţe. Dacă ν este numărul de apariţii ale evenimentului A din cele n experienţe, atunci, oricare ar fi ε > 0 , avem: ìν ü ν limPí − p < ε ý = 1 , unde reprezintă frecvenţa relativă. n→∞ n n î þ Demonstraţie: Considerăm variabila aleatoare X k , variabilă ce reprezintă numărul de apariţii ale evenimentului A în experienţa de ordinul k , k = 1,2,..., n . 1 0ö , Fiecare variabilă aleatoare X k are repartiţia X k : æç ç p q ÷÷ kø è k unde pk + qk = 1 . Această variabilă are media M ( X k ) = pk şi dispersia D( X k ) = M ( X k2 ) − M 2 ( X k ) = pk − pk2 = pk (1 − pk ) = pk qk . Fie X = X1 + X 2 + Κ + X n . Aplicăm teorema lui Cebîşev variabilei aleatoare X :
ü ü ì1 ìν lim P í ( X 1 + X 2 + Κ + X n ) − p < ε ý = lim P í − p < ε ý = 1 . n →∞ n →∞ n n þ þ î î
OBSERVAŢII: 1) Teorema lui Bernoulli explică stabilitatea frecvenţei relative de apariţie a unui eveniment A, f n = ν , pentru un număr mare de n experienţe. 2) Uneori, această teoremă celebră se enunţă astfel: frecvenţa relativă de apariţie a unui eveniment converge în probabilitate către probabilitatea evenimentului considerat. 3) Dăm următoarea definiţie: Variabila aleatoare X (n ) , depinzând de numărul natural n se spune că estimează absolut corect numărul „a” dacă: a) M [ X (n)] = a b) lim D[ X (n)] = 0 n →∞
Să arătăm că aceste condiţii sunt îndeplinite pentru ν şi a = p . variabilele aleatoare X (n ) = n æ1 n ö 1 æν ö Mç ÷ = Mç å Xk ÷ = n ⋅ p = p ènø è n k =1 ø n pq æ1 n ö 1 æν ö æν ö Þ lim Dç ÷ = 0 D ç ÷ = Dç å X k ÷ = 2 n ⋅ p ⋅ q = n → ∞ n ènø ènø è n k =1 ø n Prin urmare probabilitatea p este estimată absolut corect de frecvenţa relativă f n = ν ceea ce face ca în caclulul probabilităţii şi n statistică să se folosească valoarea aproximativă p ≈ ν . n
11.3.3. Teorema lui Poisson Teorema lui Poisson este o generalizare a teoremei lui Bernoulli în sensul că evenimentul A are în prima probă probabilitatea de realizare p1 , în a doua probabilitatea p2 , …, în a n-a probă probabilitatea pn .
TEOREMĂ: Fie ν numărul de apariţii ale unui eveniment A în n experienţe independente şi pk probabilităţi de apariţie a evenimentului A în experienţa de ordinul k , k = 1,2,..., n . Atunci, n æ ö oricare ar fi ε > 0 , avem lim Pç ν − 1 pk < ε = 1 . n→∞ ç n n k =1 è Demonstraţie: Variabila aleatoare X reprezintă rezultatul 1 0ö probei de ordinul k ( k = 1,2,..., n ) şi are repartiţia X k : æç , ç p q ÷÷ k ø è k pk + qk = 1 , k = 1,2,..., n . X k ia valoarea 1 dacă evenimentul A a n
apărut şi 0 dacă evenimetul A nu a apărut. Deci ν = å X k . De k =1
asemenea : M ( X k ) = pk ; M ( X k2 ) = pk . D(Xk ) = M[(Xk − pk )2 ] = M[Xk2 −2pk M(Xk ) + pk2 ] = pk −2pk2 + pk2 = pk − pk2 = = pk (1 − pk ) = pk qk Aplicăm inegalitatea lui Cebîşev variabilei aleatoare 1n ν Xk = . å n k=1 n n
åp q
n
åp q
k k æ1 ö 1 Pçç å X k − å pk < ε ÷÷ ≥ 1 − k =1 2 2 . Dar lim k=1 2 2 = 0 . n→∞ n ε n k =1 nε è n k =1 ø n
n
k k
Atunci obţinem: æ1 n ö ν 1 n 1 n = å X k , atunci lim Pçç å X k − å pk < ε ÷÷ = 1 şi deoarece n→∞ n n k =1 n k =1 è n k =1 ø n æ ö rezultă că : lim Pç ν − 1 å pk < ε ÷ = 1 . ÷ n→∞ ç n n k =1 è ø OBSERVAŢIE: Dacă
p1 = p2 =...= pk = p Þ
1n 1 pk = np= p, å n k=1 n
adică teorema lui Bernoulli 11.3.4. Teorema limită centrală Dăm fără demonstraţie următorul rezultat, esenţial în statistica matematică:
Dacă : 1) Variabila aleatoare X k , k = 1,2,..., n , sunt independente; 2) Variabilele X k nu iau valori prea mari una în comparaţie cu celelalte; 3) Numărul n al veriabilelor este sufucient de mare, n
Atunci: variabila aleatoare X = å X k are ca repartiţie k =1
asimptotică repartiţia normală, oricare ar fi repartiţiile variabilelor aleatoare X k ( k = 1,2,..., n ). Prin urmare, teorema limită centrală dă posibilitatea folosirii repartiţiei normale drept lege practică de aproximare.
CAPITOLUL 12 STATISTICĂ MATEMATICĂ 12.1. Noţiuni de teoria selecţiei şi a estimaţiei Să considerăm o populaţie Γ , finită sau infinită, în sensul că este formată dintr-un număr finit sau infinit de unităţi. Dacă populaţia Γ este finită, vaom nota cu N numărul unităţilor ce o compun, iar N îl vom numi volumul populaţiei . Studiem populaţia Γ din punctul de vedere al unei proprietăţi. Această proprietate, care variază (în general) aleator de la o unitate la alta a populaţiei o vom asimila cu o variabilă aleatoare X şi o vom numi variabilă aleatoare teoretică definită pe populaţia Γ . Caracteristicile probabilistice ale variabilei aleatoare teoretice X le vom numi caracteristici teoretice, astfel: m = M ( X ) , media teoretică; D = σ 2 = D( X ) , dispersia teoretică; mr = M ( X r ) , momentul iniţial de ordinul r, teoretic; µ r = M [( X − m) r ] , momentul centrat de ordinul r, teoretic. Cercetarea unităţilor din populaţia Γ se poate face printr-o observare totală sau parţială. Cercetarea totală (care se efectuează de exemplu sub formă de recensământ) este o operaţie complexă, care de cele mai multe ori primeşte mai multe caracteristici ale unităţilor, pentru a realiza o analiză multilaterală. Practic, o cercetare totală se recomandă atunci când volumul populaţiei Γ nu este prea mare, pentru a evita cheltuieli ce pot depăşi avantajele concluziilor trase. Carcetarea parţială (selectivă) se efectuează asupra unei subpopulaţii γ ∈ Γ , subpopulaţie de volum n. Variabila aleatoare asimilată caracteristicii studiate corespunzătoare subpopulaţiei de selecţie γ este reprezentativă, ceea ce înseamnă că în subpopulaţia γ sunt reflectate proprietăţile întregii populaţii Γ .
Construirea eşantionului (subpopulaţiei de selecţie) γ se face cu unităţi din populaţia Γ , alese după o animită tehnică (după anumite reguli) numită operaţie de sondaj. În efectuarea unui sondaj întâlnim două metode de bază: a) Sondaj cu revenire (sondaj non-exhaustiv): Fiecare unitate de sondaj extrasă din Γ pentru a fi studiată, se reintroduce în Γ , după cercetare, putând deci să apară din nou în procesul de construcţie al eşantionului γ . Efectuarea sondajului cu revenire are ca schemă probabilistică urna lui Bernoulli (urna cu bilă revenită). În acest caz vom spune că s-a efectuat o selecţie repetată de volum n. Sondajele astfel efectuate sunt: Echiprobabile Valorile de selecţie astfel obţinute sunt independente b) Sondaj fără revenire (sondaj exhaustiv): Fiecare unitate de sondaj extrasă din Γ pentru a fi studiată nu mai este reintrodusă în Γ după studiere (cercetare). Efectuarea sondajului fără revenire are ca schemă probabilistică schema urnei cu bilă nerevenită. În acest caz vom spune că s-a efectuat o selecţie nerepetată de volum n. OBSERVAŢIE: Aplicarea selecţiei nerepetată nu are sens decât în cazul când volumul populaţiei Γ este finit. Valorile de selecţie astfel obţinute sunt dependente. Selecţia repetată şi selecţia nerepetată sunt aplicate colectivităţilor omogene. DEFINIŢIE: O colectivitate este omogenă dacă este constituită din elemente care sunt susceptibile de a avea sau de a nu avea caracteristica studiată, cu o aceeaşi pondere. În cazul când sondajul se efectuează dintr-o populaţie omogenă, el se numeşte sondaj simplu (selecţie simplă) . În cazul când populaţia Γ nu este omogenă din punct de vedere al caracteristicii (al proprietăţii) cercetate dar poate fi împărţită în subpopulaţii Γi , fiecare în parte omogenă, ca nişte
straturi ale populaţiei Γ , se va efectua aşa numita selecţie stratificată. Fie γ ⊂ Γ , o populaţie de selecţie de volum n. Valorile variabilei teoretice X pentru fiecare unitate din eşantionul γ determină şirul de valori X 1 , X 2 ,..., X j ,..., X n . Deoarece participarea oricărei unităţi din populaţia Γ la eşantionul γ este echiprobabilă (deoarece sondajul se face întâmplător) , fiecare valoare X j din şirul anterior se realizează în eşantion cu aceeaşi probabilitate 1 . n * Astfel se construieşte variabila de selecţie X , cu repartiţia : æ X1 X : çç 1 ç è n *
X2 Κ 1 Κ n
Xj Κ 1 Κ n
Xn ö ÷ 1 ÷ ÷ n ø
Caracteristicile variabilei aleatoare de selecţie X * , numite caracteristici de selecţie, sunt: (1) 1 n m* = X = å X j n j =1 n 1 D* = å ( X j − X )2 n j =1 1 n mr* = å X rj n j =1 1 n µ r* = å ( X j − X ) r n j =1 OBSERVAŢIE: Eşantionul γ , la rândul lui, are un aspect aleatoriu determinat în primul rând de caracterul întâmplător al sondajului. Prin urmare, efectuând alte sondaje se obţin alte eşantioane şi alte variabile aleatoare de selecţie. Putem considera că fiecare valoare X j a argumentului variabilei aleatoare de selecţie X * este, la rândul ei, o variabilă aleatoare identică din punct de vedere probabilistic cu X, deoarece poate fi oricare din valorile posibile ale lui X şi deci are aceleaşi caracteristici ca şi variabila aleatoare teoretică. Adică:
M(X j) = M(X )
, j = 1,..., n
D ( X j ) = D( X )
, j = 1,..., n
M ( X rj ) = M ( X r )
, j = 1,..., n
În cazul când variabila aleatoare empirică X * are repartiţia de forma : k æ x x 2 Κ xi Κ x k ö unde ÷÷ ; ni = 1 , X * : çç 1 å n n Κ n Κ n = 1 i 2 i k ø è 1 x1 , x 2 , Κ , xi , Κ , x k sunt valorile distincte ale lui X j , j = 1,..., n , iar n1 , n2 , Κ , ni , Κ , nk sunt frecvenţele de apariţie. Deci relaţiile (1) devin: (1’) 1 k m * = x = å xi ni n i =1 k 1 D * = å ( x i − x ) 2 ni n i =1 1 k mr* = å xir ni n i =1 1 k µ r* = å ( xi − x ) r ni n i =1
12.2. Repartiţii de selecţie O anumită caracteristică (calitativă sau cantitativă) studiată pe o populaţie oarecare Γ poate fi considerată ca o variabilă aleatoare unidimensională X care are o densitate de repartiţie f (x ) sau o funcţie de reaprtiţie F (x ) . f (x ) şi F (x ) se numesc legi teoretice de repartiţie a variabilei aleatoare X . Să considerăm acum că pe baza unei selecţii de volum n din populaţia Γ obţinem valorile X 1 , X 2 , Κ , X n . Cu ajutorul acestor valori (cu ajutorul acestor date de selecţie) putem calcula diferiţi indicatori ca de exemplu: n Ø Media de selecţie : X * = X = 1 å X k n k =1
n Ø Dispersia de selecţie : D * = 1 å ( X k − X ) 2 n k =1
DEFINIŢIE:
O funcţie Tn ( X 1 , X 2 ,..., X n ) de datele de selecţie X 1 , X 2 , Κ , X n se numeşte statistică . OBSERVAŢIE: Media de selecţie X * şi dispersia de selecţie D * sunt funcţii de datele de selecţie X 1 , X 2 , Κ , X n , deci sunt statistici. Fiecare statistică Tn ( X 1 , X 2 ,..., X n ) (de exemplu media de selecţie şi dispersia de selecţie) este, datorită caracterului aleatoriu al selecţiei, o variabilă aleatoare care la rândul ei are anumite legi de repartiţie (f şi F) numite repartiţii de selecţie . Cunoaşterea legii de repartiţie (repartiţiei de selecţie) a statisticii Tn ( X 1 , X 2 ,..., X n ) este deoasebit de importantă deoarece cu ajutorul ei se poate face studiul probabilistic al statisticii Tn ( X 1 , X 2 ,..., X n ) , calculându-se probabilităţi de forma P(Tn < a ) , P( a < Tn < b) ; M (Tn ) , D(Tn ) , etc. OBSERVAŢIE: Interpretarea datelor de selecţie are un dublu înţeles: Ø X 1 , X 2 , Κ , X n sunt nişte numere cunoscute Ø X i , i = 1,..., n sunt variabile aleatoare cu aceleaşi caracteristici ca şi X . În acest fel, prin intermediul statisticii Tn putem trage concluzii referitoare la populaţia generală Γ din care a provenit selecţia (eşantionul) γ . Teoria probabilităţilor ne oferă procedee de determinare atât a repartiţiei exacte, cât şi a repartiţiei asimptotice a statisticii Tn . Prin repartiţia exactă a statisticii Tn înţelegem repartiţia determinată pentru orice volum al selecţiei n, iar prin repartiţia asimptotică înţelegem repartiţia limită a statisticii Tn (când n → ∞) .
Repartiţia exactă este utilă când condiţiile concrete ale caracteristicii studiate din populaţia Γ impune folosirea unei selecţii (eşantion) γ de volum redus n ≤ 30 . În cazul unor selecţii de volum mare ( n > 30 ) folosirea repartiţiei asimptotice conduce la rezultate suficient de bune. Repartiţia de selecţie a statisticii Tn este strâns legată şi unic determinată de legea de repartiţie teoretică a variabilei aleatoare X care a generat selecţia. În continuare vom cerceta repatiţiile de selecţie ale unor statistici Tn construite dintr-o selecţie extrasă dintr-o populaţie cu repartiţie normală. 1) Tn ( X 1 , X 2 ,..., X n ) = X (media de selecţie) 2) Tn ( X 1 , X 2 ,..., X n ) = D (dispersia de selecţie) 12.3. Repartiţia mediei de selecţie pentru o selecţie dintr-o populaţie normală TEOREMA 1: Dacă X 1 , X 2 , Κ , X n este o selecţie de volum n dintr-o populaţie normală N (m, σ ) , atunci media de selecţie: X =
1 σ ö. æ ( X 1 + X 2 + Κ + X n ) are o repartiţie N ç m, ÷ n nø è
Demonstraţie: Deoarece variabila aleatoare de selecţie X k , k = 1,..., n , este o variabilă aleatoare normală N (m, σ ) , ea are funcţia 1 imt − σ 2t 2
caracteristică c X k (t ) = e 2 . (vezi capitolul 10, paragraful 10.2.3.) Aplicând proprietăţile funcţiei caracteristice, obţinem funcţia caracteristică a variabilei aleatoare 1 X k , k = 1,..., n : n c 1 (t ) = e n
Xk
t 1 t2 im − σ 2 2 n 2 n
(deoarece caX (t ) = c X ( at ) ).
1 1 1 1 ( X1 + X 2 + Κ + X n ) = X1 + X 2 + Κ + X n n n n n şi deci, aplicând proprietatea P3 a funcţiei caracteristice (vezi capitolul 3, paragraful 1.6.), avem:
Dar
X =
n
c X (t ) = ∏ e
t 1 t2 i m− σ 2 2 n 2 n
n
t
1
t2
å i n m − 2σ 2 n 2
= e i =1
=e
itm −
1σ 2 2 t 2 n
2
=e
1æ σ ö 2 itm− ç ÷ t 2è n ø
,
k =1
adică X are repartiţia N æç m, σ ö÷ . nø è OBSERVAŢIE: Prin urmare, M ( X ) = m , D ( X ) = σ . n CONSECINŢA 1: Considerăm variabila aleatoare redusă X −m Z= n pe care o putem scrie sub forma unei expresii liniare σ n n în funcţie de X , adică Z = X− X . Atunci : σ σ æ n ö n æ X −m ö n n M(Z) = Mçç n ÷÷ = M( X) − Mçç m = [M(X) − m] = [m− m] = 0 σ σ σ è σ èσ 2
æ n ö n æ n ö æ X −m ö n σ2 =1 D( Z ) = Dçç n ÷÷ = Dçç X ÷÷ − Dçç m = D( X ) = 2 ⋅ σ σ n è σ èσ èσ X −m Prin urmare, Z = n are repartiţia normală de tip σ N (0,1) .
TEOREMA 2: Dacă X 11 , Κ , X 1n1 este o selecţie de volum n1 din populaţia normală N ( m1 , σ 1 ) şi X 21 , Κ , X 2 n2 este o selecţie
de volum X1 =
1 n1
n2
n1
åX j =1
1j
din populaţia normală şi
X2 =
1 n2
n2
åX k =1
2k
N ( m 2 , σ 2 ) , şi dacă
sunt mediile de selecţie
corespunzătoare, atunci variabila aleatoare Y = X1 − X2 = X1 + (−X2 ) 2 2 ö æ are o repartiţie normală N ç m1 − m2 ; σ 1 + σ 2 ÷ . ç n1 n 2 ÷ø è
Demonstraţie: Funcţia caracteristică a mediei de selecţie c X (t ) = e
t 2σ 2 itm1 − 1 2 n1
1
X1
şi ale mediei de selecţie X 2 este c X (t ) = e 2
este
t 2σ 22 itm2 − 2 n2
.
OBSERVAŢIE: Funcţia caracteristică a variabilei aleatoare − X 2 este de forma : c− X (t ) = e 2
− itm 2 −
t 2σ 22 2 n2
, conform proprietăţii P4 a
funcţiei caracteristice (vezi capitolul 4, paragraful 4.2.3.) . Deoarece X 1 şi − X 2 sunt variabile aleatoare independente, funcţia caracteristică a variabilei aleatoare Y = X 1 − X 2 = X 1 + ( − X 2 ) este (conform proprietăţii P3 a funcţiei caracteristice): cY (t ) = e
itm1 −
t 2σ 12 2 n1
⋅e
itm 2 −
t 2σ 22 2 n2
=e
it ( m1 − m 2 ) −
t 2 æç σ 12 σ 22 + 2 çè n1 n 2
ö ÷ ÷ ø
2 2 ö æ Prin urmare Y are repartiţia N ç m1 − m2 ; σ 1 + σ 2 ÷ . ç n1 n 2 ÷ø è
OBSERVAŢIE: Ultima afirmaţie rezultă din faptul că variabila aleatoare X cu repartiţia N (m, σ ) are funcţia caracteristică c X (t ) = e
imt −
t 2σ 2 2
.
CONSECINŢA 2:
Din teorema 2 rezultă că repartiţia variabilei aleatoare normate Z = X 1 − X 2 − ( m1 − m2 ) are o σ 12 σ 22 + n1 n2 repartiţie de tipul N (0,1) .
12.3.1. Legătura cu variabila aleatoare χ 2 cu n grade de libertate
Se ştie că variabila aleatoare χ 2 are densitatea de probabilitate:
k x −1 − ì 1 2 2 x e , x>0 ï k ï æk ö 2 f ( x; k ) = í Γ ç ÷ 2 ï è2ø ïî0 , x ≤ 0
Se poate demonstra că dacă Z k , k = 1,..., n sunt variabile n
aleatoare normale N (0,1) , atunci variabila aleatoare å Z k2 este: k =1
n
χ 2 = å Z k2 , cu n grade de libertate şi are deci densitatea de k =1
probabilitate : h( x ) =
n
1 n
ænö Γç ÷ ⋅ 2 2 è2ø
−1
⋅ x2 ⋅e
−
x 2
, x > 0.
Ştim că M ( χ 2 ) = n şi D ( χ 2 ) = 2n (vezi capitolul 10, paragraful 10.2.6). Este adevărată următoarea teoremă: TEOREMA 3: Dacă X 1 , X 2 , Κ , X n este o selecţie de volum n dintr-o populaţie normală N (0,1) , atunci variabila aleatoare n
2 Y = å X k2 este o variabilă aleatoare χ cu n grade de libertate. k =1
12.4. Repartiţia dispersiei de selecţie pentru o selecţie dintr-o populaţie normală Dispersia D a unei populaţii oarecare Γ poate fi evaluată pe baza selecţiei X 1 , X 2 , Κ , X n în următoarele moduri:
Dacă media m a populaţiei generale Γ este cunoscută, atunci n dispersia de selecţie este dată de: D ' = 1 å ( X k − m ) 2 = S *2 (1) n k =1 b) Dacă media m a populaţiei Γ nu este cunoscută, atunci media o n putem aproxima cu media de selecţie X = 1 å X k şi dispersia de n k =1 n selecţie este: D * = 1 å ( X k − X ) 2 = S 2 (2) n k =1 c) În cazul selecţiilor de volum mic, evaluăm dispersia D a populaţiei Γ cu dispersia de selecţie dată de relaţia : 1 n ~ D= ( X k − X )2 = ~ s2 å n − 1 k =1 a)
În cele ce urmează vom stabili repartiţia unor funcţii de ~ variabilele aleatoare D' , D * , D pentru selecţii dintr-o populaţie normală. Sunt adevărate următoarele proprietăţi: TEOREMA 1: Dacă X 1 , X 2 , Κ , X n este o selecţie dintr-o populaţie N (m, σ ) , atunci variabila aleatoare U ' = nD2 ' are o σ 2 repartiţie χ cu n grade de libertate. Demonstraţie: n⋅
1 n
n
å (X
2 2 i − m) n n nD ' æ Xi − m ö i =1 U'= 2 = = Z i2 , = ç ÷ å å σ σ2 σ è ø i =1 i =1 unde Z i este o variabilă aleatoare cu repartiţia N (0,1) . Conform
teoremei 3 din paragraful anterior, U ' este o repartiţie χ 2 cu n grade de libertate. Prin urmare M (U ' ) = n şi D(U ' ) = 2n . Deci : n M (U ' ) = 2 M ( D' ) = n Þ M ( D' ) = σ 2 σ 2σ 4 n D (U ' ) = 2 D( D ' ) = 2n Þ D ( D' ) = σ n
TEOREMA 2: Dacă X 1 , X 2 , Κ , X n este o selecţie de volum n dintr-o populaţie N (m, σ ) , atunci variabila aleatoare ~ ( n − 1) D are o repartiţie χ 2 cu ( n − 1) grade de libertate. U= 2 σ ~ Prin urmare, variabila U = ( n − 12 ) D are densitatea de σ n −1 x −1 − 1 probabilitate de forma : h( x ) = x 2 e 2 , x > 0. æ n − 1 ö n−1 Γç ÷⋅2 è 2 ø TEOREMA 3: Dacă X 1 , X 2 , Κ , X n este o selecţie de volum n dintr-o populaţie normală N (m, σ ) , atunci variabila ~ m aleatoare t = X − n , unde σ~ = D , are o repartiţie Student cu ~ σ ( n − 1) grade de libertate. CONSECINŢĂ:
Dacă X 11 , Κ , X 1n1 este o selecţie de
volum n1 din populaţia normală N ( m1 , σ 1 ) şi X 21 , Κ , X 2 n2 este o selecţie de volum n2 din populaţia normală N ( m2 , σ 2 ) , şi dacă 1 n2 1 n1 X 1 = å X 1 j şi X 2 = å X 2k sunt mediile de selecţie n2 k =1 n1 j =1 1 n1 1 n2 ~ ~ corespunzătoare, iar D (X1k − X1)2 şi D2 = å å(X2k − X2)2 sunt 1= n1 −1 k=1 n2 −1 k=1 dispersiile de selecţie corespunzătoare, atunci variabila aleatoare: t=
( X 1 − X 2 ) − ( m1 − m2 ) ~ ~ ( n1 − 1) D + ( n2 − 1) D n1 + n2 − 2
are o repartiţie Student cu ( n1 + n2 − 2) grade de libertate. TEOREMA 4: Fie X 1 , X 2 , Κ , X n o selecţie (independentă) de volum n dintr-o populaţie având o repartiţie oarecare de medie m
n şi abatere medie pătratică σ , finite. Atunci X = 1 å X k are, n k =1 pentru n → ∞ o repartiţie normală N æç m, σ ö÷ . nø è
Demonstraţiile teoremelor enunţate în acest paragraf se găsesc în /2/ , /1/, /3/ . 12.5. Estimaţie punctuală
Fie variabila de selecţie X * sub una din formele empirice : æ X1 X * : çç 1 ç è n æx X * : çç 1 è n1
X2 Κ 1 Κ n
x2 Κ n2 Κ
Xj Κ 1 Κ n
xi Κ ni Κ
Xn ö ÷ 1 ÷ , sau ÷ n ø
xk ö ÷ , cu nk ÷ø
k
ån i =1
i
= 1.
Datorită volumului de selecţie n, modului de efectuare a sondajului, valorile numerice oferite de selecţie reflectă valorile variabilei teoretice X care reprezintă caracteristica (proprietatea) studiată din Γ . Aceste aprecieri au la bază teorema lui Glivenco (teorema fundamentală a statisticii matematice) care se referă la legătura strânsă care există între funcţia de repartiţie teoretică F (x ) a variabilei aleatoare teoretice X şi funcţia de repartiţie empirică Fn (x ) . DEFINIŢIE: Prin funcţia de repartiţie empirică a unei variabile aleatoare X, după extragerea unei selecţii γ de volum n, înţelegem funcţia definită de relaţia Fn ( x ) = n x , unde n x reprezintă n numărul de observaţii în care a apărut o valoare a variabilei aleatoare X (a caracteristicii X), mai mică decât x.
Reamintim că funcţia de repartiţie teoretică F (x ) a variabilei aleatoare X este F ( x ) = P ( X < x ) . TEOREMA LUI GLIVENCO: Fie Fn (x ) funcţia de repartiţie empirică corespunzătoare unei selecţii de volum n ce provine dintr-o populaţie caracterizată de variabila aleatoare X având funcţia de repartiţie F (x ) . Atunci: P( lim sup Fn ( x ) − F ( x ) = 0) = 1 . n →∞ x∈R
Adică, cu cât n este mai mare, cu atât Fn (x ) aproximează mai corect pe F (x ) . Conform teoremei lui Glivenco, putem accepta principiul de bază al teoriei selecţiei: Variabila aleatoare de selecţie X * converge în lege către variabila aleatoare teoretică X, iar caracteristicile variabilei de selecţie converg în probabilitate către caracteristicile corespunzătoare ale variabilei aleatoare teoretice. DEFINIŢIE: Operaţia prin care se evaluează parametrii necunoscuţi ai unei legi de probabilitate se numeşte estimarea parametrilor. Estimarea se face pe baza unei selecţii X 1 , X 2 , Κ , X n de volum n, extrasă din populaţia Γ pe care este definită variabila X, cu lege specificată, care conţine parametrul ce trebuie estimat. 12.5.1. Estimator; estimator consistent
Fie X variabila aleatoare cu legea f ( x, λ ) care depinde de un parametru necunoscut λ . Vrem să-l determinăm pe λ din datele de selecţie ale variabilei aleatoare de selecţie X * . DEFINIŢIE: Se numeşte estimaţie punctuală a parametrului λ , o anumită funcţie (statistică) λ* = λ* ( X 1 ,..., X n ) cu ajutorul căreia tragem concluzii asupra valorii necunoscute a parametrului λ .
OBSERVAŢIE:Estimatorul λ* astfel definit este o variabilă aleatoare (fiind o funcţie care depinde de valorile de selecţie X 1 , X 2 , Κ , X n ), pe când λ reprezintă o valoare constantă a variabilei aleatoare teoretice X . Orice valoare λ*C (valoare calculată a estimatorului λ* ) determinată de o anumită selecţie reprezintă o valoare estimată pentru λ . Funcţia de estimaţie λ* = λ* ( X 1 ,..., X n ) ,
DEFINIŢIE:
pentru care lim P ( λ* − λ < ε ) = 1 se numeşte funcţie de estimaţie n →∞
consistentă, iar estimatorul λ* se numeşte estimator consistent. 12.5.2. Estimator absolut corect; estimator corect
DEFINIŢIE: Estimatorul λ* este un estimator absolut corect dacă: 1) M ( λ* ) = λ 2) D ( λ* ) → 0 n →∞
Spunem atunci că orice valoare calculată a λ*C a acestui estimator, estimează absolut corect pe λ . DEFINIŢIE: Estimatorul λ* este un estimator corect dacă: 1) M ( λ* ) → λ n →∞
2) D( λ* ) → 0 n →∞
Spunem atunci că orice valoare calculată λ*C a acestui
estimator, estimează corect pe λ .
Se poate demonstra următoarea teoremă , a cărei demonstraţie se găseşte în /2/: TEOREMĂ: estimator consistent.
Orice estimator absolut corect este şi un
æ x ö EXEMPLU: Fie repartiţia Poisson X : ç −λ⋅ λx ÷ , x ≥ 0 çe ÷ x! ø è cu M ( x ) = D( x ) = λ . (vezi capitolul 10, paragraful 10.1.4. ) . n Vom arăta că media de selecţie X = 1 åX j este un estimator n j=1 absolut corect pentru λ . æ1 n ö 1 n 1 M ( X ) = M çç å X j ÷÷ = å M ( X j ) = ⋅ n ⋅ λ = λ . n è n j =1 ø n j =1
æ1 n ö 1 n λ 1 D ( X ) = Dçç å X j ÷÷ = 2 å D ( X j ) = 2 ⋅ n ⋅ λ = → 0 n n n →∞ è n j =1 ø n j =1 Deci media de selecţie X este un estimator absolut corect al parametrului λ din repartiţia Poisson.
12.5.3. Estimator de maximă verosimilitate
Fie variabila aleatoare teoretică X cu funcţia de probabilitate f ( x, λ ) , care depinde de parametrul λ . Acest parametru trebuie estimat pe baza datelor de selecţie X 1 , X 2 , Κ , X n . Funcţia de probabilitate f ( x, λ ) , corespunzătoare valorilor X 1 , X 2 , Κ , X n este f ( X j ; λ ) = P( X = X j ) , j = 1,..., n . Deoarece variabila de selecţie X * presupune realizat evenimetul én ù êΙ ( X = X j )ú , rezultă că însăşi realizarea variabilei de selecţie ë j =1 û constituie un eveniment care are un anumit grad de reprezentare a variabilei teoretice, constituind astfel verosimilitatea de reflectare a variabilei teoretice X de către variabila de selecţie X * . Această verosimilitate este măsurată de probabilitatea : n én ù L( X1, X2 ,...,Xn ; λ) = PêΙ ( X = X j )ú , adică L( X1, X2 ,...,Xn ; λ) = ∏ f ( X j ; λ) j=1 ë j=1 û
n
L( X 1 , X 2 ,..., X n ; λ ) = ∏ f ( X j ; λ )
, numită funcţia de
j =1
verosimilitate a selecţiei. Vom determina (estima) parametrul λ punând condiţia ca verosimilitatea să fie maximă. Punem deci condiţia n
∂L( X 1 ,..., X n; λ ) = 0 sau ∂λ
∂∏ f ( X j ; λ ) j =1
∂λ
= 0.
Deoarece maximul funcţiei L are loc pentru aceleaşi valori ca şi maximul funcţiei ln L , ecuaţia precedentă poate fi înlocuită prin una mai avantajoasă din punct de vedere al calculelor : n ∂ ln f ( X ; λ ) ∂ ln L( X 1 ,..., X n ; λ ) j = 0 sau å = 0. ∂λ ∂ λ j =1 n ∂ ln f ( X ; λ ) j Ecuaţia å = 0 se numeşte ecuaţia de ∂ λ j =1 verosimilitate maximă. DEFINIŢIE: Orice soluţie a ecuaţiei de verosimilitate maximă se numeşte estimator de maximă verosimilitate . OBSERVAŢIE: În general, un estimator de maximă verosimilitate este şi un estimator consistent. Adică lim P ( λ* − λ < ε ) = 1 . n →∞
EXEMPLU:
Să se determine estimatorul de maximă æ x ö verosimilitate din repartiţia Poisson X : ç −λ⋅ λx ÷ , x ≥ 0 , unde çe ÷ x! ø è λx . f ( x; λ ) = e − λ x! Funcţia de verosimilitate este : X n n λ j Logaritmând, L( X 1 ,..., X n ; λ ) = ∏ f ( X j ; λ ) = ∏ e−λ ( X j )! j =1 j =1 obţinem: ln L( X 1 ,..., X n ; λ ) = å {− λ + X j ln λ − ln[( X j )!]}. n
j =1
Ecuaţia de maximă verosimilitate este: n
∂lnL n æ 1ö = åç−1+ X j ⋅ ÷ = 0 ∂λ j=1 è λø
sau
−n +
åX
j
1n åX j = 0 Þλ* = j=1n Þλ* = X . λ j=1
În concluzie, media de selecţie în repartiţia Poisson este un estimator de maximă verosimilitate pentru parametrul λ . OBSERVAŢIE: În cazul repartiţiilor X care au funcţia de probabilitate depinzând de mai mulţi parametri f ( x; λ1 , λ2 ,..., λs ) , parametrii λ1 , λ2 ,..., λn se determină din sistemul de ecuaţii ∂ ln L( X 1 ,..., X n ; λ1 ,..., λs ) = 0 , i = 1,..., s . ∂λi EXEMPLU: Să se determine estimaţiile de maximă verosimilitate ale parametrilor m şi σ ale unei variabile aleatoare normale f ( x; m, σ ) cu ajutorul unei selecţii X 1 , X 2 , Κ , X n . 1 æ X −m ö ÷ σ ø
− ç 1 f ( x ; m, σ ) = e 2è σ 2π
n
2
, σ > 0 , x∈R, m∈R .
L( X 1 , Κ , X n ; m, σ ) = ∏ f ( X i ; m, σ ) = i =1
1 n 2
e
−
1 2σ 2
n
å ( X i − m )2 i =1
σ n ( 2π ) 1 n n ln L( X 1 , Κ , X n ; m, σ ) = −n ln σ − ln(2π ) − ( X i − m) 2 2 å 2 2σ i =1 ∂ ln L( X 1 ,..., X n ; m, σ ) 1 2 n = − ⋅ 2 å ( X i − m)( −1) = 0 ∂m 2 σ i =1 ∂ ln L( X 1 ,..., X n ; m, σ ) n 1 n = − + 3 å ( X i − m) 2 = 0 ∂σ σ σ i =1 ìm* = X 1 n ìn ì X X − m = m = ( ) 0 å i ï ïå i ï n i =1 n ï i=1 ï ï Þí n Þí Þ í ( Xi − m)2 n å ï 1 ( X − m)2 = n ïσ 2 = 1 ( X − m) 2 ï * i=1 å i i ïîσ 2 å ïî ïîσ = n i =1 i=1 n
În concluzie, m * şi σ * sunt estimatori de maximă verosimilitate pentru m şi σ din f ( x; m, σ ) . 12.6. Estimarea prin intervale de încredere Am văzut că estimaţiile punctuale sunt afectate de erori, ele reprezentând numai valori aproximative ale adevăratelor valori ale parametrilor estimaţi. Deoarece o estimaţie variază în precizie, ea trebuie să fie însoţită de o indicaţie cu privire la precizia ei, adică cât de aproape poate fi estimaţia de valoarea parametrului pe care trebuie să-l estimeze. Apare astfel necesitatea de a se indica un interval despre care să se poată afirma, cu o probabilitate cunoscută, că acoperă valoarea parametrului estimat, care este o mărime constantă. Presupunem că proprietatea studiată este determinată de o variabilă aleatoare X care are legea de repartiţie teoretică f ( x;θ ) care depinde de parametrul θ . Se efectuează o selecţie γ de volum n din care obţinem valorile de selecţie X 1 , X 2 , Κ , X n . Să presupunem de asemenea că avem două funcţii de selecţie (statistici) θ ( X 1 , Κ , X n ) şi θ ( X 1 , Κ , X n ) , θ < θ , astfel încât probabilitatea inegalităţii θ < θ < θ să fie îndeplinită de θ , adică : P[θ ( X 1 , Κ , X n ) < θ < θ ( X 1 , Κ , X n )] = 1 − α (1) unde α nu depinde de θ . Pentru o selecţie realizată, funcţiile θ şi θ iau valori bine determinate şi vom spune că am găsit un interval (θ , θ ) care acoperă parametrul necunoscut θ [altfel spus θ ∈ (θ , θ ) ] cu un grad de siguranţă garantat de probabilitatea (1 − α ) unde α este foarte mic. DEFINIŢIE: (i) Intervalul (θ , θ ) se numeşte interval de încredere pentru parametrul θ (sau interval de estimaţie). (ii) θ se numeşte limita inferioară a intervalului de încredere. (iii) θ se numeşte limita superioară a intervalului de încredere.
(iv) Probabilitatea (1 − α ) se numeşte probabilitate confidenţială sau coeficient de încredere (siguranţă). OBSERVAŢII: Ø Parametrul θ este o valoare bine determinată. Ø Intervalul (θ , θ ) este un interval aleator care variază de la o selecţie la alta. Ø Cu cât intervalul (θ , θ ) este mai mic şi α este mai mic, cu atât estimarea parametrului θ este mai bună. Practic, pentru α se iau valorile α = 0,05 ; α = 0,01 ; α = 0,02 , etc.
Se consideră variabila aleatoare X cu funcţia de probabilitate f ( x;θ ) . Ne propunem ca pe baza unei selecţii X 1 , X 2 , Κ , X n să determinăm un interval de încredere pentru parametrul θ necunoscut. Metoda constă în găsirea unei funcţii U ( X 1 , Κ , X n ; θ ) care depinde de datele de selecţie şi de θ , şi are proprietăţile: a) U este bine definită pe orice punct din intervalul valorilor posibile ale lui θ . b) U este continuă şi monotonă în raport cu θ . c) Repartiţia sa g (u) nu depinde de parametrul θ şi nici de alţi parametri. Atunci, pentru fiecare coeficient de încredere (1 − α ) , folosind repartiţia g (u) a statisticii U , putem găsi limitele u1 şi u2 care depind de α , dar sunt independente de datele de selecţie, asftel încât: u2 P(u1 < U < u2 ) = ò g (u )du = 1 − α (2) u1
12.6.1. Intervale de încredere pentru parametrii repartiţiei normale : æ x ö, X : çç ÷÷ è f ( x) ø
x∈R, 1 æ x −m ö ÷ σ ø
− ç 1 f ( x; m , σ ) = e 2è σ 2π
2
m∈R,
σ >0,
(i) Interval de încredere pentru media m când σ 2 este cunoscut
Alegem statistica: U ( X 1 , Κ , X n ; m ) = X − m n (1) σ care este monotonă şi continuă în raport cu m şi a cărei funcţie de repartiţie este N (0;1) , cu densitatea: 1 u2
g (u ) =
1 − 2⋅ 2 e 2π
(2).
Funcţia (2) nu depinde de m şi nici de alţi parametri . Prin urmare vom putea determina numerele u1 şi u2 astfel u
încât: P(u1 < U < u2 ) = ò 2 g (u )du = 1 − α , sau: u1
æ ö (3) Pç u1 < X − m n < u2 ÷ = 1 ç ÷ σ 2π è ø
ò
u2
u1
e
−
u2 2
du = 1 − α Þ
uσ uσ ö uσ æu σ ö æ (4) Pç 1 < X − m < 2 − X ÷ = Pç X − 2 < −m < X − 1 ÷ = 1 − α nø n n è è n ø Am obţinut deci intervalul de încredere pentru m, uσ ö uσ æ (5) çX − 2 ,X − 1 ÷ nø n è cu probabilitatea 1 − α .
OBSERVAŢIE: Deoarece între u1 şi u2 avem o singură relaţie, dată de (3) putem obţine o infinitate de intervale de încredere cu probabilitatea 1 − α . Evident, un interval de încredere este cu atât mai bun cu cât este cât mai mic. Căutăm deci intervalul dat de relaţia (5), de lungime minimă. Fie l lungimea intervalului. Atunci l = σ (u2 − u1 ) n Vom minimiza lungimea intervalului l , cu condiţia (3), adică rezolvăm problema:
σ ì ïïmin l = n (u2 − u1 ) í u ï 2 g (u )du = 1 − α ïî òu1 Utilizăm metoda multiplicatorilor lui Lagrange: u Fie L(u1 , u2 ; λ ) = σ (u2 − u1 ) + λ ⋅ [ ò 2 g (u )du − (1 − λ )] u1 n σ ì ∂L ï ∂u = − n − λ ⋅ g (u1 ) = 0 ï 1 Þ g ( u1 ) = g (u 2 ) , care are soluţiile í ∂ σ L ï = + λ ⋅ g (u2 ) = 0 ïî ∂u2 n u1 = u 2 care nu convine şi soluţia − u1 = u 2 Notăm 1 2π
ò
z
e
−z
u2 − 2
z = u2 = −u1 .
Atunci
du = 1 − α Þ F ( z) − F (−z) = 1 − α ,
ecuaţia dar
(4)
devine
F (− z) = − F ( z) ,
deci 2F( z) − 1 = 1 − α Þ F ( z) = 1 − α Þ z = F −1 æç1 − α ö÷ . 2 2ø è ìu1 = − z α = z α 1− 2 2 Dar z α = − z α Þ ïí 1− 2 2 ïu2 = z1− α 2 î Deci intervalul de încredere este : æ σ σ ö ÷ çX − z α ⋅ 0 . Se Γ( λ ) efectuează o selecţie de volum n : X 1 , X 2 , Κ , X n . Scriem că
momentul de ordinul 1 al variabilei aleatoare X este egal cu momentul de selecţie de ordinul 1. ∞ Γ(λ + 1) 1 ∞ λ −x ì ïïM ( X ) =m1= ò0xf ( x; λ)dx = Γ(λ) ò0 x e dx = Γ(λ) = λ 1n * Þ λ = åX j í n n j=1 ïM ( X * ) = m* = 1 X å j 1 ïî n i=1 OBSERVAŢIE: Ne putem pune întrebarea ce moment empiric este cel mai potrivit pentru estimarea momentului teoretic? Din exemplul anterior rezultă: 1 n m2 = λ ( λ + 1) Þ λ ( λ + 1) = å X j n j =1 1 n m3 = λ ( λ + 1)( λ + 2) Þ λ ( λ + 1)( λ + 2) = å X 3j n j =1 Se observă chiar că valorile lui λ astfel determinate nu satisfac (în general) şi ecuaţiile anterioare, deci metoda se complică. În aceste situaţii este indicată aplicarea metodei intervalelor de încredere. 12.8.
Verificarea ipotezei cu privire la legea de repartiţie a unei variabile aleatoare
O ipoteză statistică se referă fie la forma legii de repartiţie a unei populaţii (normală, exponenţială, etc.) fie la parametrii conţinuţi în această lege (medie, dispersie), şi ea se verifică folosind rezultatele obţinute într-o selecţie aleatoare extrasă din populaţia cercetată. Fie variabila aelatoare X care reprezintă o proprietate considerată pe o populaţie Γ a cărei repartiţie f ( x, θ ) are o formă cunoscută, dar care depinde de un parametru necunoscut θ . Ipoteza conform căreia θ are valoarea θ 0 , se notează : H 0 : θ = θ 0 şi poartă numele de ipoteza nulă . Să presupunem că în afara valorii θ 0 , parametrul θ mai poate avea şi una din valorile θ 1 , θ 2 ,... . Ipotezele H i : θ = θ i , i = 0,1,2,... se numesc ipoteze admisibile, iar H i : θ = θ i , i = 1,2,... se numesc ipoteze alternative ale ipotezei nule H 0 .
În cele ce urmează vom considera două ipoteze: ipoteza nulă H 0 şi alternativa ei, H 1 ca ipoteză contrară ipotezei H 0 , explicând în ce constă verificarea unei ipoteze statistice, procedeul de verificare, precum şi unele noţiuni legate de acestea. Testul statistic este o metodă sau un criteriu după care ipoteza de verificat se acceptă sau se respinge. El stabileşte, după natura observaţiilor, pentru care selecţii ipoteza se acceptă şi pentru care se respinge. Datorită caracterului întâmplător al selecţiei, la verificarea unei ipoteze statistice, există întotdeauna riscul de a lua o decizie eronată. Când pe baza datelor selecţiei respingem ipoteza H 0 de verificat, deşi în realitate este adevărată, spunem că am comis o eroare de genul întâi, iar când acceptăm ipoteza H 0 care în realitate este falsă, spunem că am comis o eroare de genul doi. Probabilitatea erorii de genul întâi se numeşte risc de genul întâi (prag sau nivel de semnificaţie) şi-l notăm cu α , iar probabilitatea erorii de genul doi se numeşte risc de genul al doilea şi se notează cu β . Pentru construirea testului statistic cu ajutorul căruia verificăm ipoteza statistică H 0 trebuie să avem în vedere următoarele: a) determinarea unei funcţii (o statistică) T ( X 1 ,..., X n ) de datele de selecţie numită statistica testului, cu caretestăm ipoteza H 0 ; b) valoarea admisibilă a pragului de semnificaţie; c) ipoteza alternativă H 1 opusă ipotezei H 0 ; d) regiunea critică W a ipotezei H 0 corespunzătoare statisticii T a testului, prin care înţelegem acea mulţime de valori ale statisticii T astfel încât dacă valoarea observată a lui T aparţine acestei mulţimi, atunci ipoteza H 0 se respinge, acceptîndu-se H 1 . În caz contrar se acceptă H 0 . Regiunea critică W este astfel determinată încât probabilitatea comiterii erorii de genul doi să fie minimă şi probabilitatea ca T obţinut prin selecţie să-i aparţină când H 0 este adevărată, să fie egală chiar cu α , adică vor fi îndeplinite condiţiile: P(T ∈ W / H 0 ) = α şi P (T ∈ W / H 1 ) = maxim
Conform definiţiei riscului β , putem scrie P(T ∈W / H1) = β , unde W este complementara mulţimii W . Probabilitatea de a respinge H 0 ca falsă (fiind adevărată H 1 ) adică de a nu comite eroarea de genul doi este: π (W , H 1 ) = P(T ∈ W / H 1 ) = 1 − β şi poartă numele de puterea testului, care este cu atât mai mare cu cât β este mai mic. Până acum am presupus că repartiţia teoretică a variabilei aleatoare X este specificată, iar în cele mai multe cazuri este repartiţia normală. De foarte multe ori chiar specificarea repartiţiei reprezintă o ipoteză care trebuie verificată. De aceea, practica statistică pune problema realizării unei legături între variabila empirică (de selecţie) X * şi variabila teoretică X . x x 2 Κ xi Κ x k ö k Fie variabilele: X * : æçç 1 ÷÷ ; å ni = 1 , è n1 n2 Κ ni Κ nk ø i =1 x ö şi X : æçç ÷÷ . è f ( x) ø Se va cerceta dacă şirul numeric al frecvenţelor absolute empirice ni reflectă legea ipotetică a variabilei teoretice X , concretizată în funcţia f ( x; a1 ,..., a k ) .
Rezolvarea acestei probleme presupune următoarele etape: 1. Estimarea parametrilor, făcută ţinând seama de eventualele semnificaţii pe care le pot avea în legătură cu caracteristicile distribuţiei teoretice şi de calităţile estimaţiei respective. 2. Se construieşte, după estimarea parametrilor, variabila pseudo-teoretică: k x 2 Κ xi Κ x k ö æx X ' : çç 1 ÷÷ ; å n' i = 1 , făcându-se legătura i =1 è n'1 n ' 2 Κ n' i Κ n ' k ø între variabila empirică X * şi variabila teoretică X . Determinarea frecvenţelor absolute calculate ni este realizată prin intermediul funcţiei de probabilitate, folosind relaţia:
ni* * = f ( x; a1 ,..., a k ) , de unde ni = ni ⋅ f ( x; a1 ,..., a k ) , i = 1,..., n . ni
OBSERVAŢIE: Datorită unor proprietăţi ale au funcţiilor de probabilitate f ( x ) pentru determinarea frecvenţelor calculate n' i , de cele mai multe ori se folosesc formulele de recurenţă, pornindu-se de la valoarea dominantă (cu maximum de probabilitate a realizării argumentului). 3. Verificarea ipotezei H 0 de concordanţă între repartiţia empirică şi repartiţia teoretică, ipoteză ce se verifică folosind aşanumitele teste de concordanţă . a)
Testul de concordanţă χ 2 :
2 k Studiind funcţia χ 2 = å ( ni − n ' i ) , K.Pearson a arătat că, n'i i =1 în cazul unui sondaj cu revenire în populaţia studiată, când probabilităţile pi nu sunt apropiate de 0 sau 1, iar produsele n' i = ni ⋅ pi , unde pi = f ( xi ) , după estimarea parametrilor, nu sunt prea mici (practic nu sunt mai mici decât 5), funcţia considerată are repartiţia χ 2 cu ( s − 1) − k grade de libertate, s fiind numărul de valori observate, iar k numărul parametrilor estimaţi.
OBSERVAŢII: Ø Dacă legea presupusă este legea Poisson, ea are un singur parametru, deci k = 1 , iar numărul gradelor de libertate va fi ( s − 1) − 1 = s − 2 ; dacă legea presupusă este legea normală, atunci k = 2 şi avem ( s − 1) − 2 = s − 3 grade de libertate. Ø După cum am precizat mai sus, legea χ 2 condiţia ca n' i = ni ⋅ pi să nu fie numere mai mici decât 5. În cazul în care există astfel de numere, se vor cumula la prima frecvenţă ni mai mare ca 5. Aceasta face ca numărul s să fie modificat corespunzător noii situaţii, devenind ~ s , iar numărul gradelor de libertate devenind (~ s − 1) − k . Dacă între repartiţia de selecţie şi repartiţia teoretică
există concordanţă, atunci statistica
χ 2 definită în relaţia
k
χ2 = å i =1
( ni − n ' i ) 2 trebuie să fie mai mică şi nu va depăşi o valoare n'i
χ (2s −1)− k ;α corespunzătoare numărului gradelor de libertate ( s − 1) − k şi pragului de semnificaţie α dat. Regiunea critică a testului va fi dată de inegalitatea χ 2 > χ (2s −1) − k ;α şi deci,
determinată
dacă χ 2 ≤ χ (2s −1) − k ;α respingem. b)
acceptăm ipoteza H 0 , în caz contrar o
Testul de concordanţă al lui Kolmogorov:
Din studierea convergenţei funcţiei empirice de repartiţie F ( x ) către funcţia teoretică de repartiţie F ( x ) , Kolmogorov a demonstrat următoarea teoremă: ∞ 2 λ ö æ unde λ > 0 şi lim Pç d n < ÷ = K ( λ ) = å ( −1) k e −2 k λ2 , n →∞ nø è k = −∞ d n = max Fn ( x ) − F ( x ) . Funcţia K ( λ ) este calculată în tabele pentru diverse valori ale lui λ (tabelul distribuţiei Kolmogorov) . Cu ajutorul acestei teoreme se poate da un criteriu de verificare a ipotezei H 0 că repartiţia empirică urmează o anumită lege de repartiţie. Dacă ipoteza H 0 este adevărată, atunci diferenţele Fn ( x ) − F ( x ) nu vor depăşi o anumită valoare dα ;n pe care o fixăm
astfel încât: P( d n > dα ;n / H 0 ) = α , unde α este riscul de gradul întâi. Dar P( d n > dα ;n ) = 1 − P( d n ≤ dα ;n ) . Luând d α ;n = λα , înseamnă că atunci când H 0 este n adevărată şi n suficient de mare avem: λ ö λ ö æ æ P ç d n > α ÷ = 1 − Pç d n ≤ α ÷ = 1 − K ( λα ) = α . nø nø è è Unui prag de semnificaţie α dat îi corespunde prin relaţia K ( λα ) = 1 − α o valoare λα astfel încât, pentru un volum n dat al selecţiei găsim valoarea d α ;n = λα . n
Regiunea critică pentru ipoteza H 0 este dată de relaţia dn >
λα . Deci: n
Ø dacă dn < λα , există concordanţă între Fn ( x ) şi F(x) şi se n acceptă ipoteza H 0 . λ Ø dacă dn ≥ α , nu există concordanţă şi respingem ipoteza n H0 .
EXEMPLU: Pentru a organiza mai bine serviciul în perioada de vârf, la un sector al unui magazin se cercetează sosirile cumpărătorilor la raionul respectiv, cât şi timpul de servire al unei persoane. Astfel, considerând intervalele de timp de 5 minute, luate la întâmplare în perioada de vârf, se numără de fiecare dată câte persoane sosesc la raionul urmărit. Au fost cercetate 200 perioade de câte 5 minute, obţinându-se rezultatele din tabelul T1 , în care am notat cu x numărul care arată în câte perioade din cele 200 cercetate am observat exact x sosiri. S-a măsurat, pe de altă parte, timpul de servire a 30 cumpărători, luaţi la întâmplare, în perioada de vârf, obţinându-se datele din tabelul T2 , unde am notat cu y timpul de servire al unui cumpărător şi cu n y numărul de cumpărători, pentru care timpul de servire este y. Deoarece variabila aleatoare y este continuă, crecetarea a fost făcută pe intervale de câte 30 secunde (0,5 minute), pe care le vom reduce în calcule la jumătăţile lor. a) Să se testeze ipoteza H 0 că sosirile cumpărătorilor la raionul considerat sunt de tip Poisson. b) Să se testeze ipoteza H 0 că timpul de servire a unui cumpărător are o distribuţie exponenţială.
Tabelul T1 :
NR. SOSIRI ÎN 5 MIN. (X) 0 1 2 3 4 5 6 7 8 9 10 11 12 Total
FRECVENŢE ABSOLUTE ( n x ) 1 16 31 37 41 30 23 13 6 1 0 1 0 200
Tabelul T2 :
INTERVAL DE TIMP ( yi −1 ; yi )
FRECVENŢE ABSOLUTE ( n y )
0,5-1 1-1,5 1,5-2 2-2,5 2,5-3 Total
18 8 2 1 1 30
a) Facem o ajustare a repartiţiei empirice din tabelul T1 după o repartiţie Poisson: λx f ( x; λ ) = e − λ , x = 1,2,... x!
Deoarece media repartiţiei Poisson este egală cu λ , vom estima parametrul λ prin media de selecţie X , deci: å x ⋅ n x 800 λ=X= x = = 4. å n x 200 x
x
Determinăm frecvenţele n' x = 200 ⋅ e −4 ⋅ 4 , calculând întâi x! pentru x = 4 , considerată ca cea mai probabilă din tabelul T1 : 44 = 39,1 şi apoi celelalte, folosind formulele de 4! recurenţă care sunt uşor de dedus: n' x −1 = x ⋅ n ' x , pentru x < 4 şi n' x = 200 ⋅ e −4 ⋅
λ
λ
⋅ n ' x , pentru x > 4 . Rezultatele obţinute se trec în x +1 coloana n' x a tabelului: n' x +1 =
Tabelul T3 :
x
nx
x ⋅ nx
n' x
n x − n' x
(n x − n'x )2 n'x
1 0 1 2 3 4 5 6 7 8 9 10 11 12 Total
2 1 16 31 37 41 30 23 13 6 1 0 1 0 200
3 0 32 62 111 164 150 138 91 48 9 0 11 0 800
4 3,7 14,7 29,3 39 39,1 31,4 20,8 11,9 6,0 2,6 1,0 0,4 0,1 200
5 -1,4
6 0,11
1,7 -2 1,9 1,4 2,2 1,1
0,10 0,11 0,99 0,06 0,29 0,10
-2,1
0,44
χ 2 = 2 ,14
Pentru a testa ipoteza H 0 , aplicăm testul χ 2 , motiv pentru care am cumulat valorile mici de pe coloanele lui n x şi n' x . S-a obţinut: 12 ( n − n' x ) 2 χ2 = å x = 2,14 n' x x =0 Pentru nivelul de semnificaţie α = 0,05 şi numărul gradelor de libertate 6, găsim χ 02, 05;6 = 12,59 . Avem χ C2 < χ 02, 05;6 , deci acceptăm ipoteza H 0 , adică sosirile cumpărătorilor la raionul respectiv sunt de tip Poisson, cu media λ = 4 persoane în 5 minute. b) Facem aici o ajustare a repartiţiei empirice din tabelul T2 , după o repartiţie exponenţială de forma: f ( y ) = µ ⋅ e − µ⋅ y , y > 0 . Drept valori ale lui y vom considera tabelul T4 mijloacele intervalelor timpilor de servire şi calculăm valoarea medie a variabilei empirice cu formula: å y ⋅ n y = 32 = 1,07 Y = M (Y ) = å n y 30 Pentru că estimatorul de maximă verosimilitate al 1 parametrului µ este , estimăm pe µ prin: µ = 1 = 30 = 0,925 . Y Y 32 Pentru a testa ipoteza H 0 vom aplica testul lui Kolmogorov. În acest scop calculăm mai întâi coloana Fn ( y ) a funcţiei de repartiţie empirice, cumulând pe fiecare linie frecvenţele absolute din linia respectivă şi de deasupra ei şi împărţind rezultatul la 30. De exemplu: 8 + 18 F2 ( y ) = = 0,87 30 Calculăm apoi valorile corespunzătoare ale funcţiei de repartiţie teoretică F ( y ) folosind formula cunoscută a acesteia: F ( y ) = 1 − e − µ⋅ y , pentru µ = 0,925 De exemplu: F (2,25) = 1 − e −2, 25⋅0, 925 = 0,87 . Ultima coloană a tabelului T4 conţine diferenţele Fn ( x ) − F ( x ) cu cea mai mare dintre ele evidenţiată.
Tabelul T4 : [ yi −1 − yi )
yi
ni
y i ⋅ ni
Fn ( y )
F ( y)
Fn ( y ) − F ( y )
0,5-1 1-1,5 1,5-2 2-2,5 2,5-3 Total
0,75 1,25 1,75 2,25 2,75
18 8 2 1 1 30
13,50 10,00 3,50 2,25 2,75 30,00
0,66 0,87 0,93 0,97 1,00
0,60 0,75 0,84 0,87 0,94
0,00 0,12 0,09 0,10 0,06
Considerând drept nivel de semnificaţie α = 0,01 , tabelul corespunzător testului lui Kolmogorov dă λα = 1,63 şi cum n = 5 avem: λα 1,63 = = 0,73 > 0,12 = max Fn ( x ) − F ( x ) = d n n n Acceptăm ipoteza H 0 că timpul de servire a unui cumpărător are o repartiţie exponenţială cu parametrul µ = 0,925 .
CAPITOLUL 13 MATEMATICI FINANCIARE O sumă de bani S 0 de care dispune partenerul P1 este plasată partenerului P2 pentru o perioadă de timp t , în anumite condiţii. La sfârşitul perioadei, P1 obţine o sumă S ( S 0 , t ) > S 0 . DEFINIŢIE : Se numeşte dobândă corespunzătoare plasării sumei S 0 pe durata t , o funcţie D : [0, ∞) × [0, ∞ ) → [0, ∞ ) ,
D( S 0 , t ) , care îndeplineşte condiţiile: 1) D este strict crescătoare în raport cu fiecare din variabilele S 0 şi t . 2) D( S 0 , t ) = 0 ; D(0, t ) = 0 . OBSERVAŢIE: Condiţia ∂D ( S 0 , t ) ∂D( S 0 , t ) > 0. > 0 şi ∂t ∂S 0
1
este
echivalentă
cu
DEFINIŢIE: Se numeşte valoare finală (sau valoare revenită) a partenerului P1 ce a plasat suma S 0 pe durata de timp t, valoarea funcţiei S ( S 0 , t ) = S 0 + D( S 0 , t ) .
DEFINIŢIE: Dacă S 0 = 100 u.m. şi t = 1 an, atunci dobânda corespunzătoare se numeşte procent (notat „ p ”). Dacă S 0 = 1 u.m. şi t = 1 an, dobânda corespunzătoare se numeşte dobânda unitară anuală (se notează cu „ i ”). p ; p = 100 ⋅ i i= 100
13.1. Dobânda simplă DEFINIŢIE: Dobânda calculată asupra aceleiaşi sume pe toată durata împrumutului se numeşte dobânda simplă (notată D).
Prin urmare, pe întreaga durată de plasare „ t ”, valoarea sumei S 0 nu se modifică. Notăm: S 0 = suma depusă (împrumutată); t = timpul în ani; p = procentul; p = dobânda unitară; i= 100 D = dobânda simplă. S0 ⋅ p ⋅ t (1) = D( S 0 , t , i ) 100 Prin urmare, dobânda simplă este direct proporţională cu suma împrumutată, cu timpul şi cu dobânda unitară (sau procentul). Să considerăm timpul împărţit în k părţi egale: k = 2 Þ t 2 - semestre k = 4 Þ t 4 - trimestre k = 12 Þ t12 - luni k = 360 Þ t 360 - zile D = S0 ⋅ i ⋅ t =
În general, t k reprezintă un număr oarecare de asemenea t părţi (exemplu: k = 12; t12 = 18 luni). Atunci timpul t = k (în k 18 exemplul dat t = = 1,5 ). 12 t S ⋅ p ⋅ tk (2) D = S0 ⋅ i ⋅ k = 0 k 100k Dacă k = 360 , deci t se exprimă în zile, obţinem: t S ⋅ p ⋅ t 360 (2’) D = S 0 ⋅ i ⋅ 360 = 0 360 360 i În calculele financiare : S 0 ⋅ t 360 - se numeşte “număr” , iar 360 - se numeşte “divizor fix” relativ la dobândă pentru i i p dat ( i = - dobânda unitară anuală). 100 Astfel, din (2) obţinem :
S0 ⋅ p ⋅ t2 - dobânda pentru t 2 semestru ; 200 S ⋅ p ⋅ t4 - dobânda pentru t 4 trimestru. D= 0 400 D=
Să presupunem acum că plasamentul nu are loc cu acelaşi procent “p” pe toată durata de plasare “t”. t |
θ1 p1
|
θ2 p2
|
|
θk pk
|
|
θm pm
|
dobânda pentru această perioadă este S 0 ⋅ i k ⋅ θ k deci:
m
t = å θ k , iar k =1
p k = 100 ⋅ i k ( k = 1,..., m ) .
= procentul de plasare pe durata θ k
Atunci: D ( S 0 , t ) =
n k =1
D ( S 0 ,θ k ) =S 0
m k =1
i kθ k
(3)
Cu această formulă se determină dobânda la suma S 0 pentru m
perioada t , în regim de dobândă simplă, dacă t = å θ k , astfel încât k =1
pe fiecare perioadă θ k , plasarea se face cu procentul anual p k = 100i k . OBSERVAŢIE: Formula (3) constituie rezultatul aplicării succesive a dobânzii simple pe intervalele ce constituie durata de plasare. Dăm o altă expresie pentru formula (2). p , înlocuind în (2) , vom obţine: Deoarece i = 100
D( S 0 , t ) =
S 0 ⋅ t 360 36000 p
(4)
unde t 360 reprezintă durata în zile a operaţiunii. Notăm: N = N ( S 0 , t 360 ) = S 0 ⋅ t 360 - numărul operaţiunii df = df ( p,360) = 36000 - divizorul fix al operaţiunii p Cu aceste notaţii, (4) devine: N D(S 0 , t ) = = D( N , df ) (5) df OBSERVAŢIE: Formula (5) este utilă în cazul în care se calculează dobânda aferentă mai multor operaţiuni, cu acelaşi procent p. Deci: dacă se efectuează operaţiunile ( S k , t k ) , k = 1,..., n cu acelaşi procent p şi dacă însumarea dobânzilor are sene, atunci dobânda totală este: n 1 n D[( S k , t k ), p ] = å D ( S k , t k , p ) = å N k (6) df k =1 k =1 În acest caz, este deci necesară calcularea doar a numerelor N k şi a sumei acestora, sumă care poate fi considerată ca „număr” al tuturor operaţiunilor. 13.1.1. Elementele dobânzii simple: 1. Suma revenită (sau valoarea finală) S ( S 0 , t , i ) = S t = S 0 + D ( S 0 , t , i ) = S 0 + S 0 ⋅ i ⋅ t = S 0 (1 + it ) Deci formula S t = S 0 (1 + it ) , reprezintă suma revenită şi se aplică atunci când procentul p este constant pe întreaga perioadă. În cazul în care în timpul t procentul variază în diferite fracţiuni ale lui t : m p t = å θ k , θ k → p k Þ i k = k , i k = dobânda unitară 100 k =1
m Atunci: S t = S 0 æç1 + å ikθ k ö÷ è k =1 ø
(8)
2. Suma iniţială S 0 este dată, în cele două situaţii de relaţia S St (9) , respectiv (9’) S = . S0 = t 0 n 1 + it 1 + å ikθ k k =1
(1 + it ) = factor de fructificare 1 = factor de actualizare 1 + it
13.1.2. Operaţiuni echivalente în regim de dobândă simplă Fie S1 , S 2 ,..., S n mai multe sume plasate pe duratele t1 , t 2 ,..., t n , cu acelaşi procent p. Ne propunem să înlocuim sumele S i şi duratele t i ( i = 1,..., n ) printr-o sumă unică S şi o perioadă unică t astfel încât dobânda totală adusă de sumele S i în perioadele t i să fie egală cu dobânda adusă de suma S în perioada t . Vom spune că cele două operaţiuni financiare sunt echivalente în regim de dobândă simplă. DS
Vom folosi notaţia: A ~ B ⇔ D( A) = D( B) . Cele două operaţiuni se numesc substituibile. DS S ⋅ p ⋅ tn S ⋅ p ⋅ t S ⋅ p ⋅ t1 S2 ⋅ p ⋅ t2 Deci A ~ B ⇔ 1 + +...+ n = Þ 100 100 100 100 (10)
n
åS t k =1
k k
= S ⋅ t - ecuaţie cu două necunoscute, S şi t.
Cunoscând-o pe una, o determinăm pe cealaltă. n (11) t = 1 å S k t k - durata de timp dată de timp numită S k =1 scadenţă comună.
n
n
Dacă S = å S k Þ k =1
(12) t =
åS t k =1 n
k k
åS k =1
- numită scadenţa
k
medie. 13.1.3. Procent mediu de dispunere Să presupunem că sumele S1 , S 2 ,..., S n sunt plasate pe duratele de timp t1 , t 2 ,..., t n cu procentele p1 , p 2 ,..., p n . Ne propunem să determinăm un procent mediu p pentru care, sumele S1 , S 2 ,..., S n plasate pe aceleaşi durate t1 , t 2 ,..., t n , să dea aceeaşi dobândă totală. n n n S ⋅ p ⋅t S ⋅ p ⋅ tk D=å k k k =å k Þ å S k ⋅ pk ⋅ tk = 100 100 k =1 k =1 k =1 n
åS
n
= på S k ⋅ t k Þ p =
k =1
⋅ pk ⋅ t k
Sk ⋅ tk
k =1
n
Deci: p =
k
åS k =1
k
⋅ pk ⋅ t k
Sk ⋅ tk
.
- procentul mediu de depunere.
13.2. Dobânda compusă DEFINIŢIA 1 : Dacă valoarea luată în calcul a sumei plasate S 0 , se modifică periodic pe durata de timp t, după o anumită regulă, vom spune că avem un proces de dobândă compusă (sau că plasarea sumei S 0 s-a efectuat în regim de dobândă compusă) DEFINIŢIE : Unitatea de timp la care dobânda se modifică se numeşte unitate etalon (perioadă). DEFINIŢIA 2 (echivalentă cu definiţia 1): Suma S 0 este plasată cu dobândă compusă când la sfârşitul primei perioade (a primei unităţi etalon) dobânda simplă a acestei perioade este
adăugată la suma iniţială a perioadei, pentru a produce la rândul ei dobândă în perioada următoare, ş.a.m.d. În operaţiile financiare pe termen lung, unitatea etalon (perioada) de timp folosită este anul, uneori semestrul sau trimestrul. 13.2.1. Stabilirea formulei dobânzii compuse
Fie: t = timpul de plasament, exprimat într-un număr întreg de perioade; S 0 = suma iniţială; p = procentul; p = dobânda unitară; i= 100 S t = suma finală după un număr întreg de perioade.
Anii
Suma plasată
Suma obţinută la sfârşitul perioadei
S0
Dobânda produsă în timpul perioadei S0 ⋅ i
1 2
S1
S1 ⋅ i
S 2 = S1 ⋅ (1 + i ) = S 0 ⋅ (1 + i ) 2
… t=n
… S t −1
… S t −1 ⋅ i
… S t = S t −1 ⋅ (1 + i ) = S 0 ⋅ (1 + i ) t
Deci: S t = S 0 ⋅ (1 + i ) t
S1 = S 0 ⋅ (1 + i )
(1)
Notăm : 1 + i = u şi obţinem S t = S 0 ⋅ u t (2) u se numeşte factorul de fructificare. El se găseşte calculat în tabele pentru anumite procente şi pentru perioada de timp de 1 an. OBSERVAŢIE : Formula (1) este valabilă şi în cazul când perioada de timp t nu este egală cu un an, cu condiţia ca procentul folosit să corespundă perioadei respective. Cazul când timpul nu este un număr întreg de perioade
I. Soluţia raţională Se foloseşte formula S t = S 0 ⋅ (1 + i ) t pentru partea întreagă a timpului şi dobânda simplă pentru partea fracţionară rămasă. 1 n h/k | | | | | t h t =n+ k După n ani, suma finală este S n = S 0 ⋅ (1 + i ) n . Calculăm dobânda simplă produsă pe seama S n în timpul fracţiunii h a k anului, cu dobânda unitară i . Obţinem: h h h æ hö S n ⋅ i ⋅ = S 0 ⋅ (1 + i) n ⋅ i ⋅ Þ St = S n + S n ⋅ i ⋅ = S n ç1 + ÷ k k k è kø Deci : S t = S 0 ⋅ (1 + i) n ⋅ æç1 + i ⋅ h ö÷ (3) kø è II. Soluţia comercială DEFINIŢIE : Două procente corespunzătoare la perioade de fructificare diferite sunt echivalente când pentru aceeaşi durată de plasament ele conduc la aceeaşi valoare finală. § § §
1 leu plasat cu dobânda unitară anuală „i” devine la sfârşitul primului an , 1+ i. 1 leu plasat cu dobândă unitară semestrială i 2 , devine la sfârşitul anului 1 + i = (1 + i 2 ) 2 . 1 leu plasat cu dobânda unitară trimestrială i 4 , echivalentă cu dobânda unitară anuală i , devine la sfârşitul anului 1 + i = (1 + i 4 ) 4 .
În general : 1 leu plasat cu dobânda unitară i k , corespunzătoare fracţiunii 1 a anului, este: 1 + i = (1 + ik ) k Þ 1 + ik = (1 + i)1/ k (4) k
Prin urmare, în cazul când t nu este un număr întreg de perioade æç t = n + h ö÷ , suma S 0 devine: S n = S 0 ⋅ (1 + i ) n pentru cele kø è n perioade întregi. Pentru o fracţiune k a anului, 1 leu devine (1 + ik ) , iar pentru h fracţiuni de acelaşi fel, devine (1 + ik ) h . Suma S n în perioada h devine: S n ⋅ (1 + ik ) h = S 0 ⋅ (1 + i) n ⋅ (1 + ik ) h . k Dar (1 + i k ) h = [(1 + i )1 / k ] h = (1 + i ) h / k . n+
h
Deci: S t ⋅ (1 + i) n ⋅ (1 + i) h / k = S 0 ⋅ (1 + i) k = S 0 (1 + i) t . Astfel, formula anterioară (1) este adevărată şi pentru t fracţionar. 13.2.2. Procent normal şi procent real (efectiv) EXEMPLU : Se depune suma de 100 lei cu 20% şi calculul dobânzii se face de două ori pe an. În primele 6 luni (primul semestru) suma de 100 lei aduce o dobândă de 10 lei, deci ea devine 110 lei la sfârşitul primului semestru. În următorul semestru dobânda va fi de 10 lei pentru 100 lei 10 şi 10 ⋅ = 1 leu pentru cei 10 lei. Deci, în total, pe an, dobânda va 100 fi 21 lei. 20% se numeşte procentul nominal. 21% se numeşte procentul real (efectiv). Deci, dacă facem calculul dobânzii pe fracţiuni de an, dobânda adusă la sfârşitul anului diferă de cea calculată cu procentul anual stabilit. Dacă anul a fost împărţit în k părţi egale şi i k reprezintă dobânda unitară efectivă corespunzătoare perioadei 1 , iar j k este k dobânda unitară nominală corespunzătoare perioadei 1 , vom k 1 obţine: j k = k ⋅ i k Þ ik = ⋅ j k (5) k
Înlocuind în (4), vom avea: k k jk ö jk ö æ æ k 1 + i = (1 + ik ) = ç1 + ÷ Þ i = ç1 + ÷ − 1 (6) k ø k ø è è 1
1
1 + ik = (1 + i ) k Þ i k = (1 + i ) k − 1 1
Sau din relaţia (5): j k = k ⋅ i k = k [(1 + i ) k − 1]
(7)
Relaţia (6) reprezintă legătura între dobânda nominală j k şi cea efectivă i k , oricare ar fi k ≥ 2 . 13.3. Dobânda unitară instantanee Fie i = dobânda unitară anuală efectivă. k = numărul de părţi în care a fost împărţit anul OBSERVAŢIE: Pentru k → ∞ vom stabili o limită pentru dobânda unitară nominală, limită numită dobânda unitară instantanee (dobânda se calculează astfel în mod continuu). Din relaţia (6) obţinem: lim j k = lim k[(1 + i )1 / k − 1] = k →∞
= lim k →∞
1 k
(1 + i ) − 1 = lim k →∞ 1 k
−
k →∞
1 k
1 (1 + i ) ln(1 + i ) k2 = ln(1 + i ) = δ . 1 − 2 k
Deci (8) δ = ln(1 + i ) este dobânda unitară instantanee. δ δ2 δn δ = ln(1 + i ) Þ 1 + i = e δ = 1 + + + ... + + ... Þ n! 1! 2! δ2 δn Þi =δ + + ... + + ... Þ i > δ , adică dobânda unitară efectivă 2! n! este mai mare decât dobânda instantanee. OBSERVAŢIE: Pentru determinarea dobânzii unitare anuale nominale j k atunci când se cunoaşte dobânda unitară efectivă i , sau întocmit tabele.
13.4. Echivalenţa în regim de dobândă compusă DEFINIŢIE: Două sume sunt echivalente în regim de dobândă compusă, la un moment dat, dacă ele au aceeaşi valoare actuală, actualizările făcându-se cu acelaşi procent. Fie două sume de valori finale S t1 şi S t 2 . Fie i = dobânda unitară. Atunci valorile la momentul iniţial sunt: S 0(1) = S t1 (1 + i) −t1 şi S 0( 2 ) = S t2 (1 + i ) − t2 . Echivalenţa la momentul iniţial este dată de relaţia: S t1 (1 + i ) −t1 = S t2 (1 + i ) −t2 . În general: Fie un grup de n valori finale : S t1 , S t 2 ,..., S tn plătibile în t1 , t 2 ,..., t n perioade. Fie un al doilea grup de m sume de valori finale: Sθ1 , Sθ 2 ,..., Sθ m , plătibile în θ 1 ,θ 2 ,...,θ m .
DEFINIŢIE: Două grupe de sume sunt echivalente în regim de dobândă compusă, la un moment dat, dacă suma valorilor actuale ale primului grup de sume este egală cu suma valorilor actuale ale celui de-al doilea grup de sume. Prin urmare, echivalenţa corespunzătoare unui aceluiaşi procent p , la momentul iniţial, este dată de relaţia: St1 (1 + i) −t1 + St2 (1 + i) −t2 + ... + Stn (1 + i) −tn = Sθ1 (1 + i) −θ1 + + Sθ 2 (1 + i ) −θ 2 + ... + Sθ m (1 + i) −θ m .
Vom putea da următoarea definiţie echivalentă: DEFINIŢIE:
Două operaţii financiare A şi B sunt DC
echivalente în regim de dobândă compusă A ~ B dacă ele au aceleaşi valori actuale. (1)
n
m
k =1
k =1
å S tk (1 + i) −tk = å Sθ k (1 + i) −θ k
În cazul mai general când procentul p (deci dobânda unitară) diferă de la o sumă la alta, atunci: n
åS
(2)
k =1
m
tk
(1 + ik ) −t k = å Sθ h (1 + i h ) −θ h h =1
Se cere: a) Înlocuirea sumelor S t1 , S t 2 ,..., S tn printr-o sumă unică S (înlocuirea făcându-se prin echivalenţă) : n
åS k =1
n
tk
(1 + i k ) −tk = S å (1 + i k ) −tk Þ k =1
n
Þ (3)
S=
åS k =1 n
tk
(1 + ik ) −tk
å (1 + i k =1
k
) −tk
b) Înlocuirea numai a scadenţelor t1 , t 2 ,..., t n scadenţă comună „t”: (4)
n
åS k =1
printr-o
n
tk
(1 + i k ) −tk = å S tk (1 + i k ) −t k =1
c) Înlocuirea numai a dobânzilor unitare i k (deci a procentelor p k ) printr-o dobândă unitară unică i (deci printr-un procent unic p) (5)
n
åS k =1
n
tk
(1 + ik ) −tk = å S tk (1 + i ) −t k k =1
d) Sumele S t1 , S t 2 ,..., S tn plătibile în perioadele t1 , t 2 ,..., t n le înlocuim printr-o sumă unică S , plătibilă la scadenţa t, cu procentul p (sau dobânda unitară i ). n
S (1 + i ) −t = å S tk (1 + i ) −tk sau k =1
(6)
n
S = (1 + i ) t å S t k (1 + i ) −t k , când cunoaştem i şi t . k =1
Când cunoaştem S şi i , dacă logaritmăm în relaţia (6), obţinem: n
(7)
t=
lg S − lg å S tk (1 + i ) −tk k =1
lg(1 + i )
13.5. Plasament cu dobândă simplă sau compusă Suma S 0 , plasată pe durata t , cu dobânda unitară i, va aduce dobânda: Ds = S 0 ⋅ i ⋅ t → în regim de dobândă simplă. Dc = S 0 [(1 + i ) t − 1] → în regim de dobândă compusă. PROPOZIŢIE: 1) Ds > Dc , pentru t < 1 an 2) Ds < Dc , pentru t > 1 an 3) Ds = Dc , pentru t = 1 an DEMONSTRAŢIE: Ds − Dc = S 0 ⋅ i ⋅ t − S 0 [(1 + i ) t − 1] = S 0 [i ⋅ t − (1 + i) t + 1] Introducem funcţia: f : [0, ∞) → R , f (t) = i ⋅ t +1− (1+ i)t . t t (t − 1) 2 t (t − 1) 2 (1 + i) t = 1 + ⋅ i + ⋅ i + ... = 1 + i ⋅ t + ⋅ i + ... 1! 2! 2! ì> 0, t > 1 t (t − 1) 2 ï t (1 + i) − (1 + i ⋅ t ) = ⋅ i + ... = í< 0, t < 1 2! ï= 0, t = 1 î
Dc (t )
Ds (t )
1 1
t
DEFINIŢIE: Operaţiile de plasare a sumei S 0 pe durata t în regim de dobândă simplă cu dobânda unitară i sau în regim de dobândă compusă cu dobânda unitară j, sunt echivalente, când determină aceeaşi dobândă. Deci: S 0 ⋅ i ⋅ t = S 0 [(1 + j ) t − 1] Þ i ⋅ t = (1 + j ) t − 1
t (t − 1) 2 (t − 1) 2 j + ... Þ i = j + j + ... Þ 2! 2 1 1 ìi < j , t < 1 t t şi sau j = ( 1 + it ) −1 i = [(1 + j) −1] Þí t îi ≥ j t ≥ 1
i ⋅t = t ⋅ j +
Prin urmare, pentru a realiza aceeaşi valoare finală (sau aceeaşi dobândă) prin plasarea sumei S 0 pe durata t > 1 , procentul anual în regim de dobândă simplă este mai mare decât procentul anual în regim de dobândă compusă.
CAPITOLUL 14 PLĂŢI EŞALONATE (RENTE) DEFINIŢIE: Se numesc plăţi eşalonate (rente), sumele de bani plătite la intervale de timp egale. DEFINIŢIE: Se numeşte perioadă intervalul de timp care separă plata a două sume. DEFINIŢIE: Dacă perioada este anul, plăţile eşalonate se numesc anuităţi. (semestrul – semestrialităţi, trimestrul – trimestrialităţi, luna - mensualităţi). Plăţile eşalonate pot fi: 1) plăţi eşalonate de plasament (sau de fructificare), făcute pentru constituirea unei sume de bani. 2) plăţi eşalonate de amortizare (sau de rambursare), în vederea rambursării unei datorii. Plăţile eşalonate pot fi: anticipate (la începutul perioadei) posticipate (la sfârşitul perioadei) Plăţile eşalonate pot fi: temporare (numărul de plăţi este finit şi fixat prin contract) perpetue (numărul plăţilor este nelimitat) viagere (numărul plăţilor depinde de viaţa unei persoane) Plăţile eşalonate pot fi: constante (sumele depuse sunt constante) variabile (sumele depuse sunt variabile) 14.1.
Anuităţi constante posticipate
a) Valoarea finală a unui şir de anuităţi constante, imediate, temporare Sn
Notăm: T = valoarea anuităţii constante; n = numărul de ani; i = dobânda unitară anuală; S n = valoarea sau suma finală a şirului de anuităţi în momentul n (momentul plăţii ultimei anuităţi) | 0
T | 1
T | 2
T ………… | n-1
T | n
T (i + 1) T (i + 1)
n −1
T (i + 1)
T n−2
u = 1 + i - factor de fructificare
Sn = T (1 + i ) n−1 + T (1 + i ) n− 2 + ... + T (1 + i ) + T = = T ⋅ u n−1 + T ⋅ u n − 2 + ... + T ⋅ u + T = un −1 = T (1 + u + ... + u n − 2 + u n −1 ) = T ⋅ u −1 n Deci: Sn = T ⋅ u − 1 . i OBSERVAŢIE : Pentru T = 1 (o unitate monetară) suma finală a unui şir de n anuităţi constante posticipate este: un −1 şi deci Sn = T ⋅ s n sn = i b) Valoarea finală (suma finală) a unui şir de anuităţi posticipate, constante, temporare, amânate. r Sn Anuităţile sunt amânate r ani, r < n . Prima plată se face posticipat, după r ani (prima plată făcându-se deci la momentul r+1) timp de (n-r) ani.
| 0
| 1
| …….. | 2 …….. r
T | r+1
T T | …… | r+2 ….. n-1
T | n
r Sn = T ⋅ u n − r −1 + T ⋅ u n − r − 2 + ... + T ⋅ u + T = u n−r − 1 = T (1 + u + ... + u n − r − 2 + u n − r −1 ) = T ⋅ u −1 n-r termeni r Sn = T ⋅
u n−r − 1 sau r Sn = Sn-r i
OBSERVAŢIE : Valoarea finală a şirului de anuităţi posticipate egale cu T calculate pe n ani, dar amânate r ani, este egală cu valoarea finală a acestor plăţi, imediate, dar calculate numai pe (n-r) ani. EXEMPLU: Să se calculeze valoarea finală a unui şir de 10 anuităţi egale cu 1000 u.m. , plătibile la sfârşitul fiecărui an (dar amânate 5 ani) cu procentul p = 5% . Soluţie : i = 0,05 , r = 5 , n − r = 10 Þ n = 15 5 S15 = 1000⋅ 1.05 − 1 = 1000⋅12,577892= 12577,892 u.m. 0,05 10
c) Valoarea actuală a unui şir de anuităţi constante, posticipate, temporare, imediate An DEFINIŢIE: Se numeşte valoarea actuală a unui şir de anuităţi (constante, posticipate, temporare, immediate) An suma necesară şi suficientă în momentul iniţial pentru a se putea plăti scadenţele fixate la scadenţele 1, 2, …, n (constante în valoare de T unităţi monetare). | 0 An
T | 1 T ⋅u
T | 2 T ⋅u2
T T ………… | | n-1 n n −1 T ⋅u T ⋅un
OBSERVAŢIE : An este egală cu suma valorilor actuale a fiecărei anuităţi. An = T ⋅ u + T ⋅ u2 + ...+ T ⋅ un−1 + T ⋅ un = T ⋅ u ⋅ (1+ u + ...+ un−1 ) An = T ⋅ u ⋅
un −1 u −1
OBSERVAŢIE: Pentru T = 1 (o n u −1 şi deci An = T ⋅ a n . notăm: a n = u ⋅ u −1
unitate
monetară)
EXEMPLU: Ce sumă unică depusă imediat poate să înlocuiască plata a 12 anuităţi constante ( T = 1250 u.m.) posticipate, cu procentul de 5% ? 12 An = 1250⋅ (1 + 0,05) ⋅ 1,05 − 1 = 1250⋅1.05 ⋅ 1,80 = 47250 0,05 0,05
d) Valoarea actuală a unui şir de anuităţi (constante, posticipate, perpetue, imediate) A∞ Anuităţile sunt perpetue, deci plata se efectuează nelimitat. 1 Pentru T = 1 , avem a ∞ = şi dacă T > 1 Þ A∞ = T ⋅ a ∞ . i e) Valoarea actuală a unui şir de anuităţi (constante, posticipate, temoprare, amânate) rAn Plata se face după r ani, posticipat, timp de (n-r) ani. | 0 rAn
| 1
| …….. | 2 …….. r
T | r+1
T T | …… | r+2 ….. n-1
rAn = T ⋅ u r +1 + T ⋅ u r + 2 + ... + T ⋅ u n =
T | n
= T ⋅ u r +1 (1 + u + ... + u n − r −1 ) = T ⋅ u r +1 ⋅
u n−r − 1 = u −1
u n −r − 1 u n−r − 1 =T ⋅ ur ⋅ u ⋅ = T ⋅ u r ⋅ an−r i u −1 Deci: rAn = T ⋅ u r ⋅ a n − r .
= T ⋅ u r +1 ⋅
EXEMPLU: Care este suma unică pe care urmează să o plătească o persoană pentru a înlocui plata a 12 anuităţi posticipate de 3000 u.m. fiecare, amânate 3 ani, cu procentul p = 5% ? Soluţie: n − r = 12 , r = 3 , n = 15 3A15 = 3000⋅ (1,05)3 ⋅ a12 = 3000⋅ 0,863837⋅ 8,86325= 22969,21 u.m. 14.2.
Anuităţi constante anticipate
a) Valoarea finală a unui şir de anuităţi constante, anticipate, temporare, imediate S n T | 0
T | 1
T T | …….. | 2 …….. n-1
| n
S n este egală cu suma valorilor finale a fiecărei anuităţi, la momentul n. S n = T ⋅ u n + T ⋅ u n−1 + ... + T ⋅ u = T ⋅ u ⋅ (1 + u + ... + u n−1 ) = u n −1 u n −1 = T ⋅u ⋅ i u −1 n Deci S n = T ⋅ u ⋅ u − 1 . i Pentru T = 1 obţinem valoarea finală a unui şir de anuităţi anticipate a 1 u.m.; notăm s n . = T ⋅u ⋅
sn = u ⋅
u n −1 şi deci S n = T ⋅ s n . i
b) Valoarea finală a unui şir de anuităţi anticipate, constante, temporare, amânate r ⋅ S n
| 0
| 1
| …….. | 2 …….. r
T | r+1
T T | …… | r+2 ….. n-1
r ⋅ S n = T ⋅ u n − r + T ⋅ u n − r −1 + ... + T ⋅ u = T ⋅ u ⋅
Deci: r ⋅ S n = T ⋅ u ⋅ u
n−r
i
−1
T | n
u n−r − 1 i
adică r ⋅ S n = T ⋅ S n − r .
c) Valoarea actuală a unui şir de anuităţi constante, anticipate, immediate, temporare An DEFINIŢIE: Se numeşte valoarea actuală a unui şir de anuităţi anticipate, suma necesară şi suficientă în momentul iniţial pentru a se putea plăti la fiecare din scadenţele fixate 0, 1, …, (n-1) suma egală cu T. Notăm cu An această sumă. T T T T | | | …….. | | 0 1 2 …….. n-1 n 2 n −1 An = T + T ⋅ u + T ⋅ u + ... + T ⋅ u = T (1 + u + ... + u n −1 ) = =T ⋅
u n −1 un −1 . =T⋅ u −1 i
An = (1 + i ) An .
CAPITOLUL 15 RAMBURSAREA ÎMPRUMUTURILOR DEFINIŢIE: În sens general, se numeşte împrumut, o operaţiune financiară prin care un partener P1 (individual sau un grup) plasează o sumă de bani, pe o perioadă de timp dată şi în anumite condiţii, unui alt partener P2 . DEFINIŢIE: P1 se numeşte creditor. DEFINIŢIE: P2 se numeşte debitor. DEFINIŢIE: Operaţiunea prin care P2 restituie partenerului suma de care a beneficiat (suma împrumutată) se numeşte P1 rambursarea (sau amortizarea) împrumutului . Prin urmare, împrumutul este o operaţiune ce conţine două părţi distincte şi anume creditarea şi rambursarea. Fiecare componentă reprezintă o operaţiune de plăţi eşalonate. În general cele două operaţiuni nu au loc simultan şi deci valoarea lor finală nu este aceeaşi. Ele au în comun valoarea actuală a rambursării, adică valoarea împrumutată. Împrumutul se constituie prin anuităţi constante formate din: rambursarea unei părţi a datoriei; dobânda asupra părţii din datoria rămasă la începutul perioadei în care se efectuează plata. Aceste sume rambursate anual şi care au rolul de a amortiza treptat suma împrumutată, se numesc amortismente. 15.1. Amortizarea unui împrumut prin anuităţi constante posticipate Fie V0 suma împrumutată la momentul iniţial. Fie T1 , T2 ,..., Tn anuităţile succesive, astfel:
prima anuitate ( T1 ) se plăteşte la un an de la acordarea împrumuturilor; a doua se plăteşte un an mai târziu, ş.a.m.d.
Fie Q1 , Q2 ,..., Qn amortismentele succesive conţinute în prima, a doua,…, a n-a anuitate. Fie i dobânda unitară nominală a împrumutului. Fie n numărul de ani în care se face rambursarea. Momentul 0 1
Suma rambursată
Suma rămasă
T1 = Q1 + d1 = Q1 + V0 i
V1 = V0 − Q2
2 … p
T2 = Q2 + d 2 = Q2 + V1i …… T p = Q p + d p = Q p + V p −1i
V2 = V1 − Q2 …… V p = V p −1 − Q p
… n
…… Tn = Qn + d n = Qn + Vn −1i
…… Vn = Vn −1 − Qn = 0
V0
Deoarece Vn = 0 ÞVn−1 = Qn şi deci Tn = Qn +Vn−1i = Qn (1+ i) . a) Relaţia dintre suma împrumutată şi amortismente n
V0 = å Qi i =1
b) Relaţia între anuităţi şi amortismente Tp+1 −Tp = Qp+1 +iVp −(Qp +iVp−1) = Qp+1+i −i(Vp−1 −Qp) −Qp −iVp−1 = = Q p +1 − iQ p − Q p = Q p +1 − Q p (1 + i ) .
(1)
T p +1 − T p = Q p +1 − Q p (1 + i )
OBSERVAŢIE: Formula (1) este adevărată oricum am alege anuităţile. Cazuri particulare:
α ) Anuităţile sunt egale între ele:
T1 = T2 = ... = Tn = T Atunci din (1), obţinem: Q p +1 − Q p (1 + i ) = 0 , adică :
(2) Q p +1 = Q p (1 + i ) şi se arată uşor prin inducţie că: (3) Q p +1 = Q1 (1 + i ) p Prin urmare, în cazul anuităţilor egale când amortismentele succesive Q1 , Q2 ,..., Q p ,... formează o progresie geometrică crescătoare cu raţia (1 + i ) .
β ) Amortismentele sunt constante (egale între ele): Q = Q1 = Q2 = ... = Qn =
V0 n
Atunci din (1), obţinem: T p +1 − T p = −Q1i = −
V0 i , deci: n
V0 i n Prin urmare, în cazul amortismentelor egale, V succesive formează o progresie aritmetică de raţie æç − 0 è n progresie aritmetică descrescătoare.
(4) T p +1 = T p −
anuităţile ö i ÷ , deci o ø
OBSERVAŢIE: În cazul α ) al anuităţilor egale între ele, amortismentele formează o progresie geometrică de raţie (1 + i ) . Avem: n
n
k =1
k =1
V0 = å Qk = å Q1 (1 + i ) k −1 n n Notăm: 1 + i = u Þ V0 = Q1 å u k −1 = Q1 u − 1 Þ u −1 k =1 n i (5) V0 = Q1 (1 + ) − 1 i i Deci: (6) Q1 = V0 (1 + i ) n − 1 Relaţiile (5) şi (6) pot fi scrise sub formă echivalente, notând s n) = (1 + i ) n − 1 . (7) V0 = Q1 ⋅ s n) ; Q1 = V0 ⋅ 1 s n)
OBSERVAŢIE: Formulele (5) – (7) ne dau relaţiile între sumele împrumutate şi primul amortisment. c) Relaţiile dintre împrumutată
anuităţile
constante
şi
suma
Ţinând seama de echivalenţa dintre suma împrumutată V0 şi anuităţile actualizate pe baza dobânzii unitare nominale i, rezultă: 1 − (1 + i) −n V0 = T (1 + i) −1 + T (1 + i) −2 +... + T (1 + i) −n = T (1 + i) −1 = 1 − (1 + i) −1 = T (1 + i ) −1
sau:
1 − (1 + i ) − n 1 − (1 + i ) − n 1 − (1 + i ) n = T (1 + i ) −1 =T 1 (1 + i ) − 1 i 1− 1+ i 1+ i
(8) V0 = T ⋅ a n) Þ T = V0 1 a n) Relaţia de mai sus evidenţiază legătura dintre anuităţile posticipate constante şi suma împrumutată. 15.2.
Suma rambursată după plata a p anuităţi p
R p = å Qk . k =1
În cazul anuităţilor constante: p
p
p
k =1
k =1
k =1
Rp = åQk = åQ1 (1 + i) k −1 = Q1 å(1 + i) k −1 = Q1
(1 + i) p −1 . (1 + i) −1
sau: (1 + i ) p − 1 = Q1 ⋅ s p) i Relaţia (9) evidenţiază legătura dintre suma rambursată în primii p ani şi primul amortisment. Ţinând cont de (7), obţinem: (10) R p = V0 1 s p) Această relaţie evidenţiază legătura dintre suma rambursată în primii p ani şi suma împrumutată. După plata anuităţii de rangul p, rămâne de plătit suma V p :
(9) R p = Q1
V p = V0 − R p = V0 − V0 sn) − s p)
1 s p) sau s n)
(1+ i)n −1 (1+ i)n − (1+ i) p deoarece ) = s n i sn) (1+ i)n −1 n Dacă împărţim la (1 + i) atât numărătorul cât şi numitorul, obţinem: −( n− p ) (11) V p = V0 1 − (1 + i ) − n = V0 ⋅ a n) − p) 1 a n) 1 − (1 + i ) Vp = V0
15.3.
= V0
Legea urmată de diferenţe succesive a dobânzilor: d1 − d 2 , d 2 − d 3 ,... în cazul anuităţilor constante. Tk = Qk + d k , T1 = T2 = ... = Tn = T Þ T = Qk + d k , k = 1,2,..., n . d k = T − Qk deci: d k = d k −1 = T − Qk − (T − Qk +1 ) = Qk +1 − Qk d k − d k +1 = Q1 (1 + i ) k − Q1 (1 + i ) k −1 = Q1 (1 + i ) k −1 =
= Q1 (1 + i) k −1 (1 + i − 1) = Q1 (1 + i) k −1 i , k = 1,2,...,n .
Prin urmare: d1 − d 2 = Q1i d 2 − d 3 = Q1 (1 + i )i d 3 − d 4 = Q1 (1 + i ) 2 i ………………………
OBSERVAŢIE: Diferenţele ( d k − d k +1 ) , k = 1,2,..., n , formează o progresie geometrică de raţie (1 + i ) şi cu primul termen (Q1 ⋅ i) .
Tabel de amortizare:
Anii
Suma datorată la începutul anului
Dobânda
Amortismentul
Anuitatea
dn
Qn
Tn
Suma datorată la sfârşitul anului
Vn −1
1
V0
d 1 = V0 i
Q1
T1
V1 =V0 −Q1
2 3
V1 V2
d 2 = V1i
T2
V2 =V1 −Q2
d 3 = V2 i
Q2 Q3
T3
V3 =V2 −Q3
… n-1
… Vn −1
… dn−1 =Vn−2i
… Qn −1
… Tn −1
… Vn−1 =Vn−2 −Qn−1
n
Vn
dn =Vn−1i
Qn
Tn
Vn =Vn−1 −Qn =0
15.4.
Împrumuturi cu anuităţi constante şi dobândă plătită la începutul anului
La semnarea contractului se plăteşte dobânda pentru primul an, d1 = V0 i , deci suma reală ridicată este , iar pentru fiecare din anii următori se plăteşte amortismentul şi împreună cu el dobânda asupra sumei rămase de plată la începutul anului. Anul 0
suma efectiv primită
V0 (1 − i )
Anul1
T1 = V1i + Q1
V1 = V0 − Q1
Anul 2 … Anul p
T2 = V2 i + Q2 … Tp = Vpi + Q p
V2 = V1 − Q2 … V p = V p −1 − Q p
Anul p+1
T p +1 = V p +1i + Q p +1
V p +1 = V p − Q p +1
… Anul n-1
… = Vn −1i + Qn −1
… = Vn − 2 − Qn −1
Anul n
Tn −1
Tn = Vn i + Qn
Vn −1
Vn = Vn −1 − Qn = 0
Calculând diferenţa dintre două anuităţi consecutive, obţinem:
T p +1 − T p = (V p +1 − V p )i + Q p +1 − Q p = (V p − Q p +1 − V p )i + + Q p +1 − Q p = Q p +1 (1 − i ) − Q p
Deci: (1) T p +1 − T p = Q p +1 (1 − i ) − Q p Dacă presupunem că anuităţile sunt egale (T1 =T2 =...=Tn =T), vom obţine: Qp 1 sau, notând =1+ r Þ Qp+1 (1 − i) − Qp = 0 Þ Qp+1 = 1− i 1−i (2) Q p +1 = (1 + r )Q p Prin inducţie după p rezultă că în sistemul de împrumut cu dobânzile plătite la începutul anului şi anuităţi constante, amortismentele formează o progresie geometrică de raţie (1 + r ) . (3) Q p +1 = (1 + r ) p Q1 15.5.
Aplicaţie
O persoană împrumută o sumă de bani pe care urmează să o ramburseze în 6 ani prin anuităţi constante posticipate. Suma primelor două amortismente este 9226630 lei, iar suma dintre al doilea şi al treilea amortisment este 9559690 lei. Să se calculeze: a) procentul p al împrumutului b) primul amortisment ( Q1 ) c) ultimul amortisment ( Q6 ) d) anuitatea (T) e) valoarea împrumutului ( V0 ) Soluţie: a) Q1 + Q2 = Q1 + Q1 (1 + i ) = Q1 (2 + i) = 9226630 Q2 + Q3 = Q1 (1 + i ) + Q2 (1 + i ) = Q1 (1 + i ) + Q1 (1 + i ) 2 = = Q1 (1 + i + 1 + 2i + i 2 ) = Q1 (2 + 3i + i 2 ) = Q1 (1 + i )( 2 + i ) Q2 + Q3 9559690 = 1+ i = = 1,04 i = 0,04 Q1 + Q2 9226630
i = 0,04 ü ý p = 100i
p = 4%
b) Q1 (2 + I ) = 9226630 9226630 Q1 = = 4522860 2,04 c) Q 6 = Q1 (1 + i ) 5 = 4522860 (1,04) 5 = 5502750 d) T = Q6 (1 + i ) = 5502750 ⋅ 1,04 = 5722860 e)
d 1 = V0 i d1 = T − Q1 = 5722860 − 4522860 = 1200000 d 1200000 V0 = 1 = = 30000000 0,04 i
CAPITOLUL 16 MATEMATICI ACTUARIALE 16.1.
Teoria mortalităţii
Datorită faptului că populaţia unui oraş, judeţ, a unei ţări, etc., este de volum foarte mare, fenomenele de supravieţuire sau de deces ale unei persoane oarecare se comportă asemănător schemei lui Bernoulli (urna cu bila revenită). Într-adevăr: fie un grup de oameni care au împlinit vârsta e x ani, grup de volum l x . În anul care urmează, pentru o persoană oarecare din acest grup există două posibilităţi: a) supravieţuire (notăm acest eveniment cu S) cu P( S ) = p x . b) decesul (notăm acest eveniment cu M) cu P(M) = qx =1− px Evident, S ∩ M = ∅ , S ∩ M = Ω , P( S ) + P( M ) = 1 (sau p x + q x = 1 ). Acest grup poate fi considerat că se comportă după urna lui Bernoulli, deoarece chiar dacă unii indivizi decedează, alţii din grupul x − 1 îi iau locul, ei împlinind vârsta de x ani. Datorită acestor factori (legii numerelor mari) probabilitatea celor două evenimente S şi M poate fi înlocuită prin frecvenţa relativă f (n) , care poate fi determinată statistic. Matematicile actuariale analizează metodele care pot fi folosite pentru determinarea factorilor privind supravieţuirea sau decesul într-o populaţie determinată, ţinând seama de caracteristicile unei astfel de colectivităţi: volum foarte mare, oamenii nu pot fi urmăriţi individ cu individ, fenomenul naşterii, creşterii în vârstă şi decesul au un caracter continuu. 16.2.
Funcţiile biometrice
Biometria este ştiinţa care se ocupă cu măsurarea unor caracteristici cantitative legate de populaţie.
Funcţiile biometrice sunt acele funcţii care urmăresc sub diferite aspecte fenomenele de supravieţuire sau deces. Funcţii biometrice discontinue § §
§
Fie: l x = funcţia de supravieţuire a unei persoane de x ani ( x = 0,1,...) . Ea se găseşte în tabele. p( x, y) = probabilitatea de supravieţuire (probabilitatea ca o persoană de x ani să atingă vârsta de y ani). Dacă: y = x + n Þ p( x, y) = p( x, x + n) = np x p( x, x + 1) = p x = 1 ⋅ p x q ( x, y ) = probabilitatea de deces a unei persoane de x ani,
înainte de a ajunge la vârsta de y ani. Dacă: y = x + n Þ q( x, y) = q( x, x + n) = nq x q( x, x + 1) = q x = 1 ⋅ q x
§ §
§ §
m / q x = probabilitatea de deces a unei persoane de x ani, după ce au trecut m ani dar înainte de a împlini x + m + 1 ani m / nq x = probabilitatea de deces a unei persoane de x ani după ce trec m ani, dar înainte de a trece n ani (m < n)
Considerăm evenimentele: S ( x, y ) = supravieţuirea unei persoane de x ani, la vârsta de y ani. M ( x, y ) = decesul unei persoane de x ani până la vârsta de y ani. Avem: S ( x , y ) ∩ M ( x, y ) = ∅ ü ý Þ p ( x, y ) + q ( x , y ) = 1 S ( x , y ) ∪ M ( x, y ) = ∅ þ
l x = volumul colectivităţii corespunzătoare vârstei de x ani.
l x +1 = volumul colectivităţii corespunzătoare vârstei de x + 1
ani. Folosind definiţia clasică a probabilităţii: px =
l x +1 ; q x = l x − l x +1 = d x ; p x + q x = 1 . lx lx lx
ü ï ï ý Þ np x + nq x = 1 l −l nq x = x x + n ï l x ïþ np x =
l x+n lx
Fie A evenimentul ca o persoană să decedeze după ce a împlinit vârsta de x + n ani şi înainte de a împlini x + n + 1 ani. A = S ( x, x + n) ∩ M ( x + n, x + n + 1)
Deoarece S şi M sunt evenimente independente, avem: P ( A) = P[ S ( x, x + n)] ⋅ P[ M ( x + n, x + n + 1)] l l −l P( A) = nq x = np n q x + n = x + n ⋅ x + n x + n +1 lx l x+n l −l d P ( A) = x + n x + n +1 = x + n lx lx
Notăm: m / nM x = evenimentul ca o persoană în vârstă de x ani să decedeze între x + m ani şi x + n ani (m < n) . Avem: m / nMx = S(x, x + m) ∩ M (x + m, x + n) Þ P(m / nMx ) = = P[S ( x, x + m)] = P[M ( x + m, x + n)] = (mpx )[(n − m)q x +m ] = −l −l l l l = x +m ⋅ x +m x+n = x +m x +n . lx l x+m lx
TEOREMĂ : Funcţia de supravieţuire l x este valoarea medie a variabilei aleatoare ce reprezintă numărul persoanelor care ajung să împlinească x ani dintr-o colectivitate de bază de volum l0 . Demonstraţie : În variabila aleatoare cu repartiţia binomială l0 = n şi probabilitatea de supravieţuire până la x este P( A) = p( x) , iar probabilitatea de deces până la x ani este P( A ) = q( x) = 1 − p( x) . Valoarea medie a variabilei aleatoare ce reprezintă evenimentul A de supravieţuire: Z = M (Z ) = nP( A) = l 0 p ( x)
Notând Z = l x Þ l x = l 0 p( x) Þ p( x) = l x deci: l0
l l x = l0 p ( x) şi p ( x) = x . l0
Notăm:
Ax = evenimentul ca o persoană din populaţia iniţială să
atingă vârsta de x ani. Ay = evenimentul ca o persoană din populaţia iniţială să atingă vârsta de y ani (cu x < y ) S ( x, y ) = evenimentul ca o persoană în vârstă de x ani să supravieţuiască la y ani. Avem: S ( x, y ) = ( Ay / Ax ) → realizarea lui Ay când Ax a avut loc. P[ S ( x, y )] = P[ Ay / Ax ] = p( x, y ) = PAx ( Ay )
ì A ⊃ Ay Dar ïí x
ïî Ax ∩ Ay = Ay
şi deci: l
p( x, y) = PAx ( Ay ) =
P( Ay ∩ Ax ) P( Ax )
=
P( Ay ) P( Ax )
=
p ( y) l 0 l y = = p( x) l x l x l0
Notând y = x + n Þ p( x, x + n) = l x+ n = np x lx
Deci: p( x, y ) = l x ; p( x, x + m) = np x . ly
16.3.
Viaţa probabilă
Pentru o persoană în vârstă de x ani se defineşte viaţa probabilă acea vârstă υ = x + n ani pentru care probabilitatea de supravieţuire este egală cu probabilitatea de deces. np x =
1 l x + n lυ 1 1 ; = = ; lυ = l x 2 2 lx lx 2
Deci lυ = 1 l x determină viaţa probabilă pentru o persoană 2
de x ani. Concluzii: funcţiile biometrice discontinue studiate sunt legate de perioada de 1 an. Ele se găsesc tabelate din an în an. Funcţia l x este descrescătoare, iar q x = l x − l x+1 . lx
Graficul funcţiei l x .
l0
Ο Ο
1
2
3 x −1 x
x +1
View more...
Comments