Lívro Noções de Probabilidade e Estatística - Magalhães parte 2 (1).pdf
April 16, 2017 | Author: camilafuegos | Category: N/A
Short Description
Download Lívro Noções de Probabilidade e Estatística - Magalhães parte 2 (1).pdf...
Description
t68
Capítulo 6: Variáveis Aleatórías Contínuas
ruxilia na atribuição de probabilidades. Assim, paÍa a variável aleatória contínua X representando a profundidade do lençol de água, a função densidade f é dada )0r
r(,)
:
tt:',
para2}
b.
p(l.
c.P(X
J).{,,.. .
o
ã.2 Príncipais Modelos Contínuos
t
5. Numa certa região, fósseis de
pequenos animais são freqüentemente encontrados e um arqueólogo estabeleceu o seguinte modelo de probabilidade para o comprimento, em centímetros, desses fósseis.
;ç < 4).'
r).,
-
d. Um número b tal que,F(y e.
VuricÍveis Alecttórius CctntínuaE
s b):
vator esperado, à variância
0,6!_
(
árn"a;d" X. L \ " 3' A quantia gasra anuarmenre, em mirhões g" r.1i:, na uma cidade do inrerior e r"pr"r"ntJãi""tu uuriau"r manurençao oo ugr)tro.rn I, com densidad/ar.r, e{auaupoì: ,.^", se 0,5{yq2. I
ffu):{i,-t, ( U,
Í(*):J
h",
i"
41 r 18:
* *' 8(z(10; 10(r(11;
[ il,'
caso contrário.
a. Faça um gráfico da função densidadé;
Obtenha: a. P(y < 0,8).
caso contrário.
''-
b. Para um fóssil
b. P(Y > 1,51I'> 1). c. O valor esperado e a variância de
d. A medianadey.
encontrado nessa região, determine a probabilidade do comprimento ser inferior a 6 centímetros? E de ser superioi a 5 mas inferigr ( a 10,5 cm? c. Encontre o valor esperado para o comprirnento dos fósseis da região.
)..
4' o grrifico abaixo representa a densidade de uma variáver areatóriax.
6.2 Principais Modelos Contínuos Apresentamos, nesta seção, os principais modelos teóricos para variáveis ttlcatórias contínuas. Vimos que, para caracterizar completamente uma variável
ttlcatória contínua, precisamos fornecer sua função denìidade de probabilidade segundo sua definição, é uma função positiva e com integral iguãt a t.
11rrc,
DcfiniçQo 6.4: Modelo Uniforme Contínuo
uma variável aleatória x tem distribuição (Iniforme contínua < b, se sua função densidade de próbabilioáoe o dada por:
irrtcrvalo fa,bl, a
f (")
:{
b-a' 0,
ol " ,/. Ir.I)ctcr.min? p(X > 0l-r. s).' a. Obtenha o valor a"
tr. C"'irlcute A4d(X),
E(X) e Vor(X)
..,..,.
no
a1r1 caso contrário.
Usaremos a notação X - [J[a,b] para queXsegueomodelo lrriforme Contínuo no intervalo considerado. Note que não há restrição de valores paÍa cL e b, exceto o fato de a < b. A f rigura 6.I mostra a densidade do modelo U[a,b], para a)b > 0. tr t
"-! t78
Capítulo 6: Variáveis Aleatórias
179
ô,2 Principais Modelos Contínuos
torlos os pontos, temos que clncla
X - U[0,6],
com função densidade de probabilidade
por
r@)
:
{',3; lï,ï=*ï,ã.1;
Para calcular a probabilidade de
X e {[0,1]U [5,6]], podemos
obter
as
drças dos dois retângulos hachuriados na figura a seguir. l@)
Figura 6.7: Densidade Ilnifurme Contínua.
o modelo uniforme pressupõe que os valores possíveis para a variál aleatória têm todos a mesma probabilidade de ocorrência. seu válor esperado sua variância são obtidos através do cálculo de integrais, de tal forma que: f---_.
b2+ab+a2 -t
segrrc, sem maiores dificuldades, que a probabilidade desejadaê 113.
Esse mesmo cálculo poderia ser feito através de integrais da seguinte
e}
logo,
o2
:
E(xz)
-
p,
:
b2+ab+a2
P(x e {[0,1] u [5,6]]) : P(0 P(x < 2)' resurtando em 0,62. 2) pode ser carcurada pero comprementar N"í";r;; iguardade J"*Jü,"res, sugere qu P(x > 7lx > 5): P(x >2). --+
.
como veremos' adiante, isto não foi coincidêlcia propriedade da densidaj" mas sim uma importar palavras, a infor rntervalo é maior ou iguar 9_n"í.r.ïrn de quo a s, iaz";;;;";ï,,1Í:ïïl1t:,i ,inrormaÇão probabilidade dele I 7 possa ,". ser maior ou io' A AtrqvÁo ,:^ --,-l .a
y= ::l;'lrrffií,*l",mn i{:i ïili;f ;ï=ï,",:'i tempo que devemos considerar puru .ur*iur probabiridade "ul"ulon
A
_
a
característica de permitir
a
àesejada.
hanslrìaãn
Ã^
única urtrca olstnbuição distribuição conrínua propriedade, conforme contínua com Le verificamos verificc-^" a- seguir. verit."-^"';::j..,' "Erpç*)e ^^__,1 p"."
que ";;í;;;"
,"r,
.".i"",ïï
Dentre todos os modelos teóricos, sejam contínuos ou discretos, o mais lmportante é o modelo Normal. Ele é muito utilizado èm aplicações e também Eerve como aproximação para muitas outras distribuições. Dcfinição 6.6: Modelo Normal Dizemos que uma variável aleatória contínua X tem distribuição Normal p e 02, se sua função densidade é dada por: parâmetros corn
f(n):+"o1/2r
s,
r
,r'"P
lpata
-oo50):f1zoo\
'tãn\ n )o'sro'7200-t' Figura 6,4: Aproximação Normal para o Modelo Binomíal. Para melhorar a aproximação, alguns autores introduzem a correção de corltinuidade no cálculo com a Normal. Esse mecanismo consiste em alterar de 0,5 unidade o valor com que se deseja calcular a probabilidade. A alteração para tuitis ou para menos depende, respectivamente, da probabilidade desejada excluir ou incluir a igualdade ao valor desejado. Por exemplo, teríamos,
P(x >5o) - P(Y >
sera
u'e484; indicando que a solução so,ução N;;;d ;ã ##X; f#ï,ï"11;"'::i,?fi; 1,ffïJ[i:,i,ïil,ï;J,i']i1ïH"l Na.Figura Na histograma Figura 6.4, representamoì d" Binãmiar da representamos Bi;;iul* e- _a uwrròrudue densirran. n. o oa lormaÌ utili baseada baseúa no Teorema " "ï""rrãÌ;ï';""ï'"""e1' ^1oi1"l' aproxìmaçã";;;; r"or",ãu ;ôentral Central do Lïmite, Lïmite ,,,''1o*l_:1r.!zaaa,1a um impo.tanie flo n E* g"'ur, _ o cCanírrrt^ apíru o ? 7 . Em q, : ffi ,'ftïnï"r;"ïi r:: dada pela distribuição
r
*ì'ilï
ilHf,ïffi :ï ;
4s,s)
: P(z >
W,
: o,e4l4;
50,5 - 60 P(X > 50) - P(Y > 50,5) = P(Z > ---------) :0,9292. \/ 42 Note que, com relação a sinal de igual.
Y e Z, é indiferente
se a desigualdade inclui ou não o
Para calcular a igualdade a um valor, digamos X : 50, criamos um intcrvalo artificial, pois com variáveis contínuas essa probabilidade seria zero.
çap#ulo 6: Vartdvels Alearárlas
FT
t9l
Assim,
P(X :50)
-
p(4g,5<
- p150,5 '/42ì
f
< 50,5)
60
- 'v >_
49,5_60.
:0,0182.
-õ-)
exaro da probabilidade fornece o valor 0,0190; da aproximaçao. mostrando,
3^:r1::,". a qualidade
Como ilust
r::ïï,",Í;'.,rrl ïÌïïrïït*::ïïx';i;;ïïJ;'rïïïiii:íf n ;.;,.i;ï; vator de p=0.2,n
=tO
temos assim p iguat a 0,2.;0,j õ; ;.,ioo o" cada linha rumentado, tomando " os valores ro, sóÍil,roo p=0.2,n =30
p=0.2,n=100
Note como o histograma se aproxima de um modelo simétrico e em lbrma Élrro (semelhante ao modelo Normal) à medida que caminhamos da esquerdo ir direita (valores crescentes de n). Pode também ser notado que a tvcrgência será mais râpida em situações em que a distribuição Binornial é' ' Ëpftrxirnitclitmente simétrica, o que ocorre para valores de p próximos a 112. ' Uma propriedade muito importante do modelo Normal, cuja CCtttotrstração será omitida, é aquela que garante que qualquer combinação lineAr de virriírveis Normais independentes, também, terâ distribuição Normal, Em €gtlrrs palavras, se X1 , Xz, .. ., X, formam uma seqüência de variáveis aleatóriaS
N(tt,,r?) independentes è atta2,...,a,,, são constantes quaisquer, então g,r . fouxuterá distribuição Normal. Seus parâmetros são determinados a partir i=L
dns propriedades do valor esperado e da variância, ou seja,
r[fl o'4l]Fn.
'n
i--r
i:l
p*: E(DarXr):\n@rxr ) : oï
P=0.3,n =10
'\tr
:
rL
Don i:l
n,
E(Xn):Lorlu; i--L
V"r(Do;Xr, ) : \var(arXr ) : \alvar(Xr) i.:l i.:l i:L
: l"l ol, i:l
liste resultado amplia, consideravelmente, o uso da Normal em várias sitUnçõeU, conforme pode ser notado nos exemplos a seguir.
'Àï'='
Jl][
p=0.5,n=10 P=0.5,n =30
p=0.5,n=100
Â
Figura 6.5: Histogramas para valores simulados da Binomíal
Iìxemplo 6.10: rJm serviço de fiscalização é criado para averiguar se garrafm de refrigerante contém, de fato, o volume especificado pelo fabricante. Parn u,r", ""ito tanto, 10 gariafas do produto são compradas no varejo, em várias regiões dn cidade. Cada uma dessas garrafas é esvaziada e o volume de seu conteúdo, que denotaremos por I/, é aferido. Uma vez obtidos os 10 valores, a média aritmética M é calculada e, se M < 290 mililitros (ml), a companhia é multada. Estudos na linha de produção do fabricante mostraram que variações sempre ocorrem' rnesmo forem seguidas. Por essa tazáo, considera-se o volume dO ," os "rp""ificações conteúdó das garrafas como seguindo um modelo Normal, com média P : 300 ml e desvio-padrão o:25 ml. Gostaríamos de calcular qual é a probabilidade de que o fabricante seja multado injustamente?
A multa será injusta se, apesar de dentro das especificações, o valor de M for abaixo de 290 ml. Observe que isto pode ocorrer devido ànattreza aleatória do enchimento das garrafas.
''qItF
t92
'!ÇtF
Cnpftulo 6: VtrlrÍvels Aletttórittt
C,
P t i u t'
Denotando por uo volume da z-ésima ganadaa ser aferida que o fabricanre esreja denrro e su das especificaço"i weoo, 'i 7,... , 10. A média aritmética
:
U-ãáá'Aupo,
i1
tt
: D"ur: i:7
à#ros
-
tL
x^ïIv4*52 x^r 9+32 I u x
/385
10'
1, Sr:rrdo
X - Ul\,4l, n. P(X > 2). b. P(x > 2).
16
:
385'
'
tr
calcule
312) e P(X cl. Obtenha
P(312 <
P(X <
é' dada 2. A densidade de probabilidade para uma variável aleatória contínuaX pelo gráfico a seguir:
1).
f.P(0. 12} região crítica aa{1.99r rrróclia lt : Llcontra Lt = 14, t"y"i '{r erros tipo I dos as probabilidades uma amostra de iamanho 25. Deteimine
!. lrara uma variável oIL 'iÌráÌ
Dado que o teste é bilateral, a Região Críticaé da forma
RC: {r
8,)'l'tslt: pdrct 4 Médla ltoPulnthmrl
a-;r;;i;';:;"'"
b. ob-tenha a região críticae dê a conclusão do teste,{ara* os níveis de "" seguintes "" sigìificânci a: I!o, ,ú 'J%, 4Vo, 6Vo.e gTo. a
6.Umcriadortemconstatadoumaproporçãodelr}vodorebanhocomverminosc, e acredita que a doença diminuiu de O veterinário uri"Ã a dieta dos animáir intensidade.Umexameeml00cabeçasdorebanho,escolhidasaoacaso'
indicousdelas"o-u"''ninose'AoníveldeïZo,hâindíciosdequea proPorção diminuiu?
.4 258
Capltulo 8: l4ferência E$ntí,ttlcet;
Te,rtes
rle Ilipríte
ll.
| 'l\'ste l,(tftt
(t Mfulirt
utttt Vttri{lncit
259
Dcst.orthcte:itkt
8'3 Teste para a Média com variância Desconhecida os testes de hipóteses e intervalos de confiança para média, q pressupõem :::"r'"ï:Tï'^:j: iq": .qu: o valor da uuriãn"iu popuru.ionai
conhecido' Apesar de ser um caso particular, existem várias exe3nro, nump.rocesso indusrriar, se puder assegurar que uma certa máquina fornece
reprcsentados por "oo" na tabela do Apêndice A. Tal fato é conseqüência da r:rirrsistência do estimador 52 para o2, que faz com que a quantidade ? se rrlrltrxime de Z àmedida que aumenta o tamanho da amostra'
,tró.ilrïï;ï
;ïi.ï:Í: :3ï:i:,: Tlïl"]..lly
*"àidu,
fr""irão
const
"o-sËria aquela em uma ourra situação :ïi:"1ï:,,:T1l11iL1gconhecida.. podemos utirizar resultados enconrrados
;:Ë"ff#lïi caso mais g"rul, q#i;'#; ::ilol
em outros trabarhos, que manrenham alguma similaridade com o problema de :'-,.1,::1":.:l:",1*:, interesse. Entretanto, 'no
::ff:ïï,::
informação sobre a variância da variável . areatória q,r" ;J; sendo estudada, precisamos contornar essa dificurdade. Ìnicialmente, ryanterqnos a suposição do que a variável aleatória de interesse tem distribuição -- --5*" úrmal.b."e!" ^ rvrr'*r' vnão Normal será comentado no final da seção. precisa ser estimado. supondo i;;]!*s'V"lo.,l*ï: 1"'*"hecido, elepero veror de variáveis aleatóriag ""'y :ï: in1^ï:l !:?r:r::"ju.r:p.r"::ntada nfilizqt
n
ri-oll^^*tr
^^.:,-,
r
-
Capítulo 7 , é, a vafiãncia amosrra(
S,
: çiXl
_ nX211çn_
ffi:;;:ï:ï#: ,ïilJ;'l',"ïi
lt)
Figura 8.7: Densidade t- Student.
Definindo agora avariávelI padroniZàda ouA.onìj
-{-Lr x-À, T: X-l' /S'/, -X-'p t S/Jd
{q;lt
vemos que T também é uma variâver ur"ìt-,:riu. Entretanto, apesar de x ter distribuição Normar, o denominador envolve a variâver areatóriL's2, que fará com
que a função densidade de ? seja diferente da Normal. Esta náva densidade, que pode ser deduzida teoricamente, é denomi \gjq t de stqde4t er* pura-"tro tem o
\e\?de-slqusdcJiher4qde-nest{íaso"ú"íponoã"ãïã"i"ËrãËïï;;;;;:1' A notação utìlizqda Le!-4 !1,-1,e, devido a au sua função
densidade, as probabilidades são ouiiau, "ompte*ia"à" de taberas consìruídas numericamente. A exemplo da Normal, o modelo t-student tem densidade em forma de sino, gnlrqtaItto as-cau-das tem 4narol mq$,s3 qUe A_ry(0, f) (veja a fig"r" S.Zl. x911f--9Ì9r se o tamanho 4a [qrostra aqruenta., a dp1.1s-idadçJ.sndent ^^-..^_^Y,11" par-? a Noirnal p4drão. porìsia çorvgJge razã,o, as taberas conriruioa, se limitam a valores de gr-auìTel-iueraaáe menores ou iguais a r20.p;;; graus superiores a 120, as probabilidades são obtidas da tabela da distriÀição
Normal
e
Diferentemente do teste de hipóteses, construído para o caso em qUC S variância é conhecida, a região crítica envolverá agora o termo,52, que é umA quantidade aleatória. Dessa forma, amostras diferentes podem fornecer regiões
críticas distintas uma vez que, possivelmente' elas produzirão estimativas
diferentes para o2. éS!-Uq, qguo{q u Jqi4fql41gq-dqqqouhesüa' optarçmos por utilizar na região crítica valores da qlantidade padronizadaT. Apresentamos esse procedimento no próximo exemPlo'
Exemplo 8.5; Deseja-se investigar se uma certa moléstia que ataca o rim altera o consumo de oxigênio desse órgão. Pata indivíduos sadios, admite-se que esse consumo tem distribuição Normal com média 12 cm3lmin' Os valores medidos em cinco pacientes com a moléstia foram: 14,4; 12,9;15,0; I3,7 e 13,5' Qual seria n concluìão, ao nível de lvo de significância? ?t 'u'o qti,'\
I :
O teste de interesse é:
Hn
Í1,
:
Amoléstia não altera a média de consumo renal de oxigênio; : Indivíduos portadores da moléstia têm média alterada'
.qIF
260
Capltttlo 8; lttferência Esrnrl,rricn;
Trs,te,y
rle
!{
26l,
u..l'l'esle P(tr(t (t Méelkt t'ottt Varlllnrht I )ttctnrltcciiltt
iliyitere,r
Em termos da média populacional, estamos testando as hipóteses:
Ho : p,:12 versLts Ho : pt f L2, e a região crítica é da forma (0 < 1. tz}. Sendo o2 desconhecido, usaremos o estimador quantidade
ú
discutida anteriormente. sendo
n,
^g2
: rixr - rxr,1çn
_ 1)ea
X-u P('t1p.ffi<
u"rauíãlu, t",'o.
x-tz t:uru-tu)'
Logo,
Logo,
o
intervalo com coeficiente de confiança
'y
para É" com variâncin
desconhecida, será dado Por
q
úr) :0, 0r/2 + tt : l\T. P(T > úz) : 0,005
*
tz
-
_ 4,604; 4,604;
: {te Rlú < _ 4,604 ou t }
:13,90 e s|tr:0,62; tor," wot)s
:-
Ìon
-
4,604}.
calculamos o valorpadronizado
12
73,90 - 72 ;,JG: o,nrc:5,18'
.
1
:
a hipótese nula no
Intervalo de confiança para
da hipótese
com variância desconhecida
euando a variância é desconhecida, construímos intervaros de confiança para a média popuracionar ut'izando o n'i"to t_irrilïi. ô'0."""0r_enro para a obtenção do inrervaro é semerh;;," ; desenvolvid" anrerior. Supondo uma amosrn ateatória ""pr,uro ir,.|.",X,, obtida;; "J;;; população com distribuição Normal com média e variân"ìa'desconhecidas, temos que
{t
ComT:0,g0obtemos,databeladadistribuiçãot-Studentcom4grausde liberdade, tt12 :2,L32. Logo' z,tzzJí,w 1 s IC(1t,90Vo) : [13,90 - 2,132 J o,w I s;13,90 +
Portanto, como Í,6, RC d""ioimos pera rejeição da hipótese 5 nura, ou seja, a moléstia tem influência no consumo ,"rr'J^,neoio de oxigênìo ao nível de rvo. tr p,
S.
hn76l
vez que decidimos pela Exemplo 8.6; Considerando o exemplo anterior, úfna de confiançâ pnrtt tt e boa prática fornecer um intervalo rejeição da hipótese "ri", Íut," :13,90 e S3r," = 0'67' média populacional. Naquele exemplo foram obtidos
po.
RC
-
rC(t",ì:lX- ht2 Jn;X+
sendo o varor 4,604 obtido da tabera da distribui ção t-student, com4 graus de liberdade. Assim, a região crítica.".áOuão
Sendo Ìobs
trlz):"t'
[tS,OO; l+,7I]1.
não inclui o valor L2parapl' que foi "i.on,.uOo de rejeiçiio 8.5. Dessa forma, confirma-se a conclusão
deconfiançâ
f/,
E.;;;1"
.
desconhecida' não tiver Se a variável de interesse, além de ter variância para
densidade Normal,
J n"""rrário utilizar técnicas não-paramétricas
11
realizaçãodotestedemédia.Nãoapresentaremosessametodologiaaqui, considernf
ade é, novamente' entretanto, um caminho para contornar essa dificuld câSo, é sabido que '52 se um tamanho de amostra suficientemente grande' Neste jrintamerrte com.uma aplicação do aproxima de oz de tal forma que o seu úo,
como tendo distribuiçio Teorema Central do Limite, permite "on'iã"'ut -Í do ponto de vista Normal, resultando em aproximações bastante satisfatórias prático.
ru
262
Capítulo 8: Inferência Estatística: Testes de Hipóteses
os procedimentos adotados nos testes realizados até ugoru
l':_ryï:"1-g:trnri"an"iu",;;ffi
"onrirtirurJ ã":;ï*ïüã"":ïï":ïiï',i#":ï
;il;td;ffi;
procedimento clássico de testes de hipóteses. uma alternati escorhida po. p",qui,í."ï". lste em não fixar a "ï'ìu,ï1,seção. priori. Este será o assunto da próxima
ïTïïii,ï;,':i:"i:'i#ïï";rl'iït#ï';à
Exercícios da Seção 8.3: 1' com o auxflio da tabela t-student calcule (se necessário, aproxime): a. P(-3,365 ( Ís < g,J6b). b. P(lú81 < r,4).
c. P(-1,1 1tu ( 2,I5). d. O valor de a tal que p(úe ) a) : g,g2. e. O valor de b tal que p(ú16 í ô) : 0,0b. f. O valor de c tal que pflú111 S : 0,101 g. O valor de d ta| que p(t211 > ") d.): 0,0b.
\
2' uma amostra com 10 observações de uma variável aleatória Normal forneceu média de 5,5
e variância amostral4. Deseja-se testar, ao nível de significância de 5vo, se a média na população é igual oué menor que 6. eual é a conclusão?
3' Admitindo que a pressão sangüínea arterial em homens siga o modelo Normal, 7 pacientes foram sorteados e tiveram sua pressão medida com os seguintes resultados: 84, 81, 77, 95,69, g0 e 7V a' Teste que a média é g2 contraa alternativa de ser g0. use a : 2vo. b. Determine o intervalo de confiança para comcoeficiente LL de confiança 'Y
4.
8.4 Nível Descritivo
263
6. O número de pontos em um exame de inglês tem sido historicamente ao redor de 80. Sorteamos 10 estudantes que fizeram recentemente esse exame e observamos as notas: 65, 74, 78, 86, 59, 84, 75, 72,81 e 83. Especialistas desconfiam que a média diminuiu e desejam testar essa afirmação através de um teste de hipóteses, com nível de significância de 5Vo. Fazendo as suposições necessárias, qual seria a conclusão do teste?
8.4 Nível
Descritivo
'
Ao realizarmos um teste de hipóteses, partimos de um dado valor de a, pré-fixado, para construir a rcgra de decisão. Uma alternativa é deixar a cargo de quem vai utilizar as conclusões do teste a escolha do valor para a probabilidade a, que não précisará ser fixado à priogi. A idéia consiste em calcular, supondo que a hipótese nula seja verdadeira, a probabilidade de se obter estimativas mais desfavoráveis ou extremas (à luz da hipótese alternativa) do que a que está sendo fomecida pela amostra. Esta probabilidade será o nível descritivo, denotado por a* (ou P-valor). Elgr"!_pqqqenos de qf -gyldqgclam qug a_hip$tese nula-é-falsa pois, sendo a amostra nossa ferramenta de inferência sobre a população, ela fornece uma estimativa que teria probabilidade muito pequena de acontecer, se flo fosse verdadeira. O conceito do que é "pequeno" fica a cargo do usuário, que assim decide qual a usar para comparar com o valor obtido a*.
Inicialmente, vamos considerar o caso do teste de hipóteses unilateral. F : ltro, a expressão de a*.depende da hipótese alternativa, isto é,
Para H,,:
(t* : P(X 9,I. Assim, temos
a*
: 2 x P( X >,-E ,hsl H,, verd.) :2xp(X>9,11p:g) :2 x P(Z > 1,74) : 0,0818'
.
,n,í\'a
",'1r,,
i^
]
'
/
,
Logo, se desejarmos utilizar um nível de significância igual a 0,05 concluiríamos pela aceitação da hipóte se Ho, ao passo que um nível de significância igual a 0,10 nos levaria a rejeitar a hipótese Ho (ver Figura 8.10).
2()6
Capítulo B: Inferência Estatística: Testes de Hìfuóteses
267
8.5 Testes QuïQuadrado
j
I 4. Sorteamos, ao acaso, 12 observações de uma variável aleatória que segue o modelo Normal. Da amostra obtivemos média 21,7 e desvio padrão 5,5, Determine o nível descritivo do teste F:18 contra p > IB.
8.5 Testes Qui-Quadrado Apresentamos, nesta seção, três testes que utilizam o modelo QuiQuadrado como estrutura probabilística e, por essa razão, são denominados, de Íbrma geral, Testes Qui-Quadrado. Iniciamos testando a adequabilidade de um modelo probabilístico para uma dada situação, depois discutimos o teste de independência entre duas variáveis e encerramos a seção com o teste de homogeneidade de subpopulações.
o nível descritivo nos fornece uma idéia da intensidade com a quaì estamos rejeitando, ou não, a hipótese nula. Dessa forma, tem papel importante do ponto de vista exploratório, üma vez que pode nos fornecer indicações para pesquisas futuras.
E
Exercícios da Seção 8.4:
l'
Um pesquisador está, realizando um teste para a média e obteve nível descritivo
igual a 0,035. Ele aceitará a hipótese nula para níveis de significância
superiores ou inferiores à 0,035?
2. uma variável aleatória-tem distribuição Normal e desvio padrão igual a 10. urra amostra de 50 varores dessa variável forneceu média igual a 15,2. para cada um dos testes abaixo responda qual é o nível descritivo. ' t, H,, :1-l : 18 versus Ho i p : IJ.C/ h. Hu : &: 18 versus Ho: p, < IB. c. H,, : l-t: IB versus H, : pt Ig. I d. H,, : l_t: 17 versus Ho : p,: llr. 3.
A
resistência de um certo tipo de cabo de aço é uma variável areatória modelada pela distribuição Normal com desvio pádrao 6 kgf. uma amostra de tamanho 25 desses cabos, escolhida ao acaso, fôrneceu meãia igual a 9,g kgf. Para o teste p : 13 contra & : 8, qual é o nível descritivo? eue conclusão você consideraria adequada?
Nas seções anteriores, nosso problema foi testar hipóteses sobre os parâmetros média e proporção. Em geral, as formas das distribuições de probabilidade eram conhecidas (ou seriam aproximadas) e tínhamos que decidir cluanto a aceitar uma ou outra hipótese, sobre o valor desse parâmetro. Em termos práticos, outra situação comum é termos observações de uma variável aleatória cuja distribuição na população é desconhecida. Nesse caso, uma das primeiras providências é tentar identificar o comportamento da variável com um modelo tcórico. Em algumas situações, é possível incorporar informações de outras variáveis que descrevam fenômenos aleatórios similares e tenham distribuição 'conhecida. Dessa forma, teríamos um candidato a modelo e nosso problema serin cstabelecer um procedimento para aceitárlo ou não. Existem, contudo, vÍlriOS outros casos em que não se tem a menor idéia do comportamento da variável, Uma das maneiras iniciais de análise é construir um diagrama, com as freqüências cle ocorrência, nos moldes do histograma. Dessa representação gtáfica, pode sair a sugestão de modelos adequados aos dados. Em qualquer caso, o modelo proposto pode ser testado através do chamado Teste de Aderência. Nesta seção, itpresentaremos um desses testes que usa a distribuição Qui-Quadrado, outros testes de aderência podem ser encontrados nas referências mencionadas na bibliograiia. Considere uma variável X para a qual temos uma amostra de valores e cleseja-se verificar a adequação ou não de um certo modelo probabilístico. Os valores observados da variável foram divididos em k categorias contendo, caclo ulra, um ou mais valores que são apresentados numa tabela de freqüência: Categoriit
1
2
3
h
lìrect, Observarlit
O1
O2
Or
oÀ,
268
Capítulo 8: Inferência Estatística: Testes de Hipóteses
2ó9
8.5 Testes Qui-Quadrado
Se X for discreta, as categorias são os próprios valores da variável, eventualmento agregando mais de um valor na mesma categoria. No caso contínuo, as categorias são definidas a partir de faixas de valores da variável. Do modelo que está sendo sugerido, calculamos as freqüências esperadas em cada uma das categorias.
irs categorias, obtemos a expressão de Q2 que é, assim, uma medida
Assim,
com parâmetro k - L, denominado de número de graus de liberdade da, rlistribuição. Essa distribuição é representada por X(r-1. O modelo Qui-Quadrndo ó contínuo e assume valores não negativos. Sua densidade tem uma expressão
Categoria Freq. Esperada
1
2
t J
k
e1
A2
93
êl'.,
se x seguir o modelo proposto, essas duas tabelas não devem ser muito discrepantes. o teste de aderência cria, então, o critério, pazá?èèiÇir se podemor aceitar ou não o modelo indicado. Em outras palavras, decidimo\ se os dadog amostrais oderem ao modelo ou não. As hipóteses do teste são: \ Ho: Ho:
X segue o modelo proposto; X não segue esse modelo.
.
vx
sendo que
complexa de forma que probabilidades serão obtidas da tabela apresentada no Apêndice. A aproximação para o modelo Qui-Quadrado será melhor, se todas as l'r'cqüências esperadas forem ao menos iguais a 5. Se isto não acontecer pâra
irlguma categoria, devemos combiná-la a uma outra de forma conveniente, glrantindo que todas as freqüências esperadas atendam a esse critério, lÌctomamos agora o Exemplo 8.2, construindo formalmente o teste de aderôncia.
I
A quantidade que usaremos para tomar nossa decisão será baseada na diferença entre os valores esperados sob -F1, e aqueles observados na amostrô, Podemos dizer que a diferença oi - ei dá uma idéia da compatibilidade entre og valores observados e o modelo proposto. Assim, se as diferenças forem muito grandes, é razoixel admitir que o modelo não deve ser adequado. por outro lado, pequenas diferenças podem ser aceitas, pois estamos sempre sujeitos a flutuações, quando trabalhamos com variáveis aleatórias. Baseando-se nessa idéia intuitiva, a quantidade utilizada no teste será:
o,:fg=_:,y i:7
da
iscrepância que queremos quantificar. É possível demonstrar que, para um tamanho de amostra suficientemente grande, a distribuição de Q2 pode ser aproximada por um modelo Qui-Quadrado d
Iixcmplo 8.9; No Exemplo 8.2, definimos X como sendo o número de impactos ttttteriores à falha em um equipamento eletrônico. Uma amostra de 80 ensaios foi obtida, cada ensaio representando os testes feitos até a intemrpção por falha no r.rrluipamento, resultando 80 observações da variável de interesse. Pretende-se vcrificar se o modelo Geométrico com p : 0,4 ê adequado. O teste será:
Ho:X-G(0,4); H,: X
A rlecisão será baseada no comportamento de Q2, definido acima. Considerando o lrrrnanho de amostra grande, a distribuição de Q2 pode ser aproximada pela Qui(Juadrado, com número de graus de liberdade que depende de quantas categorias scriro estabelecidas. A região críticaé constituída de valores grandes de Q2, isto é,
RC
k
representa o número de categoriaS, o; â freqüência observada e e4 q freqüência esperada para a categoriai. Para interpretar a expressão d" Q2, note que o termo o,i. et indica g diferença, na categoria e, entre a freqüência observada e a esperada ou, em outraÉ palavras, o desvio em relação ao modelo proposto. Se, simplesmente, fizéssemoB a soma desses desvios para todas as categorias, obteríamos zero, pois o total dc dados é o mesmo. Para evitar isso, tomamos o quadrado dos desvios. Entretanto, por serem quantidades não negativas, sua soma poderia se tornar artificialmentc alta e, por essa razáo, é conveniente fazermos uma mudança de escala dividindo esses desvios ao quadrado pela freqüência esperada. Somando agora, para todae
tem outra distribuição.
:
{ta : u2 q,,},
r'orì'ì q(, sendo determinado pelo nível de significância do teste, ou seja,
*:
P(Q2
)
q,,lHu verdadeiro).
Para determinar o valor observado de Q2, denotado por qf;,,", precisamos
olrtcr as freqüências esperadas. Se 11, for verdadeiro, (icotrótrico, isto é, P(X : k): pt':0,4 x 0,6È. Logo, lìreq. esperzrda clc rcsistôncia a À, impactos
:
80
x
Pl,
:
X
segue
80
x 0,4 x
o
modclo
0,6Â'.
Nir tabcla, a seguir, ilpresentilnìos ns l'reqüências esperadas e os valores que foram obscrvados no teste cle resistênciit t'enlizaclo.
270
Capítulo 8: Inferência Estatística: Testes de Hipóteses
Impactos
0
Freq. observada Freq. esperada
30
32,0
2
3
4
mais de 4
26
10
5
5
4
19,2
11,5
6,9
4rr
6,3
1
como a categoria correspondente ao valorZ tern--{eqüência
esperada
igual a 4,1 que é menor que 5, agregamos as duas últimas categorias formando a dos maiores de 3, a qual terâ a freqüência observada de g e.esperada de 10,4, Então,
q1u,:
(30
-
32,0)2
32,0
e6 - Le.2\2 ---tgp-+"'+
-
a
+
Uma situação bastante comum é aquela em que desejainos testar se um& variável segue um certo modelo, mas desconhecemos.um ou mais parâmetros da distribuição. Sendo assim, vamos utilizar a amostra para chegarmos às estimativas dos parâmetros desconhecidos, isto é, utilizando as próprias observações que dispomos, vamos obter estimativas que serão consideradas como valores dos parâmetros desconhecidos. Nesses casos, o número de graus de liberdade se altera çtara k-I-e, com e representando o número de parâmetros que foram estimados. No próximo exemplo, ilustramos essa situação ao testar a aderência de um conjunto de observações a um modelo contínuo.
Normal. Os dados, apresentados a seguir, representam a quantidade percentual de cinzas encontradas em 250 amostras de carvão analisadas em laboratório.
P( Q' > A.l H"):
0,0b.
Consultando a tabela na linha correspondente a 4 graus de liberdade e na coluna de \Vo, o valor crítico será q" : 9,49 que é maior que o valor observado de 3,44, concluímos pela aceitação do modelo proposto. A próxima figura apresenta a densidade do modelo Xl coma região críticado teste. tr Í
27t
5 Testes Qui-Quadrado
Ilxemplo 8.10: Deseja-se verificar a afirmação de que a porcentagem de cinzas contidas em carvão, produzido por uma certa empresa, segue a distribuição
Quadrado, com 4 graus de liberdade. Temos,
P(Q2 > q.l H.)
8.
Cinzas (em 7o)
freq. observada
9,5
l-
t-0,5
2
10,5
t-
11,5 L2,5 13,5 14,5 15,5 16,5 17,5 18,5
5
rL,'l12,5 l13,5 l14,5 l15,5 l16,5 l-
(x)
17,5 18,5
t-
l- 19,5
'ì\ í,'6 '
16 42 69 51
32 .\t Z.)
I 1
(lrral decisão devemos tomar ao nível de significância de 4%o? Como desconhecemos a média e a variância da Normal que será testada, prccisamos, inicialmente, obter suas estimativas a partir da amostra. Os melhores cstimadores desses parâmetros são a média e a variância amostral, representados 1,,,r X e ,S2, respectivamente. Para calcularmos suas estimativas, tomamos o ponto rrróclio do intervalo como representante dos valores da respectiva classe. Entflo, lrrììos qí,"=
e,q+
Fígura 8.11: Densidade
e,4e
X!
ì:Ía,"-I4,5; G2=s?t":2,7.
e Região Crítica.
l)cnominando por
Õ n vnritlvel nlentóriui porcentagem de cinzas contidas no
'ç Capítulo 8: Inferência Estatísïica: Testes de Hipóteses
272
273
8.5 Testes QuïQuadrado
carvão produzido pela empresa, as hipóteses a serem testadas são:
Ho:C -N(14,5;2,7); H, : C tem outra distribuição.
Categoria
freq. esperada
1
I
L,82 6,58 19,40 39,92 57,28 57,28 39,92 L9,40 6,58
10
L,82
2
3
,
4
Como antes, usafemos a estatística Q2 paru tomar a de\isao e, considerando o tamanho da amostra grande o suficiente, aproximamos a \tribuição de Q2 pela Qui-Quadrado. Dessa forma, utilizando a:47o, obteremob'a região crítica do
5 6
teste.
I
As diversas faixas constituem as categorias de valores da variâvel C e serão numeradas de 1 a 10. De modo a varrer os íalor\do intervalo (-oo, oo), correspondentes ao modelo Normal, acrescentamos às\ategorias 1 e 10 os valores, respectivamente, menores que 9,5 e maiores que 19$. Dessa forma, parA calcular as freqüências esperadas, procedemos da seguinte forma:
: 250 x P(C < 10,5 | flo verdadeiro); e,i : 250 x P(C € categoria i,l H'veÃadeiro), i :2, en:250 x P(C > 18,5 | Í1, verdadeiro).
.. ,9;
As probabilidades acima são calculadas da maneira usual
através da
tabela da Normal padrão. Por exemplo,
10f#Él : e19:ff. ,
________/ P(C 260com base numa amostra de 50 pacientes, em que se observou uma méclin amostral Í,"," :268. Utilize um nível de 5Vo'
paro que
c. Qual deve ser o tamanho da amostra, escolhida na população acima, o intervalo de confianç a para 1t tenhaum comprimento de 30 unidades? Use 'Y
:997o
'
d. Para o teste especificado em (b), calcule a probabilidade B para o erro de tipo II, se o valor real de p for igual a790' 6. Suponhamos que o tempo de cura para um doente tratado pelo método A de2 obàdeça a uma distribuição Normal, com média de 7 dias e desvio-padráo o tempo dimjnuir de finalidade a com dias. Um novo tratamento B é proposto pacientes com.0 de cura desse tipo de paciente. Em um experimento clínico, 25 do tempO de doença receberam o nouo tratamento B e ãbservou-se que a média restabelecimento para eles foi de 6 dias. ' a. Sabendo que o novo tratamento não influi na variância, identifique as hipóteses adequadas e teste-as, considerando um nível de significânciit
a:0102.
b' construa um intervalo de confianç a ('Y : 95vo)
para a verdadeira média da
distribuição do tempo de cura sob o tratamento B'
Capítulo 8: Inferência Estatística: Testes de Hipóteses
282
7. Uma empresa fabrica cilindros com 50 mm de diâmetro. O desvio-padrão dos diâmetros produzidos é de 3,0 mm. A fim de saber se a produção encontra-se dentro dos padrões esperados, a cada hora, 4 cilindros são amostrados e têm seus diâmetros medidos. A média dos diâmetros é usada para decidir se o processo de fabricação está operando satisfatoriamente. Assim, se o diâmetro médio estiver entre 47 e 53 mm, o processo deve continuar, caso contrário, a produção é interrompida e ajustes são feitos. Suponha que o comprimento dos diâmetros é bem modelado por uma distribuição Normal. a. Qual é a probabilidade de se parar incorretamente 4píodução, se a média do diâmetro continuar em 50 mm? b. Qual é a probabilidade da produção .ontíì\ se a média do diâmerro se deslocar para p:52? t \ 8. Sabe-se que a concentração média de cloro enco\ada na urina de recémnascidos, com gestação de 9 meses, é igual a 210 unidades e que o desviopadrão correspondente é igual a 20 unidades. Sabe-se também que, em recémnascidos prematuros, a concentração de cloro na urina tem um desvio-padrão igual àquele observado para os outros recém-nascidos, porém suspeita-se que a concentração média seja menor. Para testar a veracidade desta suspeita, uma amostra de recém-nascidos prematuros será observada com relação às concentrações de cloro na urina (admita que siga o modelo Normal). a. Formule as hipóteses adequadas. b. Quantos recém-nascidos prematuros devem ser observados para que tenhamos simultaneamente d= IjVo e 0rzoo)= 57o. c. Obtenha o nível descritivo do teste, se a concentração média de cloro observada na urina de uma amostra de 25 prematuros foi de 200 unidades. Interprete.
9. Um laboratório que fabrica comprimidos analgésicos anuncia que seu remédio contra dor de cabeça leva em média 14 min para aliviar a dor, com desviopadrão de 5 min. Um médico sustenta que o tempo é maior e seleciona aleatoriamente 40 pacientes. Pede a eles que tomem tais pílulas quando tiverem dor de cabeça, anotando o tempo (em minutos) até o alivio da dor. Após coletar todas as respostas, ele verifica que o tempo médio de alivio para esses pacientes foi de 19 min. Estes resultados confirmam a afirmação feita pelo laboratório? Faça as suposições necessárias e use a:\Vo.
p:0,6
contra p+0,6.Sendo n:100, indique probabilidade de erro tipo I para as seguintes regiões críticas: a. RC : {r e IR lr < 0,56 ou r } 0,64}.
10. Considere
o
teste
a
8.6 Exercícios
b. RC
: {r
283
e
lR
l" < 0,54 ou r > 0,66}.
11. Uma empresa não pode produzir mais que 5% de unidades defeituosas de um artigo num mesmo lote. Seja p a proporção de unidades defeituosas em um certo lote e suponha que, nesse lote, 100 artigos são sorteados para serem inspecionados. Responda as seguintes questões: a. Qual o parâmetro que se deseja testar? b. Qual é o estimador a ser utilizado e sua distribuição? c. Indique as hipóteses a serem testadas e interprete-as. d. Determine o critério de decisão com nível de significância de SVo. e. Com o critério obtido, calcule a probabilidade de aceitar um lote com77o de defeituosos. f,. Se forem observadas 10 unidades defeituosas, qual é o nível descritivo?
12.Uma urna contém bolas vermelhas e azuis. Para verificar a hipótese de iguais proporções dessas cores, extraem-se com reposiçáo,64 dessas bolas e decidese aceitar a hipótese acima, se o número de bolas vermelhas retiradas estiver entre 28 e 36.
a. Determine a probabilidade de rejeitar a hipótese, quando ela é realmente correta.
b. Qual é a probabilidade do eno tipo II, se a verdadeira proporção de bolas vermelhas é 0,6? c. Quanto vale a função poder, se a proporção de bolas vermelhas é 0,4?
13.
A
experiência mostra que
a
taxa de complicações, associada
a
um
determinado procedimento ciúrgico , é de 0,,20. Com o objetivo de reduzir essn taxa, um pesquisador desenvolveu um novo procedimento e o aplicou a umet amostra de pacientes. a. Se ele usar a nova técnica em 100 pacientes, qual deveria ser a taxa limite para que conclua que a nova técnica é melhor que a anterior? Fixe o nível de significância em 0,05. b. Se a verdadeira taxa de complicações associada à nova técnica for 0,08; qufll é a probabilidade de que, em uma amostra de tamanho 100, ele não consigtt rejeitar a hipótese nula? c. Suponha que o pesquisador mantenha a : 0,05 e deseje goJ :0,05. Qual _
deve ser o tamanho da amostra para que isso aconteça? 14. Entre milhares de casos de pneumonia não tratados com sulfa, a porcentagem
que desenvolveu complicações foi de lo7o. Com o intuito de saber se o emprego das sulfas diminuiria essa porcentagem, 120 casos de pneumonit
2U4
Capítulo 8: Inferência Estatística: Testes de Hipóteses
foram tratados com sulfapiridina e destes, 6 apresentaram compricações. Admitindo que os pacientes são comparáveis em tudo, exceto quanto ao
tratamento, teste a hipótese de que a proporção de casos com compricações entre os pacientes tratados com sulfa é signìficativamente menor do que os não tratados. calcule o nível descritivo e tome a decisão considerando a : 0,05.
15' Uma caixa tem bolas pretas e brancas. Existem 3 de uma cor e 2de outra, mas não se sabe ao certo qual a cor predominante. Retiramos, ao acaso e com reposição, 50 bolas da urna e observamos 2g bolas bçancas. seja p u p.oporção
pergunta_se: - 7*'-*
de bolas brancas na caixa, a. Qual seria o teste adequado para decidir sobre a,composição r---5 da caixa?
b.Qualconclusão, aonível a
: I\Vo? --\ II.
c. Determine a probabilidade do erro tipo
ì
16. um milionário dá uma grande festa e resolve ru"lr r,nu brincadeira com seus ";-"dos...). convidados (que a 'esú altura já esravam ;;h Dentre os presentes, tidos como bons degustadores de vinho, sorteia 30 pessoas e oferece a cada uma dois- copos de champanhe, numerados r e i, e solicita que indiquem quar deles tem champanhe importada (é ob;ig;tório escolher um único copo). Na verdade, os dois copos contém a mesma òhampanhe nacional! Deseja-se decidir se o "grupo" ainda é um bom provador de champanhe. a. Indique çomo formular as hipóteses nula e alternativa pu.u problema. b' Que decisão você tomaria, ao níver de significância : "rr" o 0,0g se 23 pessoas escolhessem o copo número 1? I c. E se 24 pessoas escolhessem o copo2? 17. um comerciante compra frutas para revenda e seu preço prevê no mâximo 5vo de frutas estragadas para que ele consiga algum lucro. Corno não tem recursos para contratar um estatístico, ele adota a seguinte regra práticar toma, de cada lote, 30 frutas ao acaso. se 3 ou mais estiveieo to," é devorvido; caso contrário é aceito. "rt.ulguaàr, a. Qual a probabilidade do erro tipo I, no teste adotado pelo comerciante? b' Esboce a função de poder do teste. comente o teste do comerciante.
18.
um
dado é lançado 216 vezes e o número de vezes que ocorreu a face 6 é contado. Decide-se aceitar a hipótese de que o dado e hánesio, se o número de ocorrências estiver entre 31 e 41.
a. Formule as hipóteses nula e alternativa e indique a forma da região crítica. b. Qual é a probabilidade do erro tipo I?
c. Qual seria a região crítica do tesúe ao níver 2vo designificância?
8.6 Exercícios
285
19. Suponha que se deseje estimar a proporção p de indivíduos com certa moléstia em uma dãda região. Selecionou-se uma amostra aleatíria de 100 pesso4s e constatou-se que 25 eram portadoras da moléstia. a. Calcule a estimativa pontual da proporção p ' b. Construa um intervalo de confiança para p com coeficiente de confiançn
? : 0,95. Qual o comprimento do intervalo? pesquisador acredita que a proporção de doentes é superior a20Vo,Teste Um c. essa hipótese ao nível a : 0,05. Formule as hipóteses nula e alternativa.
20. Testes exaustivos realizados pela indústria Cookbem indicam que seu forno de microondas tem probabilidade 0,1 de apresentar a 1a. falha antes de 900 horas de uso. Um novo método de produção está sendo implantado e os engenheiros garantem que a probabilidade acima indicada deve diminuir. Com vistas t verificar essa afirmação, escolheu-se aleatoriamente 100 aparelhos parsl realizar testes acelerados e os resultados indicaram que 8 deles tiveram sua lu. falha antes de 900 horas. a. Formule as hipóteses adequadas. b. Determine o nível descritivo.
c. Verifique se os engenheiros tèm razáo, considerando um nível de significância a : 6Vo. 2l.IJmaamostra de 10 adultos, na faixa de idade de 19 a 25 anos, apresentou Umtl freqüência cardíaca média de 68,7 batidas/min, com desvio-padrão de 8t67 batidas/min. Um manual de procedimento clínico indica que a pulsação rnédin para indivíduos nessa faixa etária deve ser igual a T2batidas/min. Admitindo qu" u variável medida se comporte de acordo com um modelo Normal e usando um nível de significância igual a a:47o, vocè diria que os dados fornecidos são compatíveis com a informação do manual? Qual é o nível descritivo correspondente aos resultados fornecidos pela amostra? 22. A resistência à ruptura em cabos de aço é considerada uma variável Normnl com média e variância dependendo de outros fatores' Uma amostra de 12 cabos produzidos por uma empresa são levados a teste para indicar se eles podem ser usados na construção de uma ponte. Cada cabo para ser uSudo precisa ter carga média de ruptura de no mínimo 2500 kg. Indique a conclusÍIo qu" ," pode tiãr, baseado no nível descritivo, se os seguintes resultados fbrenl observados na amostra: 2518, 2492, 2450, 2535, 2547, 2486, 2455, 2499, 2522,2505,2469 e244O.
28()
Capítulo B: Inferência Estatística: Testes de Hipóteses
23.
o crescimento de-bebês, durante o primeiro mês de vida, pode ser modelado
pela distribuição Normar. Admita que, em média, um crescimento de 5 centímetros ou mais seja considerado satisfatório. Deseja-se verificar se o crescimento de bebês de famílias em um bairro da periferia de são paulo acompanha o padrão esperado. para tanto, 10 recém-nascidos na região foram
sorteados
e sua altura
acompanhada, fornecendo as seguintes medidas de
crescimento em centímetros: 5,03; 5,02;4,95;4,96;5,01; e
4,93.
igl;
q,gO;4,9I;4,90
a. Que hipóteses estão sendo testadas? b. Qual é o estimador a ser utilizado para testar as hipóteses em (a) e qual é
sua distribuição? c. se a região crítica^construída é
Qualaconclusão?
{i
a
Reclamações
Freqüência
a
:
caso altere a média, dê um intervaro de confiança para anova média. 25. Alguns cientistas acreditam que em média 50|,o dosmateriais expelidos por erupções vulcânicas são constituídos de enxofre. Seja X a massa de enxofre contida a cada 2 quilos de material vulcânico. Acúita-se que essa variâvel rrão tem distribuição Normal. uma amostra de 100 caixas de 2 quilos desse 98 (em kg;
flrf " l:1
:
100 (em kg2).
a. Qual a distribuição de X? Indique as suposições feiras. lr. Formule as hipóteses e obtenha a região críti.u p*u a : 5vo. c. Qual a conclusão do teste?
d. Qual é a probabiridade do erro tipo II, enxofre?
r)
t
4
5
8
tô Òt)
28
24
16
12
No. de dias com acidentes Freqüência
significância,
5Vo de
0 64
2
1
40
56
t J
4
5
24
8
8
foi anotado minuto a minuto para uma amostra de 7O períodos (de um minuto). Os dados foram os
28. O número de chegadas de clientes a um banco seguintes:
eficácia dessa atitude, sorteou 10 cidades e observou as porcentagens investidas no último ano. os resultados foram (em porcentagem) g, 10, 9, 11, 8, 12, 16, 9, lr e 12. os dados trazem evidência de merhoria, ao nível de 2To?
:
2
Sh"t
Aporcentagem anual média da receita municipar kpr.guau em saneamento básico em pequenos municípios de um estado tem sido ívo 6d^ituque esse índice se comporte segundo um modelo Normal). o governo pretende melhorar esse índice e' para isso, ofereceu alguns incentivos. para verificar a
Ër, i:r
1
27. rJma indústria registra, em cada semana, o número de dias em que ocofrem acidentes de trabalho. Para uma amostra de 200 semanas, verifique se os dados apresentados a seguir, aderem ao modelo Binomial com parâmetros n : 5 e p : 0,2 (use nível de significância de lj%o).
)-
24,
rruterial forneceu
0
Formule as hipóteses testadas e dê a conclusão ao nível de
e IR : I 2
15
27
50
43
25
37
l2
8
8
T3
9
10
classificação dos pacientes quanto à severidade de uma seqüela indesejável da cirurgia.
32.8m uma escola de ensino médio, o desempenho dos alunos em matemática e física foi observado (ver tabela a seguir) para testar se existe dependência entre as duas disciplinas.
Física \ Matemática Notas Altas Notas Regulares Notas Baixas
34. Quatro grupos de pacientes com úlcera duodenal foram submetidos a diferentes cirurgias caracterizadas pela porcentagem de tecido gástrico removido. A tabela apresentada a seguir contém dados referentes à
Cirurgia\ Seqüela Y+D (OVo) Y+A(25Vo) V+H (507o) G+R(75Vo)
Verificar
Nenhuma
Pouca
Moderada
Total
61 68
28
7
96
23
13
t04
58
40
12
110
53
38
6
97
se existe associação entre a porcentagem de tecido gástrico removido
e a severidade da seqüela. Utilize o nível descritivo.
Notas Altas
Notas Regulares
Notas Baixas
46
77
22
47
r43
5B
29
72
40
calcule o nível descritivo. Qual a decisão, ao nível de significânci a2vo
?
33. Acredita-se que o empenho de estudantes universitários muda no decorrer do curso. Para investigar essa afirmação, decidiu-se estudar a relação entre ano de curso e aprovação em disciplinas. Os pesquisadores obtiveram os registros de 186 estudantes universitários, selecionados aleatoriamente, dentre a totalidade de alunos de uma certa instituição de ensino superior. Foram consideradas 3
35. Investiga-se, para um certo produto, a fidelidade (alta, média e baixa) de seus consumidores. Em uma amostra de 200 homens e 200 mulheres, foram classificados como tendo alto grau de fidelidade 120 homens e 80 mulheres, enquanto com grau médio, 50 mulheres e 50 homens. Os dados fornecem evidências (use a= 27o) de possíveis diferenças de grau de fidelidade entre os sexos? Indique o teste realizado.
.Ì6. Um levantamento inicial sugere que o núrnero de filhos depende da rendn familiar dos pais. Para confirmar essa suspeita, amostras de famílias foram coletadas, em cada classe social, e o número de filhos em cada família foi contado. Verificlue utravés de um teste de hipóteses se a variável tem
290
Capítulo 8: Inferência Estatística: Testes de Hipóteses
comportamento diferente em cada uma das subpopulações estudadas (use nível de significância de l%o). 2
J
>3
15
I 27
40
64
54
25
27
28
L2
8
10
25
15
8
2
Classe\ Filhos
0
Baixa Média
Alta
Cidade\ Instrução
Fundamental
A
26
65
I
B
10
46
30
C D
17t
,rJ
22
5
0
55
40
2
t r)
Pós Graduação 1
L4
38. A reação ao tratamento por quimioterapia foi estudada em quatro grupos de pacientes com câncer. Retirou-se uma amostra de pacientes de cada grupo o classificou-se a reação em três categorias: pouca, média e alta. Teste, ao nível de 2Vo, se todos Òs tipos de câncer reagem da mesma maneira. Câncer\ Reação
Pouca
Média
Alta
51
tt tJ r-,
16
100
58 48
29
13
100
42
30
L20
26
38
16
80
Tipo I Tipo II Tipo III Tipo IV
Total
39. um índice sobre qualidade de vida foi observado em uma amostra de 400 idosos. Os dados são apresentados a seguir. r0)
r0,20)
lzu,3u)
30,40)
15
32
55
48
lbb, íu)
70,75)
175,85)
28
20
18
Faixas Freq.
[0,
Faixas Frcq.
[50,55)
55,65)
55
56
7
140,45)
b. Com base no item (a), verifique se o modelo Normal é adequado para este índice. Como ficaria sua resposta sem utilizar a informação do item (a)?
Feminino
Masculino
con onclusão podemos tirar, usando o nível descritivo
Suderior
a. Teste se a média do índice é ou não igual a 50.
40. As tabelas a seguir contêm o número de pessoas segundo origem e opinião a respeito do aborto.
37. Deseja-se comparar o grau de instrução dos hapitantes de quatro cidades brasileiras que têm aproximadamente o mesmo tpmanho populacional. uma amostra de 100 habitantes foi sorteada em cada iidade e o nível educacional das as pessoas rol foi oDservado. observado. ljos Dos resultaclos resultados apÌesq na tabela abaixo, que
Médio
29t
8.6 Exercícios
45,50) 60 185,
t00l 6
Orieem\ Opinião
A favor
Contra
Origem\ Opinião
A tavor
uontra
Capital
l-0
Capital
18
55 22
40
Interior
45 90
Interior
20
a. Para cada sexo, verifique se origem e opinião são independentes. b. Combine as informações em uma única tabela desconsiderando sexo e teste novamente a independência das variáveisc. Discuta os resultados obtidos em (a) e (b).
41. (Use o computador) Considerando os dados do arquivo cancer.txt descrito no Exercício 24 do Capítulo 1, defina dois grupos: um de pacientes jovens,.com idades inferiores a 54 anos, e um de pacientes idosos, com idades superiores a 54 anos. Os grupos deverão conter I9l e lTl pacientes. Considere a variável nitrogênio na uréia (l/). a. Construa um box-plot para a variável ltr, para cada um dos gnipos etórios e compare-os descritivamente. Com base nos gráficos, existem indicações de que a idade está influenciando a concentração de nitrogênio na uréia? f. É Oe interesse verificar se a média populacional da variável .lü para os pacientes idosos é superior a 15. Supondo que o modelo Normal com desvio padrão o: 7 é adequado, qual a conclusão que pode ser tirada, para um nível de significância e :0,001? c. Considerando agora o grupo de pacientes mais jovens, verifique se a médiar populacional para l/ é menor que 15. Suponha que o desvio padrão populacional é conhecido igual a 5 e que o modelo Normal é adequndo. Obtenha o nível descritivo. d. Com base nos resultados dos itens (b) e (c), discuta o comportamento das ' médias da variável .A/ para os dois grupos de pacientes. 42. (Use o computador) Suponha que os dados do arquivo areas.txt (ver descriçf,o
corresponde a uma amostra de vdrios crnpreendimentos de umiì nìesma empreiteira. Segundo o memorial descritivo do empreenclimerrto, as uniclacles devem ter área total igual a 50 m2, independentemente do bloco. Iintretnnto, suspeita-se que as unidades do bloco B não satisl'azem s essn especiÍ'icitçÍio.
no Exercício 25, Capítulo 1)
Capítulo 8: Inferência Estatística: Testes de Hipóteses
292
a. Paru cada bloco, construa um histograma païa as áreas de cada um
dos
cômodos das unidades. Compare os gráficos. Para cada cômodo, discuta se existe diferença entre os tamanhos para unidades do bloco A quando comparadas com unidades do bloco B? b. Teste a hipótese de que os apartamentos dos edifícios construídos satisfazem, em média, ao memorial descritivo que especifica que a 6rea da sala deve ter no mínimo 28 m2. Use a : 0,05. c. Construa uma nova variável com a informação da ârea total (isto é, obtenha uma variável que é a soma das áreas de cadq cômodo) e faça histogramas considerando cada bloco. O modelo Normfl lhe parece adequado para
d.
descrever o comportamento dessa nova variâ/el? Verifique se, em média, a ârea total na 0 (o novo combustível aumenta
com LLD representando o valor esperado da diferença de rendimento, isto é, po:E(Y-X). Estaremos assumindo que a distribuìção de Di:Yi-X,i, para'í : I, ... ,12, é Normal com média pD evariãncia o2o. Com os dados observados, obtemos ã,6" : 2,9 e estimamos oã por : 2 14' Logo, sob f/o' s2D ru tubr
automóveis são apresentados na tabela a seguir. Autom. Após (Y) Antes (X )
D:Y-X
Iro 8,1 3,5
2
3
4
5
6
7
8
9
10
8,8 7,9 0,9
9,9
9,5
11,6
9,1
10,6
10,8
L3,4
t0,ti
10,5
l I,4
6,8
7.8 Ltl
7,6
7,9
E'0 5,4
9,5
8,0
t,2
5,7 4,9
ó14
4,0
1.1
2,5
6,8 4.0
J'I
2,4
1
T2
o rendimento),
:
o' : :ut'", P :''' . so,,o,l{n r,551\/12
6148.
0,05 e utilizando a tabela da distribuição Ú-Student com I I graus de liberdade, obtemos Í,, resolvendo a equação P(T > Ú,,) : 0,05. Obtemos t,,: I,796 e como t,,t* ) ú,,, concluímos que o novo combustível é eficaz nA
Com a
=-
298
Capítulo
melhora do rendimento, acafretando diminuição veículo considerado no experimento.
t);'ftíplrct
do consumo pere
A ('t,nt!ì(t|(tção dct lhms
2q9
Méllt,t
o ,E
E
caso 2. Amostras independentes com variâncias conhecidas
I E
ó)
Consideramos agora o teste relacionado com a situação em quc ql populações independ-entes, quando o,
jf: ::in;1,ï variânciasT:1t1'^* são conhecidas. A obtenção dà informaçã;
F-
.orrrrpu
;;rp.t;';.ïË
variância populacional pode ser obtido de estudos anteriores ou experimc;
similares.
Exemplo 9.4: Vimos no Exemplo 9.2 que, para comparar dois operacionais, dois grupos independentes de estuãantes foram
sl
selecionadog
tempo necessário parurcalizar a tarefa foi anotado.
i
Os dados obtidos foram os seguintes (em minutos):
Grupo
Tempo
A
182 185 193 175 184 tg2 175 173
I
92 76 76 90 97
t78 162 179 t64 182 I
B
100
115
90
86 93
85 80 90
86
A
inspeção visual dos dados sugere que o Grupo B tende a realizer tarefa num tempo inferior àquele observãdo puru o Grupo A. para auxiliar análise- inicial, podemos construir gráficos bàx_ptot puru'o, g*po, eco lado a lado conforme a figura u,"gui.. Podemos observar que' para os alunos considerados,
o novo
sisteffiê
facilidade de aprendizâdo , aqui pelo "urlut"rirado u.u u", qu o Uo*'_pioì;;;ô;;Ë Ëã
_:ï:ï:":1t_:r,::::",i1ior_ tempo de execüção de certa tarefa,
" sensivelmente mais baixo. Note que o valor da mediana do Grupo B é inferior ao do Grupo A, mas o intervalo enrre o primeiro. e rerceiro quaitil é pró;i;;;;;u o. dois grupos, .o. dando a idéia de que a variabilidade do tempo de aprendizaão é semerhante pare ambos os sistemas operacionais. E importante ressaltar que, para podermos concluir que o novo sistema é
de fato eficaz, precisamos
as conclusões anteriores para toda a r", r"ito, realizando
"*trupàlu, população de crianças com idade entre g e 12 anos. Isto pode o teste de hipóteses que será descrito em seguida u.rr"
"*"Àpr,"-
GruPos
para auxiliar na comparaçõo' [.)rrir's medidas descritivas podem ser calculadas
tr
motivação fornecida pelo exemplo anterior, poderrtot{ -';'ilã; geral. Suponitu .1,," desejamos comparar .düN 9 rru-:llaSôguais u um ò4v irasqrr sao" varrauvr.ò ;;ì;;'n*.,-"'ii"à'ra'cias ;ìPol)tllnçoes, iZ ,rrïr" u* g1g/elo :u]tts se comportam confc^*: u,,,r,,rs; admitir que estas duas populações .-^-Áõ a2l
utilizando
a
t :,*:
t ii:Ï."ï,::Ïiïffi, ;;; ;;. õ";;;; o*u
il .:Ïï;;-i'', ::.,ï,
ttrrr.ircterística de interesse'em
;:ìïi
^1:i1'j:i;
;, variáveis areatórias representando q:í,:: das populações. Segue,
"ádu lïJï:ï:ïuï" .àï"'."****"ã;
;":'"'' 9e;:'
.qotruilo,,
a3"'a'à11:
1''1'Íï::
âs, representando amostras areatóri r^ "), --^r-^^ ^*^stf0 populações. Deve ser noiado que os ramanhos de amostrit testar 'il 1 a't72 podem, eventualmente, ser iguais' Queremos iguais; -F1, : As médias populacionais são
ïlìï:}Jr""ïlï tiï, :ffi';:,fi':.i]uïïl'ou,
f/" : As médias populacionais não são iguais' listas hipóteses podem ser traduzidas em termo
s de pq
Ho : 11,1 --
1-tz',
H':
l.tz.
t-tt,
*
e
1t2:
300
9.2 Comparação de Duas Médias
Capítulo 9: Tópicos Especiais
Se a suspeita sobre a diferença entre as médias é de que a médiade uma população é maior (ou menor) do que a média da outra, podemos reescrever f/" como /-r1 > ttz (ou ltt < ttò e proceder ao teste unilateral.
como estamos interessados em determinar se a diferença
30t
Tu ' Tzr
-
N(Pt,100); l/(p2, 100).
Queremos testar
é
estatisticamente significante, podemos ainda reescrever as hipóteses em termos de .., l"O : Itt - F2, isto é,
H, : Tempo médio
é igual para ambos os sistemas
.F1, : Aprendizado do novo sistem a
Ho:P'p-Q;
H."rtto+í,
As hfnóteses podem ser
: *,
Ho:FtlFz,
D:X-Y. temos a--1 X.i - N(pr,o'), [.,: I,2,..., n1; Y.- N(1"r,of;\, i: L,2,..., n2.
Comas suposições feitas,
Pela independência dessas variáveis, D terâ distribuição Normal com E(D ) : po e quanto à variância, temos:
:
:
Var(X or"
Tt1
-
Y)
:
ou, equivalentemente,
I
HoiFo:FL-Fz:0; Ho:l-ID-ltt-ttz)0. A região críticaserá dada por RC : {d, €.IR : d > d,"} e o estimador de p,p ser6 dado por D :Tt -72, com 15
DT'',n :_1
^15
Var(X) + Var(y)
+ú:rr(!*1\ rL2 "\r,
necessá ria para obter essa variância, uma vez que a covariância entre as médias amostrais é zero. com estas informações, procedemos ao teste de hipóteses do modo usuar. caso não saibamos qual é a distrìbuição da característica nu podemos, foprruçao para'amostras de tamanho grande, lãnçar mão do Teorema Central do Limite e trabalhar, de modo aproximado, com a distribuição Normal.
são os conjuntos de variáveis
: 1,-15
e
'
Pela suposição de que os tempos seguem o -modelo Normal e, lembrando que as amostras são independentes, segue que a distribuição de D é Normal com média p,p e variãncia
var(D) a
:
: var(Tt) + var(72): #
*
# : # : 13,88.
Utilizamos agora o procedimento usual para testes de hipóteses, fixando 0,05 e encontrando um valor crítico d. tal que
Exemplo 9.5.' continuando o Exemplo 9.4, sejam Tr e Tz variáveis aleatórias representando os tempos de aprendi zado para os grupos A e B, respectivamente. Tendo em vista que nL: n2: 15, as amostras áu5. ,"rf""iío,
(TIJ,'.. ,4,rs) e
15
5- ?o, u .i-1
' ,,)'
Note que a independência entre as amostras foi
populações
é, emmédia, mais rápido.
formulad^ti,t:i
o que sugere trabalharmos com o estimador de p,p:
Var(D)
;
P(rejeitar
H"l
H"verdadeira)
:
P(D € RC
I
po:0)
aleatórias independentes
(Tz,!, ... ,T2Js). Além disso, assuma que informações adicionais fornecidas pelas empresas indicam que a variabilidade dos tempos de aprendizado é a mesma para ambos os sistemas operacionais e iguar o oi : 19 min. Logo, para i : I,2,...,15,
Consultando a tabela da distribuição Normal padrão, obtemos 2,,
d,:L,64x3,65:5,99. Então, R.C
:
{rJ e R l íí
> 5,99}.
:
L,64. Logo,
J02
Capítulo 9: Tópicos Especiais
considerando os valores amostrais observados, temos que a média para o grupo A ê L79,73 min e, para o grupo B, é de 89,86 min. Assim,
ã
ob,
:
179,73
-
89,86
:
operacional é menor.
X - N(px, N(py, o!,), com ox * oy.Então, "ï) "V N - N(p*,"ï/"r) e Y - N(tr",oï/rz)
- X -Y
o, então,
D
.
39,4 38,9 39,1 40,6 39,7 40,3
38,1 35,9
40,9 40,9
Região Oeste 35,4 35,7 37,7 36,9 37,4 37,5
4L,2 40,4 40,0 39,6 39,7 4L,2
36,4 36,6 36,1 38,0 36,8 36,4
:
Var(X) + Var(Y)
-
,, ok fl,1
+
o?, TL2
- N1tx - lry,oï1ry
vnriâncias conhecidas porém diferentes.
Ilxcntplo 9.6: uma empresa avaliadora de imóveis está estudando as
Algumas medidas resumo são apresentadas na próxima tabela: Medidas Descritivas
n Média Mediana Desvio-Padrão
Região
Central 20 40,2 40,3
0,7 38,9 4L,2
Oeste 18
36,7 36,7 0,9 34,9
38,0
Arnbas 38 38,5 39,0 1,9
34,9 4L,2
O comportamento dos dados pode ser visualizado através de gráficos tipo hox-plot, mostrados a seguir.
+ o!,1n2).A partir daqui, o teste prossegue n& lbrma usual. No próximo exemplo, ilustramos o procedimento apresentado, de regiõeo
cclrtral e oeste da cidade de São Paulo. o objetivo principal é verificar se o preço médio, praticado para imóveis comerciais de um dado tamanho, é o mesmó nâs duas áreas. De levantamentos anteriores, a empresa sabe que a área oestê apresenta uma heterogeneidade de preços imobiliários (em UpC- unidade padrão de construção) maior do que a região central, sendo os desvios padrões iguais a 0,82 uPc para a região oeste e 0,71 UPC para a região central. para verificar sc os preços médios são iguais ou nãon duas amostras, uma de tamanho 20 e outra de turnnnho 18 foram retiradas aleatoriamente de cada região. Os dados são og segu irr tcs:
39,6 39,2
37,2 34,9 37,4 36,1
Mínimo Máximo
eutilizando a independência entre X e 7, temos que
Var(D)
40,5 40,3
tr
consideramos, agora, a situação em que as populações apresentam médias desconhecidas e variâncias populacionais conhecidas, porém com valores diferentes. Nesse caso, já sabemos quê as2a{ru)a{oes são difeàntes, uma vez quo as variabilidades da característica de inty'ress" nui duu, populações são diferentes. Ainda assim, podemos estar interessad[s em verificar se as médias também são diferentes e utilizar a teoria de teste de hipóteses, para embasar estatisticamente a decisão a ser tomada. com as suposições e a notação já apresentada anteriormente, temos agora
ParaD
303
Região Central 4L,2 40,6
89,87.
como ãor, € RC,rejeitamos a hipótese nula, iy'to é, a um nível de significância de \vo concluímos que, para alunos .o- /idud" entre g e 12 anos sem conhecimento computacional prévio, o tempo d{ aprendizado com o novo sistema
que
9.2 Comparação de Duas Médias
E Capítulo 9: Tópicos Especiais
304
Note que o valor do desvio padrão amostral sugere, de fato, que as variâncias são diferentes nas duas regiões; mais ainda, a média de preço na região central parcce ser superior à da região oeste. Para os dados observados, a região central tem, aparentemente, preços superiores à região oeste. Além disso, a variabilidade observada nos imóveis da região ogste é maior, o que, de certa forma confirma a informação fornecida pela empfesa. Em resumo, para os dados apresentados nas duas amostras, temos um maiof preço médio (amostral) para a região central. Essas conclusões são válidas aflçnas para os valores amostrais observados. Para podermos extrapolar esta conc\rsão para as regiões como um todo, precisaremos ltilizar um procedimento esthtístico que controle os erros, eventualmente, cometidos. Representando a informação dos preços naYegião central pela variável aleatória X e, para a região oeste, pela variável aleatória Y, assumimos que os dados são obtidos de duas populações Normais de tal forma que
X
- N(px,ollzo) e Y -
Nosso principar
N(try,ol,1ts1.
in**'*
;:":ï":ïï:"'"' Ho: Fx * ttv. DefinindoD:X -Ttemos v ar(D) Logo, para
a
:
: v ar(X) + v ar(Y) : +. Y : 0,06.
0,05 vem:
RC
:p(2.+ouZ>41:0,05.
-
tt'y
:
/0,06
Da tabela da distribuição Normal padrão obtemos os valores críticos:
O)
305
: {d e R : d, < -0,49 ou d > 0,49}
Como em nosso caso ãu6*:40,2- 36,7:3,50 pertence à região crítica, concluímos que os imóveis situados nas regiões central e oeste têm preços médios diferentes, ao nível de significânciade 57o. El caso 3A: Amostras independentes com variâncias desconhecidas e iguais
No caso anterior vimos que informações adicionais podem fornecer o conhecimento dos valores das variâncias populacionais. Em gerâI, contudo, não temos informações a respeito do valor das variâncias, subsídios para
Entretanto, os processos que geram os dados podem nos levar a crer que, apesar de desconhecidas, as variâncias são iguais para as duas populações.
Exemplo 9.7: Digitadores são treinados em uma empresa em duas turmas distintas. Na pri'neira, denominada Turma J, utiliza-se um método japonês de ensino, ao passo que na segunda turma, denominada Turma A, utiliza-se um método alemão. Deseja-se comparar os dois métodos e para tanto, 16 alunos de cada turma foram escolhidos aleatoriamente e uma mesma tarefa foi atribuída a cada um. Ao final do experimento, o tempo gasto na realização da tarefa, pam cada aluno, foi anotado. No processo, dois computadores utilizados pelos alunos selecionados da turma J e três da turma A apresentaram problemas que impediram a realização da tarefa; o tamanho da amostra foi assim reduzido para 14 e 18, respectivamente, para as turmas J e A. Os dados obtidos foram:
Turma
P(rejeitar H" I H,verdadeira) = P(D e RC I pt
/0,06
9.2 Comparação de Duas Médias
J
A
Tempos (min)
10139 15 L2
18
10 L4 13 10 15 16 15 L7 L7 15
L2 16
109
1013L4
17 11 77
L4
Apesar de não conhecidas, as variâncias populacionais para as duas turmas são consideradas iguais com base em estudos anteriores. tr Para formalizar a situação apresentada, supomos que os dados para o primeiro grupo são representados por variáveis aleatórias independentes Xt, . . . , Xr,,rê, para o segundo, Yt, .. . ,Yrr. Alémdisso, assumimos que
- N(px, o2), i : I,...,flri Yi - N(pv,o2), j : 1,...,p2. Xt
Consequentemente,
Calítulo 9: Tópícos Especiais
306
Para ambas as populações, temos a mesma variância o2 (desconhecida). Suponha que nosso interesse é testar
HoiFX:lJyi Hu: Fx * t"v. Novamente, consideramôs o estimador
D definido pela difeíençaX
independência entre as amostras, segue imediatamente
-Y.
l6e
Além disso, considerando também a normalidade do, ludor, segue que
D
-
N(p,x
-
f/,,
a: P(rejeitar Ho I Il,verdadeira) :P(7 1-t"ouT>t"lH"). A
quantidade ú" é então obtida da tabela da distribuição ú-Student, com nt I nz - 2 graus de liberdade. A região crítica para o teste é dada por
RC
"'/(
o
1/Lln1* If n2
e m. : t
1-
t" ou t > t"}.
Uma vez obtidas as amostras, substituindo as estimativas de D e S" na expresSãO ?, obtemos o valor úo6". Rejeitamos f/o se úo6" pertencer à região crítica.
Exemplo 9.8: Para o Exemplo 9.7, podemos escrever as hipóteses de interesse
py,o21t1n1+ rln2)).
D-(pt-pv)
:{t
de
como
e consequentemente,
:
307
distribuição t-Student com nr * nz - 2 graus de liberdade Dada a hipótese alternativa apresentada, procedemos ao teste bilateral dn forma usual, isto é, fixado a encontra-se o valor ú, tal que tem, sob
Dada a
/1 1\ ,/ Var(D\:o2I:-+:-lr/ ' \nt
9.2 Comparação de Duas Médias
Ho i Fx: py (os dois métodos são equivalentes);
^' Arln
Ho: Px
1\
*
l.tv,
p,y e púy representando, respectivamente, o tempo médio populacional pafn alunos da turma J e da turma Á. As amostras forneceram os seguintes valOres: Çom
Como a variância populacional o2 é desconhecida, precisará ser estimada. Tendo em vista que S| e ,5| são ambos estimadores não viciados dessa variância, usaremos como estimativa para o2 umacombinação deles, dada por: 'nl
;-1 ,J-
e
sl"u": 4,L;
:15,38
e
szy"u"
L3,Tot
"
:
4,3
'
Então,
L
nL+n2-2 Note que S! é :uma média ponderada entre 5| e,Sfl, com ponderação dada por nt-I c nz- 1. Dessa forma, estaremos utilizando para estimar o2, toda a informação disponível nas duas amostras. Além disso, pode-se mostrar que ,9"2 É não viciado para o2. Da mesma forma que na Seção 8.3 do Capítulo 8, o uso do estimador ,9ul nos leva a trabalhar com a distribuição ú-Student, isto é,
T_ D-(pr-pv) s"\ÃFTTTM
l4,Totts:11157
n2
Díx.u-N)'+DVi-T)'
:-1
nt: n2 : ãot," -2 5,',0"
:Íolts -Tot,r:
LIr57
:6(rr-Dtï*"*(n,
-
15,38
: -3,81
;
-t)tï*" _ L3 x 4,I +_L2 x 4,3 : 25
4.2
Como a hipótese alternativa apresentada é bilateral, a região crítica tem íbrma RC : {t e m :t 1. -t" ou t) Í"}.Logo, parao-:0,01temos 0,01
: P(rejeitar Ho I H"verdadeira) :P(7 1-t.ou T>t"lH").
l)a tabela da distribuição ú-Student com 25 graus de liberdade, 1,,,
:
a
2,79. Conseqüentemente,
obtemos
,tr-tÊ. .ï08
Ct plt
tt I
o g:
7'ó pi
uts Esltet:itt ltt
RC: {te m.:t1_2,7g out}2,Tg}.
a.2 Ctttttpuruç{lo de Duets Mérlilt,r
:'{ 30e)
Tabela 9.1: Comparação de médias para duas populagões,
Utilizando as estimativas calculadas temos, sob I1o, .
-:
dult"
í
-3,81
t?*"(rlu + Tlnz)
\/4,2(rlL4 + 1/13) I
:
_4,93;
I
que pertence à região crítica e, assim, concluímos que os métodos de fato diferem,
a um nível de
Caso
significânciade
LVo.
tr
38: Amostras independentes com variâncias desçÁnhecidas
/
o
e
diferentes
teste para o caso em que as variâncias variâncias são/esconhecidas sã?désconhecidas e desiguais é em maiores detalhes, consideramos as mesmas hipóteses apresentadar apresentadas "nfru. no\ no\cu.o 3A, só qu", ugoru, 4 quantidade a ser usada para o teste será
teoricamente mais envolvente. Assim, sem
r:
,\
D-(t"x-ttv)
í sk/", + sl,ln2
A exemplo do caso anterior, ú também tem distribuição ú-student, mas os graus de liberdade z são corrigidos pela expressão
(s'"1"t
A seqüência do teste é similar àquela apresentada nos casos anteriores. Na Tabela 9.1 mostramos um resumo dos testes considerados nesta seção. Encerramos esta seção, considerando a situação em que a característica de interesse não se comporta segundo um modelo Normal. Novìmente, a alternativa
será coletar uma amostra de tamanho grande o suficiente, a fim de utilizar o Teorema Central do Limite e obter distribuições amostrais aproximadamente Normais. como um exemplo desse procedimento, vamos desenvolver o teste para
n igualdade de duas proporções. 'j
Exemplo 9.9.' Num estudo sobre doenças infantis, desejamos investigar se a incidência de casos de contaminação por vermes é afetada pela idade. Dois grupos de crianças, um com idades de 2 a 4 anos (Grupo I) e outro, com idades de 7 a 9 anos (Grupo II) foram escolhidos para serem examinados quanto iì ocorrência de vermes. Os dados são apresentados a seguir:
-!-F
3t0
Cttpítu\o g:'l'ópit
Grupo
I II
Amostra 720 260
tts
l!,rpeciuis
Proporção comVerãJnõG 0,095 0,103
Srrlrstituindo os valores de p1 e Pz Porfl,na exptessão da V ar(f1
podemos rearizar ;
verificar
característica em duas popurações.
Ã;jJ,r,ïnot"r". /
"nuàtu.noo
tr o .o-ponlmento de uma certa
se a amostra for suficientemente grande sabemos, pelo Teorema central do Limite, que a distribuição de probabilidade da proporção amostral
tem um comportamento aproxim qbamente igual ao modelo Normal. Na comparação de proiorções á;;r/d;Ës, usaremos como estimador a diferença enrre as respectivas "n., propgíções u,norr.uir. ìvão ã oiïr"ìï verificar que ela será um estimadoinao viesaoo 4Jr*""* diferença entre as proporções populacionais.
\
população, teremos d'as proporções amostrais independentes e a diferença entre elas também terá distribuiçãó aproximadamente
Normal. Assim, se o interesse é
testar:
: Ih versus Ho i pt # h, então o estimador a ser utilizado será fr, - fr, cuja distribuição será aproximada pela Normal cujos parâmetros Ho : pt
são
Pt
F,,(L
- fr) :
-
nQ
- or) * m(L - m)
TL1
RC
Ho: pt
Yp--nrTíz' ^ -ntfr.+n2fr,
N(0,1).
e
IR
l, 1 r", ou z > z"r}.
-
p2 versus Ho: Pt # Pz,
com p1 e p2 representando as proporções de crianças com verminosg nn população dos grupos I e I I, respectivamente. Pelas informações recebidns, rt4
-
:
:0,085 e frob" :0,103' Logo, sob 'FIo nt itot," * Trz ?2ot'" 120 x 0,085 +260 x 0,103 : rltobs:: 120 +260 n1 I n2
I20, nz
260, fior,,
ç,097;
e também,
Fnr,"(L
-\r,",,,)(Llu
* rlnz): 0,097 x 0,903 x (LlL20 + L1260) :0,0011'
Segue então que
p, isto é pr : p2: p, foO"*os obter um "rir*uããr"r'não
-
Iìxemplo 9.10: Parao Exemplo 9.9, testaremos
D2
viciad.,
-F)Gln, + Iln2)
:{z
.
a a independência entre as amostras garantiu a independência entre ft fr^variância, e, portanto, a covariância entre eres se anulou. " nula Sendo a hipótese verdadeira, as proporções populacionais são iguais.
Denotando seu valor comum por
-Pz
l)aclo um nível de significância a, os valores zct e zc2 são obtidos da tabela dt tlistribuição Normal padrão. Como procedimento alternativo, podemos também usáÌr o nível descritivo para decidir sobre a aceitaçáo ou não de Ho.
Note que, para calcular
estimador para p através da ponderação dos Dessa forma, obtemos
podemos
clso bilateral é dada por
obtiioì, considerando-r" u, relações:
Var(f1) +var(f2)
fr),
l)irrir concluir o teste, calculamos a quantidadê zotts, substituindo bt e Íi por suas crrrrespondentes estimativas. Verificamos se zobs peftence à região crítica, que nO
E(6r-fr):pt-pz; Var(fi
-
cscrever, sob fIo,
Para saber se as duas faixas etárias acima têm o mesmo comportamento, quanto a incidência dessa doença,
proporções. Considere que desejamos '
.1u
t).2 (:(,tnpurilçtlo de Duen Médhts
Pt-Pz
ã ; ,:
Para
a:
-
t/(0,1).
0,08 os valores zct e zc2 são calculados através das expressões
P((it -DlJo,o}Lt 1 z.,lH,) :0,04; P(
(6t
- D I Jo,ooLL )
z",l Ho) :
o,o4
.
Jt2
Capítulo 9: Tópicos Especiais
Assim,
RC
:{z
eRIz
Fazendo os cálculos, temos
<
-I,75 ou z } I,TS}.
\ue 2o6": -0,54g não pertence à RC.
Logo,
3. Para verificar se duas populações têm a mesmamédia, amostras independentes foram retiradas. Sabendo que a população I é Normal (pt,25) e a população II Normal (pz,4o), que conclusão pode ser tirada, ao nível 2vo? os valores obtidos foram:
aceitamos a igualdade das proporções, ao níver gvo que a incidênóia " "on"lrímos de verminose nas duas faixas etárias pode ser considerâ{a a mesma.
População
r II
tr
Exercícios da Seção 9.2:
l.
Para se avaliar o nível de tensão ocasionada por xamésI escolares, doze alunos foram escolhidos e sua pulsação medida antes e pois do exame. Instante
76 B0 82 83 84 79 88 75 81 74 Faça um teste, com nível de significânci a de
l7o, para verificai se existe maior tensão (isto é, maior pulsação) antes da realização dos exames. Indique as
suposições necessárias.
2. Sabe-se que o tempo necessário para percorrer uma determinada rota no final da tarde pode ser estudado por um modero Normal com desvio padrão de 17 min. Foram instalados sensores para controlar o tempo de âbertura dos semáforos presentes na rota e deseja-se verificar ." ó t"rrrpo gasto para completar o percurso diminuiu. Estudos anteriores indicam que o tempo ãeve continuar se comportando segundo um modelo Normal, com mesmo desvio padrão. com os sensores desativados, 11 veículos de mesmo ano e marca, denominado Grupo controle, tiveram o tempo gasto no percurso anotado. Em seguida, os sensores foram ativados e outros 13 veículos (Grupo Teste) pcrcorreram a mesma rota. os tempos observados, em minutos, foram os
Dados
12L4 1514 131714 13 1317L4 131617 1816
X
e Y seguem a distribuição Normal com mesma variância, se, também, têm a mesma média. Doze observações de cada Deseja-se testar variável foram escolhidas e os resultados foram os seguintes:
4. As variáveis
Est
10 11 t2 76 79 77 78 73 76 71
313
9.2 Comparação de Duas Médias
12
12
12
tq:
48,
'i:L
12
Dr?: DAr:56, i:L
i:L
4.900
,DY?:
5.650.
à:L
Qual é a conclusão ao nível de significância de 5To?
5. Para comparar as médias de duas poputações Normais, amostras aleatórias foram obtidas. Sabe-se que as variâncias populacionais são diferentes,
$endO
seus valores desconhecidos.
Amostra I Amostra II O que pode ser dito
7 93 8 11 5 9 27 5 15 9 16 8
a respeito das médias das populações, com
a:
0,05?
6. Dois medicamentos para tratamento de infecções bucais estão sendo estudados e o melhor desempenho é definido pela rapidez em eliminar a infecção. Pacientes escolhidos ao acaso receberam um dos medicamentos e tiveram a sua cura classificada em rápida ou não. Deseja-se testar, ao nível 107o, se os medicamentos são equivalentes. Os dados obtidos são apresentados a seguir,
seguintes:
Grupo Controle Teste
38 26 17 31
T
utilizados no
Medicamento A Medicamento B
urso
16 26 38 32 45 49 32 50 2L 20 51 10 22 18 35
Amostra
Pacientes com cura râpida
50 100
32 48
29
Indique se o uso dos sensores contribui para diminuir o tempo médio de percurso utilizando o nível descritivo do teste.
Qual seria sua conclusão? Indique as hipóteses do teste e necessárias.
as suposiçõcs
Capítulo 9: Tópicos Especiais
314
Os testes de hipóteses considerados até aqui envolveram, como parâmetros de interesse, amédia ou a proporção populacionais. Na seção anterior, vimos que, para desenvolver os testes de comparação,de médias, é importante considerar o que ocorre com a variância populacionâ'1. Nesta seção, estamos interessados em estudar a dispersão dos valores em ur\a ou mais populações, através de suas variâncias. Para isso, apresentamos alguns festes envolvendo essas quantidades. Iniciamos com o caso de uma única populay'ão, conforme motivado pelo exemplo a seguir. ì
Exemplo 9./f.' Sabe-se que em uma região doTfaís a altura média é de 1,68 m, com variância 0,30 m2. Um pesquisador acred{a que a alimentação rotineira em uma cidade litorânea, sendo diferente da região òoqno um todo, contribui para que as pessoas apresentem alturas mais homogêneas, apesar de não alterar a altura média da população da cidade. Para verificar sua suspeita, ele coletou uma amostra de 31- pessoas e obteve como estimativa para a variância o valor s?t":0,25fif . Neste caso, o pesquisador deve realizar um teste de hipóteses relacionado à variância populacional para tirar suas conclusões. tr Considere as hipóteses nula e alternativa, dadas por:
Ho:o2:o2"1
I
o!
@u
o' > oZ ot o2 < of;y.
Aqui, o2 representa'a variância populacional em que estamos interessados e of; é um valor numérico particular para o parâmetro. Para testar a hipótese I/r, obtemos uma amostra de tamanho n da população e consideramos a quantidade
rf
@-r)s2 02'
que envolve 52, a variância amostral. Se a população da qual a amostra foi retirada se comporta de acordo como um modelo Normal, então, sob a hipótese .F/,,
temos que
315
O estimador 52 é utilizado no teste pois, como visto anteriormente, é um V, construímos o teste, cuja
9.3 Testes para Variância
Ho, : o2
9.3 Testes para Variância
estimador não viciado para o2. Baseando-se em região cútica, para o teste bilateral, terâ a forma
RC
:{u
e IR. I o 1 r", ouu > u"r},
com uí.r e u", determinados a partir da distribuição Qui-quadrado com n - L graus de liberdade e nível de significância a. O procedimento ó ilustrado no próximo exemplo.
Exemplo 9.72: Para o Exemplo 9.11, as hipóteses de interesse são
Ho : o2: 0,30
;
Hn,: o2 < 0,30 Temos que, sob
Ho, r-2: 0,30 . Logo,
.aobs:
(n
- r)s\,,"-: 3ol a.
O
que pode ser concluído
a
Sítio B (n
:23)
L2,2L
0,L24
0,184
respeito das variâncias?
E
das
médias
;
temos Que .fol., € RC e, portanto, concluímos que os panetones classificados cotto de segunda qualidade apresentam pesos com maior variabilidade do que os panetones de primeira qualidade. tr
Supondo
Média(cm) (cm2)
Variância
(n:
L5,L2
populacionais?
f
l.
I\Vo.
Para comparar o. grau de diversidade de duas populações primitivas, uma medida antropométrica foi obtida em fósseis coletados em sítios arqueológicos, fornecendo a tabela a seguir.
e a região crítica será da forma
Sob a hipótese nula, .F - F(25,19), e para distribuição Fisher-Snedecor, f. : 0,495.
A
3. Uma panificadora produz determinado tipo de pão, cujo peso médio é de 190 g,ramas, com desvio padrão de 18 gramas. Devido a mudanças na política _-4ambral, que ocasionou aumento no preço do trigo, alguns ingredientes da receita foram substituídos. Uma equipe do governo resolveu verificar se a variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 unidades, medindo o peso de cada uma. O peso médio obtido da amostra foi de 102 gramas e o desvio padrão foi de 24,5 gramas. Qual a conclusão para
f' deve considerar
a escolha darazão de variâncias nas hipóteses, no caso com as quantidades relacionadas a X no numerador, isto é,
321
encontre
r"
tal que:
r,,) :0,05 com a : 18, b : 3. r,.) - 0,05 com a : 3,ó : 18. r,,) :0,05 com a : 180, b : I92.
r,') :0,95
r,,) :0,95
com a,:5,b : 12. com a : 30, b:40.
2. Umr linha de montagem produz peças cujos pesos, em gramas, obedecem ao modelo Normal com variância30 g2. os equipamentos foram modernizados e, pnrn verificar se o processo continua sob controle, foi tomada uma amostra de
9.4 LnáÃise de Variância Consideramos nesta seção o caso de comparação de três ou mais populações, definidas por uma variável qualitativa (fator) através de testes com as correspondentes médias. Não abordaremos a situação com dois ou mais fatores neste texto e o leitor interessado poderá consultar as referências mencionadas na bibliografia. Iniciamos com o caso em que as amostras de cada população têm o mesmo tamanho.
Exemplo 9.16: A gerência de um depósito que armazena cargas aéreas de pequeno porte está estudando o peso das cargas que chegam ao seu terminal no interior de São Paulo. Usualmente, o terminal recebe 4 tipos de cargas: doméstica (D), administrativa (A), equipamentos industriais (E) e outros tipos (O). Deseja'se verificar se, em média, existem diferenças entre os pesos dos 4 tipos de cargas, Ao longo de 1 mês, cargas foram colhidas aleatoriamente e seus pesos foram aferidos, fornecendo os dados (em kg):
322
--. Capítulo 9: Tópicos Especiais
Tipo de Carga A E
D 24,,9
20,4 24,2 22,3 20,3 24,0 23,5
27,9 28,7
38,4 38,6 4L,2
25,3 29,3 28,5 27,9
43,9 40,2 40,2
28,4
37,3
Medidas Descritivas Média Mediana
seguir.
23,8 25,3 23,5 27,6 25,5 23,9 22,6
Ho:Ft:P2:"':l-LN; Ho : pelo menos uma das médias
D
A 27,9 28,L
Desvio-Padrão
23,5 1,9
Mínimo Máximo
20,3 24,9
Para tanto, obtemos
é dlferente das demais.
amostras independentes, com rn indivíduos em cada uma
delas. Nesta situação, o modelo estatístico para aj-ésima unidade experimental, da i-ésima população é dado por
o 40,L 40,2
r,2
t,
25,3 29,3
37,37 43,9
Caso a hipótese Hoseja verdadeira, teremos que todas as médias para as K populações serão iguais a um valor comum p. O modelo pode, então, ser escrito como
24,6 23,9
Modelo
1,6
22,6 27,6
os valores descritivos também sugerem que cargas do grupo E tendem a tcr maior peso. Note que o menor peso observado para esse tipo de carga é, maior quc os máximos observados para todos os outros tipos. Após acargado tipo E, as cilrgas do tipo A parecem ter, em média, maior peso. A carga de tipo D apresenta, crn média, o menor peso. salientamos que os desvios padrões amostrais cncontram-se razoavelmente próximos uns dos outros. tr
Para estudarmos a situação apresentada no exemplo anterior, um modelo estatístico, em que cada observação y pode ser clccomposta em duas componentes: sistemdtica e aleatória, esta última consideramos
rcpresentando variações individuais e todos os fatores que não são explicados pela parte sistemática. Matematicamente, podemos escrever
O:fii : tt -l eïi,
'i
:
L,
... , K;
i:
L,
...
,n1,.
Uma forma de levar em conta a informação não explicada pela formn sistemática é através das somas de quadrado
K
f:p,*e.
K
p.a
\
Tipo de Carga
,,R
323
Assim, se Y representa a observação associada a uma unidade experimental, a parte sistemâtica p, pode ser vista como a média populacional, que é fixa, e a parte aleatíria e como a informação referente a outros fatores que podem influir nas observações mas não são incorporadas em p. Suponha que estamos interessados em comparar as médias de K populações, isto é, queremos testar
o
Estamos interessados em comparar os quatro grupos com diferentes tipos de ciìrga. Descritivamente, observamos que os pesos de cargas do tipo E apresentam os maiores valores dentre os quatro grupos. Algumas mqdidas descritivas para os dados estão apresentadas na tabela a
9.4 Análise de Variância
Krn
:!!(ui tLò2 " II,4)' DL"?,: Dltujj:L i:r j:l i:L j:t i:t j:l rrt
Krn
I(
'i:L
nt
-
ò2.
Essas expressões envolvem as quantidades desconhecidas [Li,'i - 1,...,1( e p,, Utilizaremos os dados para obter as estimativas correspondentes. Levando-se em
conta que, no Modelo 1, estamos supondo diferentes médias para as
K
populações, consideramos os dados oriundos de cada uma dessas populações para estimar a correspondente média. Assim, segundo o Modelo 1 temos
LrU, -yr, i : r,...,K. L: mfi
fr, '
Para o Modelo 0, como assumimos que todas as populações têm a mesma méclia, utilizamos o estimador
T Capítulo 9: Tópicos Especiais
324
p-
#,pin,:o
Substituindo as estimativas acima nas correspondentes somas de quadrados apresentadas anteriormente, definimos as quantidades soma de quadrados dentro (SQD) e soma de quadrados total (SQT), da seguinte forma:
Knì
SQT :
KmI(
- i,n)' : ti,:t Dru, -Yn)' : t D",3 - *\1 \\(ut j:t i.:1 j:r i.:t i:t i:t K,M
SQD:
Krn
- ì)' :! !(ri fi.:t !(u: j:L i:L j:l
K
;
nì.
- 7)= D,Dv,i - mKTz i:t j:r
325
9.4 Anólise de Variância
Note que, nesse caso, é preciso calcular as três quantidades anteriores pois QMT não é igual à soma de QMD com QME. O teste estatístico pataa hipótese.I/o envolve os quadrados médios. Se a hipótese Ho náo for verdadeira, então, o Modelo 1 deve ser mais adequado aos dados do que o Modelo 0. Em outras palavras, os resíduos produzidos pelo Modelo 1 serão menores que os do Modelo 0. Analisando sob este ângulo, podemos interpretar QME como sendo, em termos quantitativos, a informação contida nos dados que ó captada pelo Modelo 1, enquanto que o QMD represento
a informação não explicada pelo Modelo 1. Portanto, se QME for grande comparado à QMD, a parte sistemática do Modelo 1 estará captando grande parte da informação dos dados e a hipótese Ho deverâ ser rejeitada. Definimos, então, a quantidade H-_
É importante ressaltar que as expressões resultantes fornecem uma maneira mais conveniente de se calcular, via computador ou manualmente, cada uma dessas somas de quadrados.
A
diferença entre SQT e SQD representa a somo de quadrados entre e será denotada por SQE, isto é,
SQE:
SQT
_
Quanto maior for o valor de -F, maior será QME comparado a QMD e, assim, maiores as evidências contra Ho.Para caracterizarmos o valor crítico a partir do qual rejeitamos Ho, precisamos encontrar a distribuição de probabilidade para F, Supondo as seguintes condições:
SQD.
. Yi
sáo variáveis aleatórias independentes; . Todas as K populações têm variâncias iguais a o2;
Das expressões para a soma de quadrados total e de dentro, segue que:
seE
I{
I{
à:t
i.:t
: *ltZu -Y)' : ^(DY? - NY').
Cada uma das somas de quadrados envolve um certo número do quantidades que estão sendo estimadas. Por exemplo, SQT contém 7 e SQD contém Yi,i:1,...,1(. Levando este fato em considera!ão e o número dê observações nas amostras, definimos os correspondentes quadrados médios:
'Yj -
SOE
QME: È,
quadrado médio entre.
N(Po,o2),'i
: L,..., K e j : !,.'.,m,
pode ser mostrado que
F-F(K-L,K(m-I)) isto é, a quantidade I' tem distribuição de Fisher-Snedecor com K - 1 e 1-) graus de liberdade. Temos, agora, condições de encontrar o valor
K(* crítico
/,
e determinar a região críticado teste, que será da forma
RC:{/ere*:f>fl}.
SQT
QMT: Km-I : quadrado médio total; SQD QMD: Km- K : =j.g\:quadrado h\m- r)
QME
'-eMD
médio denrro;
Das três suposições feitas, a mais impdrtante é a segunda , V ar(f;i) : o2 , para'i: L,...,K e j:1,...,Tn) que tem o nome técnico de homocedasticidade' A suposição de normalidade é importante em termos teóricos, mas, muitas vezes,
for válidn, principalmente, se as amostras forem grandes. Nesses casos, o Teorema Central do Limite pode ser utilizado para justificar o uso da distribuição de FisherSnedecor. Caso a suposiçâto de hornocedasticidade não seja verdadeira, técnicas na prática,
o
teste pode ainda ser utilizado quando ela não
E J26
Capítulo 9: Tópicos Especials
alternativas podem ser utilizadas. Algumas delas envolvem aplicar urna
transformação logarítmica ou quadrática aos dados. Esse assunto envolve técnicat
mais avançadas e não será abordado nesse livro. A discussão sobre o comportamento dos erros e das somas de quadrados é resumida na Tabela 9.2 a seguir.
i27
9.4 Aruilise de Variância
Exemplo 9.77: Para os dados apresentados no Exemplo 9.16, temos K : 4 grupos e nt:7 observações por grupo. Além disso, obtemos Yt:22rïi Tz:27,9; Ts:40,L e Ta:24,6. A média geral é Y:28,9' Cálculos intermediários podem ser, facilmente, feitos em uma planilha eletrônica ou calculadora fornecendo:
474
Tabela 9.2: Tabela de Análise de Variância (ANOVA).
ti:I tj:r
Yli
:
24.672,42
" DT?: i:L
3.b13,80.
Usando as fórmulas de cálculo apresentadas anteriormente, obtemos
sQD
A
tabela ANovA fornece como subproduto um estimador para a variância populacional o2, baseado na suposiçãã de homocedasticidade. Nessg
Ktnl(
:
- *:Dfi DLUS i.:t i:r j:L K
sQE: *(DT? i:l
caso, a variância amostral para o z-ésimo grupo,
It
SQT:
s?:J.Ë(Y1-To7z, " rn-If, pode ser usada para construir um estimador da variância populacional. Isto é feito
combinandoessesvaloresatravésdamédiaponderadaa"if,...,S?, (m - r)sÏ+ "' + (rn - t)sfu D D&i ""-@:__Nç*_g.
v-o)'
"z
para
s! é a mesma que encontramos
para eMD.Note ainda
que a expressão de QMT também é um estimador para o2,uma vez que
QMT: Km-I =rtQt ' ou
S S-rrr" -Y\2 ') --r'q2 Km-ILí?r''"
seja, QMT nada mais é do que a variância amostral s2 para uma amostrê corïposta pelo conjunto de todas ai observações dos K grupos combinados,
24.672,42
-
7
x 3.513,80
:
75,82;
x (3.513,80-4 x 28,86') =r.275,4U
In
D,DU\-*KYz i:r j:l
:24.672,42-T x 4x 28,862:1.351,23.
Uma vez calculadas duas das somas de quadrados acima, obtemos, sem dificuldade, a terceira. A tabela ANOVA é apresentada a seguir. de Graus de Variação Liberdade
Fonte
Knt
A expressão obtida
- KY'):7
:
Entre
3
Dentro
24
Total
27
Soma de Quadrados
L.275,4L
Quadrado Médio
lgy :
75,82 ff
452,,L4
F
W:
L94,54
:3,,L6
1.351,23
3 e 24 graus de :\Vo, Logo, como calculamos obtemos liberdade e, considerando a "f":3,009. .f,,t,":L34r54 > /,, concluímos que, ao nível de significância de 5Vo, as médias Através da distribuição de Fisher-Snedecor, com
de peso dos grupos são diferentes, confirmando as observações descritivas feitas tr rnteriormente.
-"tt 329
328
9.4 AnáIise de Variância
Grupos de tamanhos diferentes
Exemplo 9.18: O volume de vendas, no ramo de vestuário, tem se mantido estóVOl de ano para ano, mas açredita-se que sofra mudança de um quadrimestre pere outro, dintro de um mesmo ano. Através de uma metodologia adequada, fOl criado um índice que reflete a quantidade vendida. Em cada um dos quadrimestre8 do ano, foram escolhidas aleatoriamente algumas empresas de mesmo porte e $ÇUS índices de venda foram calculados (ver abaixo)'
No desenvolvimento anterior, supomos que os 1( grupos têm todos o mesmo tamanho. Podemos considerar uma situação mais geral em que isto não acontece. Vamos denotar pot na o número de elementos do grupo e. Neste caso, o total de indivíduos nos K grupos será igual a
n:nL*...1nx. Todos os resultados anteriores permanecem válidos, mas modificações algé ncas são necessárias nas expressões que agora serão escritas da seguinte forma:
seD: SQE
:
Kni
It(0,,, i:t j:r
ro)r:
tt
i:t j:L
ufi -1";Y'z1; i.:L
K
D"n(To i':L
-
i:r Kn;
Kni
sQr
RUI<
: !!(ui -v), : I D,ul -,Y'. i:t j:r à:t j:l
v::tDu" .I(ni
i:l .i:7
o,: *,,\yi, i:r,...,K. A Tabela de Análise de Variância sofre poucas modificações, sendo dada por
de Graus de Variação Liberdade
Fonte
Quadrado Médio
Entre
K_T
SQE
Dentro
n- K
QME
SQD
QMD
- I
SQT
Total comF
Soma de Quadrados
n
- F(K -I,n- K).
119,1 L54,2 745,5 r!3,7 L54,7 168,8 108,9 125,9 L4L,5 96,7 119,5 1.4r,2 87,6 155,7 189,6 L32,4 213,9 178,4 L56,2 208,6 159,0
Note que, nesse caso, as médias geral e dos grupos são dadas por:
'o
Quadl Quad2 Quada3 114,7 L44,7 153,1 L44,7 173,4 L92,5
F QME/QMD
O comportamento das vendas pode ser visualizado na próxima figura'
.tJ0
Capítulo 9: Tópicos Especiais
uma rápida avaliação dos box-prol mostra o primeiro quadrimestre com Os outros dois quadrimesrres apresenram vaÌores u,,, Oou"o iï,T:ï::::índices. mais próximos. O modelo de análise.. de variância pode ser aplicado para cat a significância estatística_das diferenças obs"ruaà^ a#; oì.;"". i, temos ,-, : Faz"d; Lr, --8.,:r: L0 e ns
-g. obtemos 1.14,7.; LS',T; % : ios,s"r;;[;ì;r;;tï; ;ï:;í;,;':"üï : os dados H_^It .Y?: disponíveis e a ajuda de uma planilhalletrônica
331
9.4 Análise de Variância
Exercícios da Seção 9.4:
1. Três diferentes bancos possuem agências de mesmo porte em uma avenida movimentada de Salvador, BA. Para testar se essas agências têm movimento médio equivalente, foi escolhida uma semana típica de trabalho e o desempenho, nesses dias, foi registrado. Os dados obtidos, em milhares de reais, óstão apresentados na tabela a seguir:
obtemos
Banco
3n;
J
fi:r f
j__l
Y7:6tT.B5e,6B
e
LruV; i:L
2
:604.207,68.
L94,3 r73,7 r99,2 227,2 246,5 146,4
Ilntiro,
sQD
:
3n;3
DDul -D"'Y?: L:L .:J:L
sQE:
617'35e'6I
'i:7
- 604.207,68 :
13.332,00;
I(
D"rY? i:l
- rY' :604.207,68-27 x 747,9J2 :
rJ.844,90;
c, com relação à variação total,
SQT
:
13.392,00
+
18.844,90 :26.676,90
Graus de
Variação
Liberdade
Entre Dentro
Total
2
24 26
13.332,00
98,4 263,7
111,8 275,0
Quadrado Médio 13.s44,90 2
13.332,00 24
57o?
pela pessoa responsável na família. Os questionários foram devidamente codificados, a fim de fornecer um índice de satisfação que varia
. preenchido
.
de 1 a 5 (totalmente satisfeito). Os resultados estão apresentados a seguir. Qual
trffi : r2,0L
a
:
0,05?
Classe
A
2,7 4,3 3,4 2,9 4,5
555,50
26.676,90
c) teste l'ornece o valor r1b": L2,01 que deve ser comparado com o varor crÍtico obtido de uma distribuição Fisher-snedecor com 2 e 24 graus de Iiberdade, Considerarrdo cv: 5Vo,.^obtemos 8,40J. Tendo .f..uï.io gue í,r,, ) ír, corrcluímos que existe diferença "rn nas médias de venda dos
:
265,6
F
:6.672,45
:
a
L27,,4
2. Uma agência de empregos deseja verificar o grau de satisfação de seus clientes. Para tanto, escolheu aleatoriamente domicflios de famílias de bairros classe A, B e C, que fizeram uso da agência e solicitou que um questionário fosse
seria sua conclusão, considerando
Soma de Quadrados
73.344,90
203,,4 289,8
Qual seria a sua conclusão ao nível
Com esses valores calculados, construímos a tabela ANOVA: liÌrnte de
179,,5
quadrimestres. tr
3.
C
B
3,7 4,6 4,7 3,5
4,0 4,r 2,3 4,2 2,5 3,5 2,5 4,2
1,5 L,7 2,7
2,8 3,1
2,4
2r5
3,8
A fim de verificar o efeito
de quatro tipos de propaganda de uma determinada
marca de goma de mascar, crianças foram atribuídas aleatoriamente a cada uma de 4 salas que mostravam desenhos animados, com intervalos regulares em que as correspondentes propagandas eram inseridas. Após a sessão, as
-".il .t.12
Capítulo 9: Tópicos Especiais
crianças foram entrevistadas por psicólogos, que atribuíram um índice de assimilação a cada criança. Quanto maior índi"", maior seria a lembrança "s" do produto. Os dados são apresentados a seguir. Tipo de Propaganda
IIm
1572222 7 6 21 16 B 11 16 6 7 23 15 7 16 19 10 6 2022 10 B 11 5 6 18 18 1315 11 5 8 2122 B 8 13
D"7
rco
4.876
L.465
9.5 Regressão Linear Simples
333
Observando a tabela de dados, notamos que, de fato, à medida que aumenta a concentração da substância, ocorre um aumento no ganho de peso. Conforme apresentado no Capítulo 5, o coeficiente de correlação linear entre a concentração X e o ganho de peso Y é calctlado por: n
11
px,l, :
18 11
DrnAo -
I.-
\/v | r-' E4
10
rì,VobrUobs
i,-l
- n"',,ll1rl - naZu,f
19
785,55-15x2,70x16,14 /(163,39 - 1b x 2,702)(4.2J9,4J - 15 x r6,t42)
2.444
:
0,99.
Desta forma, vemos que a variação do peso é sensivelmente influenciada pela variação da concentração da substância.
Para observarmos como as variáveis se relacionam, construímos um
9.5 Regressão Linear Simples
grâfico de dispersão, apresentado na figura a seguir.
No capítulo 5, definimos o coeficiente de correlação como uma medida
de dependência linear entre duas variáveis. Em muitas situações, além
de estzrrmos interessados em saber se existe relação entre duas variáveis, podemos
30
ó a mudança observada em uma das variáveis quando variamos os valores
25
desejar estabelecer uma relação de causalidaae. tsto é, queremos quantifìcar qual
outra.
da E)
i1
Exemplo 9.19: Em uma dada região de Bocaina-sp, acredita-se que o gado nlimentado em um determinado pasto tem um ganho de peso maior qu" o uiual. EsÍudos de laboratório detectaram uma substância no past; e deseja-se verificar se ela pode ser utilizada para melhorar o ganho de peso dos bovinos. Foram cscolhidos 15 bois de mesma raça e idade, animal recebeu umfl " "ãdu dcterminada concentração da substância x (em mg/l). ganho o de peso após 30 dias, denotado por Y, foi anotado e os dados foramãs seguintes (em Èg):
8zo
o CL o
t
€rs c o
a
10
5
X
0,2
0,5
Y
9,4
TL,4
X
2,5
3,0
Y
L6,2
1.6,2
0,6 12,3 3,5 L7,7
0,7
1,0
1,5
2,0
L0,2
11,9
13,6
14,2
4,0
4,5
L8,g
L9,g
5,0 22,5
0
5,5
6,0
24,7
23,L
334
Capítulo 9: Tópicos Especiais
Nota-se que os pontos tendem a se alinhar sobre uma ,"ru,)uiuinclinação reflete o sinal positivo observado no coeficiente de correla ca(liao.
tr
çao
\
Utilizando o desenvolvimento da Análise de Vahância apresentado na
seção anterior, consideramos para o conjunto de valores
seguinte modelo estatístico:
(Xt,y), i : \,:.. ,fr, o
Y:g(xr)+q. Isto é, o comportamento de Y é explicado em parte por x4, através da função g(xt) e' em uma outra parte não captada po, úçao, representadapot ei.
9.5 Regressão Linear Simples
Ê
335
: E(Y I x : r +t) - n(Ul x : r),
indicando que P representa o acrtSscimo eqterado nale!êygf-Igqpgtlq ggqldo a. nos fornece uma iclãiãíe3p--cJïto aa' è@to intensidade com a qual a covariável atua na resposta. A estimação de a e B pode ser feita através do método de mínimos quadrados, que consiste em minimizar a soma dos quadrados dos resíduos obtidos através da diferença entre valores observados A e valores esperados B(Y I X: r), calculados para cada X: r. A Figura 9.3 ilustra essas quantidades. Note que, caso o ajuste fosse perfeito, todos os pontos estariam alinhados sobre a reta e os resíduos e seriam todos iguais azero. cg-v3rriável
"rru várias opções paru g(xa) podem ser utilizadas, mas a que define o modìlo de
regressão linear simples é
g(Xr): ai
E(YlX=,r)=g*0x
7Xr.
Portanto, dado um valor fixado 14 paÍax;, o modelo pode ser reescrito como
- "F:a-rprn+4
Além disso, supomos que os termos e;, i:L,...,fr, são independentes e distribuídos conforme um modelo Normal de média 0 e variânc ià o2. Dessa forma, fixado
Xi : ri,
as variáveis
\
denominada
vorióvel resposta ou variável dependente, ao passo que a variável xi é, chamada variável independente, explicativa ou ainda covariável. Os parâmetros do modelo em que temos maior interesse são a e B. Eles têm interpretações muito úteis na prírtica. Oparâmetro o 9_. ua]!g_g!p91qqo_!4lu a variávãl dçpqrylente ylquando x, e i pãamet.ò-piãnsi&ì aoi. uaoìË, pura x,, dadòìpoìã e n* 1, eìepresenre por E(y l'x r) o ualor esperado da variável resposta quando X : r. Então,
guqtã@õ
-
Logo,
: r*
Resíduo (e)
são independentes e
Y - N(a * Br;,,o2), ,i : I,... )n. Em modelos de regressão, a variável \ é, comumente,
E(Y t x;
E(YlX=x)
xX Figura 9.3: Resíduos no modelo de regressão linear símples. Como em geral os pontos não estão perfeitamente alinhados, escolhemos â "melhor" reta possível no sentido de minimizar a soma de quadrados SQ@, B), dada por
se(a,g)
" : ï;:{iï;!}")
:f,@n - n(U I xr: rt))2 i:7
n'n
+p
:D@o-d-grn)':D"?. i:1.
i--L
-*.!qlFF
"%!Flit|IF-
9,.í rtegres,rrT u Llnea
.736
Matematicamente, temos que resolver o sistema de equações as derivadas de SQ(a,0) em relação a a e B. Deixamos aslpontas a cargo dq leitor, apresentando aqui a solução para o sistema que fornecer/ os estimadores d; mínimos quadrados para a e B. Temos
LrtAn
p:
:1
25
/ \
a:A_pr;À-f,
El
.Y
8zo
o
ÍL
- nrA
Ito
TLï'
(5
€rs tr (É
D"7 i:r -
10
Exemplo 9.20: Yimos, no Exemplo 9.19, que o diagrama de dispersão sugere uma reta pode ser utilizada para representar o efeito da concentração de uma certe substância no pasto (X), no ganho de peso bovinos (Y). Para obtermos essa reta, precisamos calcular as estimativas de â e B. Dos dados fornecidos obtemos:
n:
-q r5,D*nru:
785,55;
i.:l
-!!-
D"?: à:t
163,39;r
Tl,
st-,
Lx:í.
i:l
ã:
Portanto,
dado X : U
pT
:
01234567 A interpretação dos valores estimados é feita da seguinte forma. O ganhO de peso esperado em bovinos que não recebem a substância X é 9,55kg (obtidO
785,55-15x2,70x16,14 :2144; 163,39
- nr'
0
L6,L4.
n,
p:
5
Concentração (mg/l)
Logo,
Lt&t - nI A i:t
-I5x2,702
substituindo ri:0 na equação calculada acima). Por outro lado, um aumento de 1 mg/l na concentração de X implica em um ganho médio esperado de2,44kg. Testes de hipóteses, envolvendo os parâmetros do modelo de regressãO linear simples, baseiam-se na decomposição da variação total, discutida na Seção anterior.
16,1.4 - 2,44 x 2,70 :
O principal teste de interesse é verificar se a covariável influencia 9,55.
resposta, o que é equivalente a testar
Hoi0:0versusH":Bl0'
{rit à reta ajustada fornece valores f,, dados por 0r,
:
ã +B
rn:
9,55
*
2,44ri.
Caso 11o não seja rejeitada, adotamos o modelo
Modelo0:
A figura a seguir mostra os dados originais e a reta
ajustada. O gráfico sugere que o modelo de regressão linear simples apresenta um ajuste adequado aos dados.
337
r,lhrpler
caso
Ifl
}j:al€it
i : l, ... ,Tt',
seja rejeitada, o modelo é
Modelol:\:a+PXilei,
i: 7r... )n.
Através do Modelo 0 obtemos a soma de quadrados total, dada por
na
.ï.ï8
Cttpftulo 9: T'ópicrts lislteciuis
ser = D@, i:l
_
a)r,
l
f,@o i:I
-
ã
-ì *,)'
/
lffo, o Modelo
1 gera a
\
:
SeT
-
SeRes
:3'
* D,fr, - *)r. i:l
Para estabelecer os graus de liberdade associados às somas de quadrados, precisamos levar em conta as estimativas envolvidas em suas expressões. Assim, sQT envolve a média g, e assim, temos n - 1 graus de liberdade associados a essa quantidade; sQRes envolve duas estimativas,
n
-
liberdade. Consequentemente, definimos os quadrados médios por
QMT:H -s',QMRes:H e QMReg:tQl"t. Seguindo os passos da seção anterior, utilizamos
QMReg QMRes
para testar as hipóteses de interesse. Pode ser mostrado que .F tem distribuição de Fisher-Snedecorcom \en- 2 graus de liberdade, isto é, F - F(1, n-2). Em resumo, da mesma forma que na seção anterior, podemos apresentar as informações apresentadas em uma tabela ANOVA, específica para o modelo
Y:a*?Xe*e;,dadapor
Soma de Quadrado Quadrados Médio
SQReg QMReg SQRes QMRes
Regressão 1 Residual n - 2 n-I Total
F
QMReg/QMRes
SQT
Exemplo 9.21: (Continuação dos Exemplos 9.19 e 9.20) No estudo da relação entre ganho de peso de bovinos (X) a concentração de uma substância (Y), estabelecemos uma reta de regressão.
"
Para verificar a evidência estatística do modelo realizamos um teste de hipóteses:
Ho:B:g os valores de QMReg
versus
H":0*0'
e QMRes podem ser calculados com o uso de uma
planilha eletrônica, conforme a tabela seguinte / _\o @u-ã- Br,i)2 \rr - r)"
â
d" forma que teremos 2 graus de liberdade. Para a SQReg, restam n -"p, I - (" - 2): 1 grau de
F_
Grnus de Llberdade
,
clue contém a variação dos dados não explicada por esse modelo. A diferença cntre as duas somas de quadrados fornece a soma de quadrados da regressão, tlada por
SeReg
.ï.19
5 Il a g re s são l,in esr,S/rrryrle,r
de Variação
residual
:
9.
Fonte
clue contém a variação total contida nos dados. Por outro soma de quadrados
seRes
"*-*ru
,=qF
--r
1
0,4r
2 t)
t
0,39 1,65
4
L,L2
5
0,01
6
0,1-5
7 8
0,05 0,30 0,45 0,15 0,26 0,40 0,56 2,98
I
10 11 L2
13
t4
6,25 4,84 4,4L 4,00 2,89 L,44 0,49 0,04 0,09 0,64 1,69
3,24 5,29 7,84
15
r,20
10,89
Total
10,09
54,04
.140
( | t p ít tt I t t
Com base nos valores apresentados na última linha da tabel SQReg
: 0^z- \(ri - r), : i:l
SQRes :
n,
D@o i:1,
2,442
- ã -Ê "ò, :
x
54,04
10,09
t't
t,r
lh pcc
().(t li.rerrício,t
ittis
) \:'o''
verificar se existe relação entre a renda familiar (em salários rnínimos) e o número de filhos, foi coletada uma amostra de 8 famílias em uma ciditde, Os resultados obtidos estão na tabela a seguir:
3. Para
327,73;
FilhosS22I
1
327,73
327,73
Residual
13
10,09
0,78
Total
t4
331,92
fato, altera o ganho de peso dos
bovinos.
F
80,5
- 0,90r;, i :
1.
da
tr
A
seqüência de operações executadas por um operário para realizar uma ccrtt tarefa está sendo estudada. Para tanto, 9 operários foram sorteados e mediu-se o tempo necessário, em minutos, para que cada um realizasse a tarefa, cotÌl os dois tipos de seqüências. Suponha que o modelo Normal é adequado.
Operário
Atual Nova
24
2t
25 23
27 22 23 28 26 28 28 27 24 26 25 22
29 23
Baseando-se nos dados fornecidos, você diria que houve diminuição no tempo médio para a realizaçáo da tarefa? Use o : 57o.
2.Para se aferir o consumo de combustível, entre duas marcas de automóveis com mesmas características, escolheu-se 8 carros de cada marca e anotou-se o consumo após 100 quilômetros percorridos em uma estrada. Os resultados
I, ... ,n.,
t+,i1,
um diagrarna de
9.6 Exercícios
estão abaixo:
Interprete as estimativas de a e . B 2. Para verificar o efeito da variável x sobre a variâver y, foi realizado um experimento que forne^cel (u,?lo) dados por (ã;'13,S), (Z; àl,ij','
-os.far9s (5;15,9), (2; I2,8),^,(9; 29,6), (T; Zg,5),'
baseando-se em
472,47
1. um estudo deseja avaliar o efeito de determinado treinamento no tempo de reação de atletas submetidos a um certo estímulo. o treinamento consiste na repetição de um movimento e foi utilizada uma amostra de 37 atletas. para cada atleta foi atribuído um certo número de repetiçàãs (x) e, então, foi medido o tempo de reação ()'), em milisegundà.. Ü-u reta de mínimos quadrados foi ajustada aos dados, fornecendo a equação
:
1000
dispersão e no coeficiente de correlação?
Bxercícios da Seção 9.5:
ffi
23 27 34 43
b. Calcule a reta de mínimos quadrados e interprete os parâmetros. Veril'iquo se a renda influi no número de filhos, utilizando a : \Vo.
obtemos, da distribuição de Fisher-snedecor com
X,de
LT
a. Que conclusões podem ser tiradas,
é dada por:
I e 13 graus de 4,667. Como fob,:4i,2,47 ) rejeitu*o, u hipótese 11, e f", concluímos que existem evidências estatísticas de que a concentração substância
141
.
Regressão
a:0,05 lìbetdade, f":
;'liipi
Família 1 Renda 12 14 15
A tabela de ANOVA para o modelo de regressão proposto Fonte de Graus de Soma de Quadrado Variação Liberdade euaeÌrados Médio
Para
:
9
xwx
9,5 YWY 9,0
áS,Sl, (B; 32,6),
ìãi (2;L2,0). e (1; 4,6). obtenha aretìajustada. \S: construa o diagrama de dispersão, baseando-se nos pares de valores iornecidos e, em ,"guiou, desenhe a reta ajustada. Baseando-se apenas no gráfico, você diria que o"ajuste é adequado?
Consumo (krr/l)
Marca
9,4 9,3
9,6 9,1 9,3 9,9 9,8 10,1 8,6 8,1 8,3 8,9 8,8 7,9
F
Fazendo as suposições necessárias, verifique se o consumo médio dzrs cluns marcas é o mesmo. Use a :57o. Admita que as marcas tenham a mesrnit variabilidade.
.t
3. O desempenho em duas classes de Estatística está sendo comparado através do
:2
It
rÊ
** Ê I ìi!:
l:
i 'l
resultado dos dez melhores alunos de cada turma.
.142
(i
t
1t
ít u
Ir
t 9 ;'l'ópì
ns
Iì,rpt,c it
t
i t;
.t4.1
Q.(t lì.rertíritt,r
Batimentos APós
Criança Antes
I
8,5
II
7,0
7,5 7,0 7,5 9,5
6,5
8,5
9,5
9,0
9,5 9,0 9,0 9,5 8,5 8,0 9,5 9,5
2
10,0
3
9,5
4 5
Admitindo que as variabilidades das classes são iguais, pode ser dito que eras têm o mesmo desempenho médio? Faça as ,upJriç0".'necessárias e utilize
Qual a conclusão, considerando-se um nível de significância
a:27o.
4' o salário de recém formados em veterinária foi amostrado em duas cidades. Na cidade A, 10 profissionais foram sorteados e na cidade B, 15. os resultados, em salários mínimos, são apresentados a seguir.
A: T,J;6,6; 6,g; 7,4; g,J; 6,5; T,g; B,Z; g,1; 8,5 Cidade B : 6,5; T,B; 8,2; 6,g; T,g; g,T g,I; g,5; T,4iB,0; ; 6,9; T,g; g,4;9,3; g,5 Cidade
5. Motoristas novatos e experientes participaram de um experimento para avaliar se o tempo de habilitação altera o desgaste das pastilhas de freio. Dez motoristas de cada tipo foram escolhidos e obsãrvou_se o número de quilômetros até a troca das pastilhas. Indicando por x a respostq dos novatos e por Y a dos experientes, os resultados amostrados (em mil'hares de km) foram os seguintes:
10
10
7.
20
20
:2/,, D"7: Ensino fundamental: lri i:l i:L 15
l5
i,:l
i:l
Ensino médio: Drn: z+,lu?:
610;
1.315.
Supondo normalidade, verifique se as variâncias populacionais são iguais (use a: I}Vo). Com base no resultado obtido, construa um teste de hipóteses parn decidir, ao nível l7o, së os grupos têm o mesmo consumo médio'
8. O tempo de conexão à Internet tem sido modelado pela distribuição Normal com desvio padrão de 10 e 7 minutos para o público jovem e adulto, respectivamente. Amostras independentes desses dois públicos produziram:
10
6
Á"'
Adultos:
Admitindo que' para ambos os grupos, modelos com distribuição Normal com mesma variância são adequados, o que pode ser concluído para um nível de significância d :0,0b ? 6. Para estudar o impacto de cenas viorentas em desenhos animados, 5 crianças tiveram seus batimentos cardíacos medidos, antes e após assistirem a um clesenho comercialmente veicurado por uma grande emissora de TV. os dados siro apresentados a seguir:
Que
Deseja-se comparar o consumo de refrigerantes entre alunos do ensino fundamental e do ensino médio. Uma amostra desses alunos foi coletada e solicitou-se que indicassem o número de latas de refrigerantes que consumilm por dia. Os resultados, para cada grupo, foram os seguintes:
Drr:98, i:lD,an: 106, t"?." :970 e ta?': I.I52. l:t
i.:t
Q:0,02?
suposições são necessárias?
Admitindo que a variabilidade do salário seja a mesrna nas duas cidades e que o modelo Normal é adequado, verifique se ã cidade paga, B em média, melhor do que A. obtenha o nível descritivoã tome sua decisãó ulilizando um nível de significância a : 5Vo.
10
96 tt{ t02 LL2 108 t12 89 83 85 99
I
D4:217,2; i:t 10
Jovens:
Teste, usando
a
:
' lur,:367 i.:l
5Vo, se o tempo médio de conexão dos jovens é maior.
,:{!!--Ë=
.Ì4-l
Ct t pít u
It
t () :'l'ópi
ct
t,t
Ih prr
iu
I
t
3,15
9.6 lixan:ít:itt,t
I
9. Deseja-se comparar a durabilidade de amortecedores faUriqáOos pelas empresas A e B. A medida observada é o índice de resistência de càdg1eça testaia em laboratório, que é assumido ter a mesma variabilidade nas dús empresas. oB resultados obtidos são apresentados a seguir.
para duas técnicns L2. Deseja-se comparar o tempo de recuperação pós-operatória
cinirgicas. pacientes opeìados, segundo cada uma das técnicas, lornnr registrnclo' selecionados aleatoriamente e seu tempo de recuperação, em dias, cirurgia' da antes Todos os pacientes apresentavam o mesmo estado de saúde Os dados obtidos são:
A: 115, 723,134, L20,121- ; Empresa B: 725, L26,I20,130, 128 . Empresa
Técnica 1 Té,cnica2
Fazendo as suposições necessárias, qual a conclusão ao nível 2Vo?
10. Num programa de diminuição da poluição sonora em cidades grandes, realizou-se uma campanha educativa durante 2 meses. A tabela abaixo apresenta os índices alcançados antes e após a campanha em dez pontos cltt cidade sorteados ao acaso.
Antes Depois
23 2L
10
44 56 34 25 67 21 23 73 58 30 45 35 26 50 23 22 57 46
verifique se a campanha surtiu efeito, ao nível de4vo.Indique as suposições que devem ser feitas.
ll.
um experimento com cobaias consistia em comparar o desempenho de uma tarefa para dois métodos de aprendizagem. cada cobaia teve seu desempenho
de 0 a 10. Essa medição oóorr"u imediatamente após cada aprendizagem. os idealizadores do Método 2 alegam que seu método é mais eficiente e, portanto, deve produzir maior nota. De estudos anteriores, sabe-se que, após uma semana, o aprendizado de um método é esquecido e, portanto, fixou-se esse intervalo de tempo entre a aplicação dos métodos. Além disso, foi estabelecido que o modelo Normal é adequado para as variáveis envolvidas. As notas obtidas foram as seguintes: medido, atribuindo-se uma nota
Método1 Mérodo2
6
a. Verifique se as variâncias populacionais correspondentes às duas técrricas são iguais.
b. Verifique se a Técnica 1 é mais eficiente com telaçáo ao tempo médio de recuperação. Use a :5Vo-
13. Um casal está procurando um apartamento para alugar' Duas cidadcs' qr,ral igualmente atrativas para o casal, estão sob consideraçáo' A decisão sobre
Pontos da Cidade
4567
4 4 5 6 66778
B3 7 4 6 2 7 3 I T 8 4 B3 7 3 8 3 B 6
Formule as hipóteses de interesse e faça o teste conveniente, considerando um nível de significância a : SVo.
eles obtiveratn a cidade escolhida dôpende do custo do aluguel. Neste sentido,
o preço médio e a vìriabilidade dos preços em cada uma das cidades. Nrt pri-"i.u cidade, denominada cidade A, o preço médio e coÍrespondente desvio foram obtidos de uma pesquisa com 22 ' ofet.tas, fornecenclo, padrao -respectivamente, R$ 455,00 e R$ 25,00' Na segunda cidade' B' fbrnm
padriro de escolhidas 30 ofertas que forneceram média de R$ 475,00 e desvio R$ 18,00. Supondo normalidade e mesma variância, pergunta-se: a. As cidades são equivalentes, ao nível 57o? Se não, qual é melhor? b. Apresente um intervalo de confiança com 1 :0,95 para â diferença ele preços entre as cidades A e B. a umit 14. Duas raças de cavalos estão sendo pesquisadas quanto à. resistência dietit uma ministrar em consiste certa doença intestinal. O experimènto nos 6 doença, da não ou especial, durante 3 meses e verificar a ocorrência *"r", seguintes. Os dados observados foram os seguintes: Raça
Tamanho da amostra
Ocorrências
A
5B
6
B
85
10
Um veterinário afirma que a raça B tem maior propensão à doença' Vocô concorda? Use a :6Vo.
15. Estão sendo testados dois aparelhos para estabelecer suas respectivas do"nça. Dados foram obtidos de confiabilidades no diagnóstico d" u*u ""itu
346
Capítulo 9: Tópicos Especiais
347
9.6 Exercícios
l
exames feitos
em
diversos pacientes, escol(idos ao acaso, que, após serem avaliados por um dos aparelhos, tiveram \us casos estudados em maior
pesos dos pacientes, tomados no início e obtidos foram (em kg):
profundidade. Desse modo, foi possível quàntificar o número de falsos positivos ou falsos negativos advindos do uso do aparelho. Em outras palavras, foi possível saber o número diagnosticado falsamente pelo aparelho
Número do paciente
como tendo ou não a doença. Seguem as informações obtidas: Aparelho
Total
I
r20
2
135
Positivos 85 90
Início
Falsos positivos
Falsos negativos
11
10
t4
27
72
6
Negativos
a :4Vo.
b. Dentre os que estão efetivamente
doentes, isto é, os positivos e falsos
negativos, teste se o aparelho 2 erra menos. Use
a
:
4Vo.
c; Com base nas decisões tomadas nos dois itens anteriores, que aparelho seria mais aconselhável utilizar?
L6. Queremos comparar três hospitais, através da satisfação demonstrada por pacientes quanto ao atendimento, durante o período de internação. Para tanto, foram selecionados, aleatoriamente, pacientes com grau de enfermidade semelhante. Cada paciente preencheu um questionário e as respostas geraram índices variando de 0 a 100, indicando o grau de satisfação. Os resultados foram:
A
10d,5
17. Pacientes resolveram processar a clínica de emagrecimento Linha Fina sob a
alcgação de que o tratamento empregado não contribui para a diminuiçiro do peso. O advogado de defesa contratou um estatístico que selecionou,
l0
prontuírrios que continham inlbnnaçiio
87
62 70 B0 60 7t 82
910
r02 94
58 78 65 78
84 80
preliminar.
a:0,05. 18. Uma linha de montagem utiliza robôs para a realização das tarefas necessárias para a montagem de um produto. Os técnicos acreditam que é necessário umn
programação diferente para garantir a qualidade do produto final, mas suspeitam que o tempo necessário para completar o processo pode aumentar, Para verificar essa suspeita, 12 robôs foram selecionados e o tempo necessário para a montagem do produto foi medido, considerando-se a programação usuül e a nova proposta. Os tempos observados (em minutos) para cada unidndc foram medidos, produzindo a tabela a seguir' Identificação do Robô
a. Faça uma análise descritiva adequada a estes dados. O que pode ser dito,
a. Baseando-se nos dados apresentados, teste a igualdade das variâncias para os hospitais A e B. Use a : 0,10. b. Teste se as médias populacionais são iguais. Qual sua conclusão? Use a : 0,05.
nleltoriamente,
95
45
94
Programação 1 2 3 4 5 6 7 8 9 10 11 12 Usual 80 90 93 92 75 92 72 87 90 86 78 97 Nova 100 85 90 702 90 99 97 95 100 94 89 98
10 15 13 80,7 59,0 72,3
113,3 L0t,4
r04
b. Verifique se a conclusão do item anterior tem suporte estatístico. Formule as hipóteses adequadas e encontre a região crítica correspondente a
Tipo de
Hospital Tamanho da amostra Média amostral Variância amostral
Final
80 78
a. Faça uma análise descritiva para os dados e obtenha uma conclusão
a. Teste se os dois aparelhos produzem a mesma proporção de diagnósticos falsos. Use
no final do tratamento. Os dados
a respeito
dos
baseando-se nessa análise? b. Existe diferença para os diferentes tipos de programação?
c. Construa um intervalo de confiança de confiança com
:
95 Vo para diferença das médias populacionais dos tempos de montagem do produto. 'Y
t
19. O custo de manutenção de treminhões movidos a gasolina e a diesel são dados abaixo para duas amostras aleatórias de 10 treminhões de cada tipo. Os veículos considerados trafegam sob as mesmas condições em uma mesmiÌ área.
JÇlr
rí8
Cupftnlo 9: 'l'ópicos
lltperlalt
Combustível Gasolina
Diesel
5,05
4.r7
10,99
L4p7
t2,72
8,gg
15;00-ÌÍ-1--876g,g5 2,94 5,00
34e
9.6 llxcrcícios
sofreram
um
disponibilizadas: Espécies
a. Quais são as hipóteses necessárias para construir um intervalo de confianç6, para a diferença das médias dos custos? b. Verifique se as variâncias dos dois grupos são semelhantes. c. Teste-a igualdade de médias dos dois grupos, considerando
a
:
ïVo.
20. (Use o computador) Uma loja de departamentos está interessada em saber sg existem diferenças entre as quantias médias faturadas, através de três formag de pagamento: dinheiro (D), cheque (C) e cartão de crédito (CC), Um levantamento das vendas (em milhares de reais), em um dado período de tempo, foi feito, produzindo os dados na tabela a seguir. Formas de Pagamento D C CC 56,00 80,90 73,25 20,50 56,65
ni
I
Ti
90,56 13,28
S?
23 8
10
86,40 95,7L 74,27 13,23
83,63 l_6,55
O que plode ser concluído com base na tabela?
custo mensal de manutenção de determinado tipo de óleo) está sendo analisado em automóvel (excluindo-se combustível e trocas de em diferentes elnos ionçao da idade do veículo. Nove automóveis fabricados tiveram o custo averiguado' Os dados obtidos foram:
22. (ÍJse
o computador)
o
Idade do veículo (anos)
89 L2 34567 32 37 29 26 24 20 18 Custo mensal (reais) 8 13
5r,29
37,37 40,95 123,2t 29,64 72,65 56,50 132,47 37,29
60,32 60,00
e as seguintes informações foram
inicial,
tratamento
de correlação' comente a. Faça um gráfico de dispersão e calcule o coeficiente o resultado.
44,65 40,64
b.Ajustearetaderegressãopelométododemínimosquadrados.Comovocê interPretaria o coeficiente B?
a. Calcule algumas medidas descritivas (média, variância, etc.) e,
baseado
nelas, discuta se existem evidências de diferenças.
b. Assumindo que as variâncias são iguais para os três grupos, estatisticamente as médias populacionais para verificar se diferenças. Use a : 0,05.
compare
existem
21. Quatro diferentes espécies de milho foram produzidas em laboratório. Desejase testar, a um nível de significância a:ívo, se existe diferença estatisticamente significativa entre as produtividades. Para tanto, foram montados 34 canteiros, plantando-se neles o mesmo número de sementes e garantindo-se a todos as mesmas condições de fertilidade, irrigação e
exposição à luz solar. Após um período de tempo pré-especificado, a produção de cada canteiro, em kg, foi obtida. os resultados observados
23.VerifiqueSeérazoâve|considerarummodeloderegressãolinear (X)' segundo os dados relacionando u, noà, de Inglês (Y) e Português
deve ser baseada no coeficiente apresentados na tabela a seguii. Suaconclusão dè correlação e no ajuste da reta de regressão' lnas Inglês Português
s,s s,r 7,0 2,5 7,,0
4,5 8,5
3,5
Notas 9,5 6,5
9,0
4,5
6,0 4,0 5,0 5,5
5,0 6,5
24.(Useocomputador)Umaindústriasubmeteseusnovosoperáriosaumtestc destes operários (Y)' de aptidão (;ç; e;á; meses depois mede a produtividade Os rãsultados estão na tabela a seguir
''--t#t10
-: .ï.í /
9.(t litten:ícitts
A
Operário
Aptidão (X) Produtividade
(I')
22 45
25 .7 I
C
D
15 25
19
40
22
18
tt
30
.)
L)
ao acaso e a cada uma delas perguntou-se os pesos' que depois foram aferidos em balanças devidamente calibradas' Os resultados são apresentados a seguir'
Indivíduo
a. Faça o gráfico de dispersão e calcule o coeficiente de correlação. Comente o resultado.
b. Ajuste a reta de
regressão
e trace-a no gráfico de
dispersão.
interpretação para os coeficientes a e B?
eual
a : 0,05. d. Para um indivíduo com aptidão igual a 20, qual seria a produtividade Use
esperada?
25. Um estudo pretende avaliar o efeito da obesidade na pressão sangüínea. Para tanto, foram avaliados os pesos para 6 indivíduos e construída a variâvel X representando a razão entre os pesos real e ideal. Estudos indicam que um modelo de regressão linear simples é adequado para essa situação. os dados obtidos foram:
Indivíduo
(X
)
Pressão sistólica
(Y)
L,23
I,42
1,35
1,67
L29
130
133
139
a. Construa a variável auxiliar d, :
b.Ajuste
aretay: al0d.
1,65 136
Estimado 57
/c)
6
789
92 75 98 74
55
10
t2
13
t4 63
45 44
a
c. Verifique estatisticamente se a produtividade é influenciada pela aptidão.
Razão
Peso
4 70
1
1,56
L34
r - r.
c. Qual a interpretação para o na reta obtida em (b)? d. Qual a pressão sistólica esperada para indivíduos com razão peso real/peso ideal igual a I,25?
26. Estuda-se a relação linear entre duas variáveis x e Y. uma amostra de 20 pares dessas variáveis forneceu os seguintes valores: 20 20 20 20 20 :600, f sl : 2.150, D*? : 18.662, Dy? : 235.270, D*oyo : 65.92t . Dq i:L i=t i-_7 i:t i:7 Determine a correlação e ajuste uma reta aos dados.
27. um estudo foi conduzido para verificar se as pessoas estimam os próprios pesos corretamente. No experimento realizado, 15 pessoas foram selecionadas
O que pode ser concluído a partir dos dados? 2g. A quantidade de chuva é um fator importante na produtividade agrícola' Para medir esse efeito, foram anotadas, para 8 regiões diferentes produtoras de soja, o índice pluviométrico e a produção do último ano' Chuva (mm) Produção (ton)
120 40
140 46
r22
150
45
tF7 tJl
115 25
190 54
130 tt
Jt-,
118 30
a. Faça um gráfico de dispersão e calcule o coeficiente de correlação. Comente o resultado. a reta de regressão. Como você interpretaria o coeficiente B? Ajuste b. c. utilizando a reta ajustada no item (c), encontre a produção esperada parit uma região com índice pluviométrico igual a l-60 mm' d. É adequado utilizar o modelo ajustado para calcular a produção em um0 região cujo índice pluviométrico é igual a 30 mm? Comente'
,29. (Use o computador) Para os dados do arquivo areas.txt (vejaExercício 25 do Capítulo 1), suponha que os apartamentos são classificados como de andar baúo, para a unidadã situada entre os 1s ao 6q andares (inclusive);
intermediário, se o apartamento se encontra do 7q ao 72e andar e de andar alto, de andares se estiver situado acima do l2e andar. Suspeita-se que apartamentos descritivo' mais baixos podem não ter o tamanho especificado no memorial a. Construa histogramas para as medidas de área da sala para cada um dos grupos formadãs (andar baixo, intermediário e alto). Discuta se o modelo Normal é adequado para essa situação b. Dependendo de cada uma das três categorias de andar criadas, construa unl grá^fico box-plot para as áreas da sala e discuta se a localização interl'ere com o tamanho da sala' c. Usando um modelo de análise de variância, verifique se existem evidências (b)' Utilize estatísticas que dêem suporte à conclusão apresentada no item um nível de significância a : 0,01-
ts2
(' t
t ít r r I r
t () :' I I i I t i t'
t,y
c iu
i,t
d. Repita os itens anteriores para a ârea total do apartamento, definida conìo
n
t
1
r
I i,t' 1 t
r
soma das áreas da sala, cozinha, banheiro e dormitório.
Apêndice A
30. (Use o computador) Para este exercício será necessário utilizar o arquivo cancer.rxt, cuja descrição é dada no Exercício 24 do capítulo 1. Deseja-se verificar se conforme aumenta a idade, muda a concentração de nitrogênio nn
I
I,
uréia.
a. suponha que selecionamos apenas os pacientes que têm a doença (isto é, consideramos o grupo formado por pacientes cujo diagnóstico é falsonegativo ou positivo). construa um gráfico de dispersão para idade e concentração de nitrogênio. O que pode ser dito?
b. Supondo que a variável dependente é a concentração de nitrogênio e que a covariável é a idade do paciente, calcule estimativas para a e p, em um modelo de regressão linear. Qual é a interpretação de B nesse caso?
c. construa uma tabela ANovA para verificar, ao nível de 5vo, se existe evidência estatística de que a idade influencia na concentração de nitrogênio.
d. considere, agora, os pacientes que não têm a doença (diagnóstico negativo ou falso-positivo). construa um gráfico de dispersão para idade e concentração de nitrogênio. compare com o gráfico obtido no item (a). e. calcule as estimativas para a e B nesse caso e interprete B. o que pode ser dito ao se comparar com os resultados do item (b)?
f.
verifique se a idade influencia a concentração de nitrogênio para pacientes sem a doença. Considere a : 5Va.
os
Distribuição Distribuição Distribuição Distribuição
t - Student Qui-Quadrado Fisher-Snedecor ( 0,05 ) Fisher-Snedecor ( 0,95 )
g. Com base nos itens anteriores, compare visualmente as retas ajustadas e as estimativas obtidas. você diria que o efeito da idade, na concentração de nitrogênio, é um dado importante para discriminar entre pacientes com e sem a doença?
31. (Use o computador) Para este exercício será necessário utilizar o arquivo aeusp.txt, cuja descrição é dada no Exercício 26 do Capítulo 1. a. Teste se a média da variável Itrab é a mesma nas sub-populações definidas pelo estado civil dos residentes. b. Repita o item (a) com as'sub-populações definidas pelo local de moradia.
353
.F?-!F.'
I
)
is
t t'ilt t ti t;litt
.7.í5
N t tt' t nt I
e P(0 < Segundo decimol de z.
Z<
zc)
-p
o'o31e 0'0359 o'0 op ô,'-oio o,oóoo'ò,ooto o,o'ro o.otóo o:olee o'o2se o'o27e 6,e71a'f;,o,.ozs3 ,i'"0,1 o,oose , .o,067s o,r o,oge''r,o,oïsa o,olzã.-,-o;o.ri.'ãióisit.o.;osçe 0'10ó4 o'1103 0'1141 o'2 o,2 o,o7g3 o,og32 o,o87l ô,osr; o,o9as o'og87 0'1026
o,40,15540,tsçto,tozeo,1664o,170oo'ì73óO',17720'18080'18440'ì8790'4 0,6 0,2257 o,zZil
o,)'.3'24
0,2357 O,23gg...9,2a22 0'2454 0'2486 0'2517
0'2549
0'ó
0'3t33 0'8 0'e'óill0icaail ;;';Ëil; ãi,ïií ,í|irjl.tiïirï,:ïiAï+ì;ãisç':'or=rr3Lt=o;ssao: 1,0 0,3621 o:3s99 0'9577 0,3s54 0,34t3 O,glsa o,sair ô,sags o,gsoe oJ53l 0'3078 o'3loó o,g 0,2BBt o,zcto o,'zísc 0,2967 o,29g5 0,3023 0'3051
I,o
a
1,2 o,3g49 o,gaaç o,gôea o,sso7 o,392s 0,394'4 0'3962
0j399-0.
iopïCz-r
o'lots
1'2
0'4292 0'4306 0'43t9 1'4 ! t,+ o,uez o,tzot o,.iazz o,ìztd o,+zst 0'4265 0'4279 8 ;; ói,ì^J ói,^iu, o,ttìt o,tteÁ o/44ss o'4so5 o'45r5 o'4s25 0'4535 o'454s t'6
0'4686 o'46e3 o'46ee
0'4706
r'8
0'4878 0'4881 o-t!P!4-:A.!87
0'48e0
2'2
0'4934 o,492o ot,4922 0,4925 0,49'27 0'4929 0'4931 0'4932
0'4936
2'4
.q ;:; ;:,;;;; ;1,;;;, ' ;:,;;,;;;, P z,c o,ava
ái,ooru o,,otoo
à,,osto o',tao'l
''/u"
o',tet' o'487s
óAoft
0'4963 0'4964 2'6 9, z,o o,tgss o,tgss oì,tgsa o,49s7 0,4959 0'4960 0'4961 0'4962 Ë ;:.;;:,;;;; ;:,^;;t o,4e76 0,4s77 o,4e77 o'4e7e ot4e7e. o:4e-7e o'4e8o o'4e8r 2'8 2'9 :0'4981"':'0'4982 a o'49go 3'o 49gg
o,49*g o'498g o'499o
s,2 o,4993 o,tcss o,aòct o,49g4 o,4994 o,4gg4
o'4994.. o:4995....,o.i!99s
o'4995
3'2
0,4997 O'4g97 O'4g97 A'4997 0'4997
0'4998
3'4
0',4999 o',4999 3,6 0,4998 0,4998 0,4999 0,4gg9 0,4999 0,4999 o',4999
0'4999
3',ó
o;sooo=ô,sôoõ c,i..o,sooo ô,sooo o,sooo o,sooo o;sooo'' o,5ooô o,Sboo
o;soôo
3,9
3,O O,4g87 0,4987 0,4987 0,4988 0,4988
3,4 0,4997 0,4997
Ot,4997 O,4g97
0,,
ll',,,,1,,, .I lìtlt, l,tt
--;
I
ì
tl t tl ttt
t
ã a_
ì.H.qì.€.$
i
ì 35 c,.
N
L
(J
tJl
{
i
N-
Ës:tì[**.3*s3ì:.: 3ïs3:33ÈiÈ3s$È**3ãs:.Ii Í9PN6OOOoN9N--O9Oïô6-ts
: õ ; s È B à È R \ I i i : È. { q s. ì i i
d ôì cì ôì ôr'-j
R
-j -'
Ë.
fl
p. â. à. g. ë.
*
SËS
@ÓNÈ
o- o..o- o-
ï-ôNS!oFô^ó@N€6ONONOF9
à
ã. 3. 3. 3. 3. 3- 3. 3. 3.
g. 3- 3.
E
Ë Ë,Ë Ë g.
\o
QSu?-N@È€oQ
6666
333333s333È33333333.ii3
:P a^ (!' €o
oors@ïN6@N vlÌÍÌtï!ooo =ïN-OOO6G6 dddddddddo' o!ì.N-N6oNFo !!@NN€999€9 o-c!a!NNNNNNN ddddddddcio'
;9 @NNsN-oo66 ô()ÌooooooNN
BB
gsss g.B3ssgBx.g. g.*.
oôóN €6!ïóoNN^--ï-ooo66@N€Y oooooooóó.ió6 6- O- 6- !'ì vì iri oooo
ddctd
U'
o66@
ddo-d ô@óó NNNN
r
o
ir
r
\\NNN€9€€9 e o i.r &
iì
Ã
Ã
À
(ì
èr
dddddddddd
dddd
d d o'o- o'b'o- ã ;' ;-ã ;- ;- ;. ;- ;-ã ã ;. ã ;. ;.
Fflórta€h@6O
FNO
View more...
Comments