Livro - Estatística Básica - Sérgio Carvalho
Short Description
Download Livro - Estatística Básica - Sérgio Carvalho...
Description
ESTATÍSTICA
**** Ponto 2 – PRIMEIROS CONCEITOS ****
Pág. 1 de 7
PRIMEIROS CONCEITOS Daremos início a nossas aulas pelo seu alicerce: os conceitos iniciais, aquelas noções básicas, cujo conhecimento se faz essencial ao desenrolar da matéria. Quero deixar claro que nosso objetivo será o de atacar o programa do AFRF (Fiscal da Receita), tendo em vista, inclusive, a expectativa de novos concursos em breve! Neste intuito, serei o mais objetivo possível, de forma que estarei ressaltando certos assuntos e explicando outros de forma menos enfática, conforme estejam ou não inseridos no espírito das últimas provas realizadas pela ESAF! Esta primeira aula é a mais, digamos, enfadonha... pelo fato de ser teórica em sua essência. Mas sua importância é indiscutível, para nos dar a noção inicial da disciplina. Passemos, pois, aos primeiros conceitos:
Æ Estatística: Trata-se de um ramo da Matemática Aplicada, uma metodologia, uma técnica científica, adotada para se trabalhar com dados, ou seja, com elementos de pesquisa. Esta metodologia consiste em uma série de etapas, que serão explicadas por meio do exemplo abaixo: Se eu pretendo realizar uma pesquisa para saber dos alunos de um colégio, quantos livros cada um deles lê por ano, o primeiro passo seria, obviamente, coletar esta informação, questionando um a um dos alunos. Feito isto, verei que as respostas estão desordenadas, desorganizadas, ou seja, estão fora de uma ordem (por exemplo: 8, 4, 7, 9, 5, 3, 15, 12, etc). Até aqui, os dados são chamados dados brutos, com os quais sequer podemos trabalhar. Surge, pois, a necessidade de se proceder a uma organização dos dados, para enfim passarmos à sua apresentação. Podemos, então, dispor estes dados brutos em um arranjo crescente (que poderia ser também decrescente!), a que chamaremos de rol. E o nosso rol seria, neste caso: {3, 4, 5, 7, 8, 9, 12, 15, ...}. Estas três etapas iniciais resumem-se em um único termo: síntese dos dados! Realizada a síntese dos elementos, chegamos a uma fase mais complexa do processo estatístico, que consiste na análise dos dados, com a qual descobriremos, por exemplo, quantos livros em média lêem por ano os alunos daquele colégio. Por fim, a partir da análise realizada, poderemos chegar a uma tomada de decisão, para, suponhamos, investir ou não em uma livraria naquela cidade ou naquela redondeza. Os autores fazem, dentre estas etapas, uma classificação da estatística, a qual já foi objeto de questões teóricas em algumas provas passadas!
Æ Estatística Descritiva ou Dedutiva: Lembraremos dela como a Estatística do D. É aquela encarregada passos do processo estatístico, quais sejam, a coleta, a organização e a apresentação) dos dados. Conforme dito acima, estas etapas iniciais podem apenas como síntese dos dados. Portanto, se a questão perguntar se descritiva é responsável pela síntese dos dados, isto estará correto!
dos primeiros descrição (ou ser resumidas a estatística
Æ Estatística Indutiva ou Inferencial: Será, para efeitos mneumônicos, a Estatística do I. É a responsável pelas etapas finais do processo estatístico: a análise e a tomada de decisões. É a parte mais profunda, mais elaborada, enfim, mais complexa da estatística!
ESTATÍSTICA
**** Ponto 2 – PRIMEIROS CONCEITOS ****
Pág. 2 de 7
Dica de Prova: para distinguir a estatística descritiva da indutiva, basta lembrar-se do D (de descritiva) e do I (de indutiva) e pensar que, no alfabeto, o D vem antes do I, logo, a estatística do D vem antes, ou seja, abraça os primeiros passos do método estatístico, enquanto a do I vem depois, ficando com as etapas finais.
Æ População: Também chamada de Conjunto Universo. É aquele conjunto do qual se deseja extrair a informação, e cujos elementos têm, pelo menos, uma característica comum. Naquele exemplo do colégio, em que íamos pesquisar o número de livros que os alunos lêem por ano, fica claro que a população seria o conjunto dos estudantes daquela escola. Primeiramente, porque é deste conjunto que se deseja extrair a informação; em segundo lugar, apresentam a característica comum de serem todos alunos do mesmo colégio. Observe que o significado estatístico de população difere do seu significado geográfico! Se a questão afirmar somente que população é um conjunto de pessoas, isto estará incompleto, portanto errado!
Æ Censo: É uma das formas de se processar um estudo estatístico. Suponha que aquele mesmo colégio do exemplo acima tenha precisamente mil estudantes. Se, na minha pesquisa, eu resolver consultar todos os alunos, ou seja, todos os elementos da minha população, fazendo o questionamento a cada um deles, sem exceção, estarei realizando um censo. Ou seja, o censo é o tipo de estudo estatístico que abrange todos os elementos da população.
Æ Amostragem: É o tipo de estudo estatístico que se contrapõe ao censo. Como o próprio nome indica, aqui será utilizada uma amostra, ou seja, uma parte, um subconjunto da população, que terá o condão de representar o conjunto inteiro. Ou seja, para que se possa considerar uma parte da população como uma amostra, é preciso que esta parte seja representativa do todo. Se a questão afirmar que amostra é uma parte da população, e apenas isso, então a questão estará errada! É preciso frisar a característica essencial de uma amostra, que é a representatividade. Assim, estaria correta a assertiva: amostra é uma parte da população (um subconjunto), a partir da qual podemos auferir conclusões acerca desta mesma população. Observa-se, assim, o caráter de representatividade da amostra.
Æ Algumas Razões para a Adoção da Amostragem: São todas elas intuitivas: a) Quando a população é muito grande. Por exemplo, uma pesquisa eleitoral, realizada em um município com milhões de eleitores. Seria quase impossível entrevistar cada eleitor! Coleta-se, pois, uma amostra. b) Quando se deseja o resultado da pesquisa em curto espaço de tempo. Vale o mesmo exemplo da pesquisa eleitoral. Às vezes se deseja atualizar o resultado destas pesquisas de dois em dois dias, ou mesmo diariamente. Não seria possível se entrevistar milhões de eleitores neste intervalo. c) c) Quando se deseja gastar menos. Evidentemente, sai mais barato entrevistar algumas centenas ou mesmo milhares de pessoas, que entrevistar alguns milhões.
ESTATÍSTICA
**** Ponto 2 – PRIMEIROS CONCEITOS ****
Pág. 3 de 7
Æ Experimento Aleatório, Espaço Amostral e Evento: Surgem aqui três conceitos, que serão apresentados conjuntamente, por estarem intrinsicamente relacionados. O significado de Experimento Aleatório poderá ser mais bem compreendido, se separado em três pontos: 1.º) É todo experimento que pode ser realizado indefinidas vezes, mantidas as mesmas condições iniciais; 2.º) Antes de ser realizado, não é possível afirmar qual será o resultado do experimento aleatório. Observe que este segundo ponto é uma condição imprescindível para que um experimento seja considerado aleatório. A priori, ou seja, antes de acontecer, não se pode ter certeza de qual será o resultado do experimento aleatório! 3.º) Embora não conhecendo a priori o resultado do experimento aleatório (2.º ponto), mesmo antes de realizar o experimento aleatório é possível descrever todos os resultados possíveis deste experimento. Ora, imaginemos o lançamento de um dado (daqueles que a gente joga na mesa), e analisemos se isto poderia ser considerado um experimento aleatório... 1.º) É possível repetir a experiência de lançar um dado indefinidas vezes, mantidas as mesmas condições? Ora, claro que sim! Se eu quisesse (tenho coisa melhor a fazer), poderia dedicar o resto dos meus dias a lançar o mesmo dadinho sobre a mesma mesa, sempre nas mesmas condições. 2.º) É possível, antes de lançar o dado, afirmar qual será exatamente o seu resultado? Claro que não, se considerarmos que o dado é normal (um dado de seis faces, com um valor diferente, de 1 a 6, em cada face). Poderemos tentar adivinhar, que dará um 6 ou um 4, mas afirmar com absoluta certeza, isso não podemos. 3.º) Antes de lançar o dado, é possível descrever o conjunto dos resultados possíveis? Claro! No caso, este conjunto será {1, 2, 3, 4, 5, 6}. Sabemos que, se o dado é convencional, os resultados possíveis são de 1 a 6. Conclusão: o lançamento de um dado (convencional, não viciado) é um experimento aleatório! Com esta conclusão, e para efeitos mneumônicos, lembraremos da Teoria do Dado, para trabalharmos os três conceitos que estamos agora estudando! O segundo conceito é o de Espaço Amostral (ou Espaço Amostra), que é um conceito, digamos, anterior à realização do experimento aleatório, e nada mais é do que o conjunto dos resultados possíveis de um experimento aleatório! Com a Teoria do Dado nos lembraremos que antes de jogar o dadinho, sabemos que os resultados possíveis deste experimento aleatório são {1, 2, 3, 4, 5, 6}. Pois bem: este é o espaço amostral daquele experimento aleatório! Repito: observemos que o espaço amostral já é conhecido, mesmo antes do experimento ser realizado! O terceiro conceito é o de Evento, o qual, por sua vez, é um conceito posterior à realização do experimento aleatório, pois consiste simplesmente no resultado do experimento! Quando eu lancei o dado, e caiu o número 5, este é o evento: {5}. Logicamente, como vimos, o evento só será conhecido a posteriori, ou seja, após a realização do experimento. Uma questão interessante de concurso falava sobre experimento aleatório com espaço amostral uniforme, definindo-o como aquele espaço amostral cujos elementos seriam todos iguais... Vamos pensar sobre isso! Imaginemos um dado
ESTATÍSTICA
**** Ponto 2 – PRIMEIROS CONCEITOS ****
Pág. 4 de 7
viciado, ou seja, um dado que traga o número 6 em todas as faces. Isto estaria de acordo com este conceito criado pela questão. Neste caso, o espaço amostral – o conjunto dos resultados possíveis – seria: {6, 6, 6, 6, 6, 6}. Ora, deste modo seria possível prever o resultado do lançamento deste dado? Claro que sim! Seria 6, certo? Uma vez que todas as faces trazem este valor, não seria possível outro resultado! Agora, recordando o segundo ponto do conceito de experimento aleatório, vemos que, uma das condições deste conceito é a imprevisibilidade do resultado! Concluímos, daí, que espaço amostral uniforme é uma ficção, não existe, uma vez que destrói o próprio conceito de experimento aleatório!
Æ Variável: É o objeto da pesquisa! É aquilo que estamos investigando. Por exemplo, se eu pergunto quantos livros você lê por ano, esta é a minha variável: número de livros lidos por ano; se a pesquisa questiona qual a sua altura, então altura será a variável; da mesma forma, pode-se pesquisar uma infinidade de outras variáveis: nível de instrução, religião, cor dos olhos, peso, estado civil, nacionalidade, raça, número de pessoas que moram na sua casa etc, etc. O objeto da pesquisa, do estudo estatístico, será, pois, a variável!
Æ Classificação das Variáveis: Há, inicialmente, uma divisão principal para as variáveis estatísticas, que consiste em considerá-las como: Variáveis Quantitativas e Variáveis Qualitativas. Esta divisão é de facílima compreensão: será quantitativa a variável para a qual se possa atribuir um valor numérico! Ou seja, se a resposta fornecida à pesquisa estiver expressa por um número, então a variável é quantitativa. Por exemplo: quantos livros você lê por ano? A resposta é um número? Então, variável quantitativa. Quantas pessoas moram em sua casa? A resposta é um número? Então, novamente, variável quantitativa. Agora, se a pergunta é “qual a sua cor preferida?”, logicamente a resposta não será um número, daí estaremos tratando de uma variável qualitativa, ou seja, aquela para a qual não se atribui um valor numérico. Dentro desta classificação inicial, há uma outra, outrora bastante explorada em provas, e que diz respeito às variáveis quantitativas. As Variáveis Quantitativas podem ser: discretas ou contínuas. Variável Discreta é a variável quantitativa que não pode assumir qualquer valor, dentro de um intervalo de valores de resultados possíveis. Por exemplo, se eu pergunto quantos irmãos você tem, a resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8 irmãos”, ou seja, a resposta não poderia assumir todos os valores de um intervalo! Ou ainda, as respostas possíveis seriam sempre descontínuas. Este acima é o conceito formal de variável discreta! O conceito mneumônico é o seguinte: aquela variável obtida por meio de uma contagem. Em outras palavras: a variável discreta você conta! Exemplos: quantas pessoas moram na sua casa? Quantos livros você tem em sua estante? Quantos carros importados você tem na sua garagem? Se, para responder à pergunta, você faz uma contagem, então está diante de uma variável quantitativa discreta (ou descontínua). Por sua vez, a Variável Contínua é aquela que pode assumir qualquer valor dentro de um intervalo de resultados possíveis. Se eu pergunto quantos quilos você pesa, a resposta pode ser 65,357kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta pode ser 27,35°C. Para facilitar a memorização, basta lembrar que a variável contínua pode ser obtida por uma medição, ou seja, a
ESTATÍSTICA
**** Ponto 2 – PRIMEIROS CONCEITOS ****
Pág. 5 de 7
variável contínua você mede! Exemplos: peso, altura, duração de tempo para resolução de uma prova, pressão, temperatura etc, etc.
Æ
Dados Brutos: Como o próprio nome indica, são os dados obtidos da pesquisa, dispostos da mesma forma como foram coletados, sem que tenha sido feito com eles qualquer ordenamento. Em outras palavras, podemos dizer que são os resultados das variáveis dispostos aleatoriamente, isto é, sem nenhuma ordem de grandeza crescente ou decrescente.
Æ Rol: Vimos que uma das etapas do processo estatístico consiste em organizar os dados. Inclusive, já sabemos que organizar os dados é um dos passos da Estatística Descritiva ou Dedutiva (a Estatística do D!). Daí, uma forma de organizar os dados brutos consiste em dispor estes dados em uma ordem crescente ou decrescente. Daí, rol nada mais é que a ordenação dos dados brutos, de um modo crescente ou decrescente. Uma questão de prova afirmava apenas que o rol é um arranjo dos dados brutos. E aí, certo ou errado? Vejamos que arranjo pode ser qualquer forma de dispor os dados. Para ser rol, teria a questão que falar em arranjo em ordem crescente ou decrescente. Errado, portanto, este item.
Æ Séries Estatísticas: São nada mais que tabelas, as quais expressam o resultado de um estudo estatístico. Se, olhando para esta tabela, pudermos identificar três elementos, quais sejam: o objeto do estudo, o local e a época da pesquisa, então estaremos diante de uma série estatística. É, portanto, uma maneira de apresentar os dados estatísticos, de uma forma tabulada. São três, pois, os elementos de uma série estatística: 1) o fato: é o fenômeno que foi investigado, e cujos valores estão sendo apresentados na tabela; 2) o local: indica o âmbito geográfico ou a região onde o fato aconteceu; 3) a época: refere-se ao período, data ou tempo, quando o assunto foi investigado. Logo, ao apresentarmos uma série estatística, devemos apresentar respostas às seguintes perguntas: O quê? Quando? Onde? Tais perguntas serão respondidas, respectivamente, pelos elementos: descrição do fato, época e local. Na série estatística haverá sempre um elemento que sofrerá variações. A partir deste elemento, estabeleceremos uma classificação para as séries estatísticas.
Æ Classificação das Séries Estatísticas: Dependendo do elemento que varia e dos elementos que permanecem fixos, as séries serão classificadas em: Históricas, Geográficas, Específicas e Distribuição de Freqüências. Serão chamadas Séries Históricas aquelas cujo elemento que sofrerá variação é a época, permanecendo fixos o local e a descrição do fenômeno. Vejamos o exemplo abaixo:
PRODUÇÃO DE MINÉRIO DE MANGANÊS ---- PARÁ Anos Quantidade (*) (*) Valores hipotéticos. (toneladas) 1978 12.104.375 1979 13.072.942 1980 18.739.223 1981 16.435.838 ESTATÍSTICA
**** Ponto 2 – PRIMEIROS CONCEITOS ****
Pág. 6 de 7
Observemos que, olhando esta tabela acima, saberemos dizer qual foi o fenômeno estudado, qual o local e a época da pesquisa. Verificamos ainda que,
destes elementos, o objeto do estudo é fixo fixo (Pará), porém a época da pesquisa varia isso, que se trata de uma série histórica. Existem alguns sinônimos para este tipo ser cuidadosamente memorizados, para o caso séries cronológicas, temporais ou de marcha.
(produção de manganês), o local é de 1978 a 1981, determinando, por de série estatística, e que devem de uma questão teórica. São eles:
Serão chamadas Séries Geográficas aquelas cujo elemento variável será o local, permanecendo fixos o tempo e a descrição do fenômeno. São igualmente chamadas de séries espaciais, territoriais ou de localização. Convém dedicarmos especial atenção a estes sinônimos! Vejamos o exemplo abaixo: PRODUTO INTERNO BRUTO - 1980 Países US$ (*) valores hipotéticos. (bilhões) (*) Holanda 126,3 Itália 106,3 França 103,6 Portugal 92,0 Verifica-se, facilmente, que são fixos o fenômeno estudado (produto interno bruto) e a época da pesquisa (1980). Todavia, o elemento local sofre variação, caracterizando, por isso, esta série estatística como série geográfica. Chamar-se-ão Séries Específicas aquelas cuja descrição do fenômeno sofrerá variação, permanecendo fixos os elementos local e tempo. Recebem ainda os sinônimos de séries especificativas ou categóricas. Analisemos o exemplo abaixo: Número de alunos concludentes. UFPE – 2000 Cursos n.º alunos (*) (*) valores hipotéticos Direito 238 Medicina 125 Engenharia 74 Estatística 1 Observemos que permanecem fixos o local da pesquisa (UFPE – Universidade Federal de Pernambuco) e a época (ano 2000). Todavia, o fenômeno estudado está sofrendo uma variação, em diversas categorias (daí o nome categóricas), dando ensejo a esta classificação das séries específicas. A quarta e última espécie de série estatística é, de longe, a mais importante delas. Trata-se da chamada Distribuição de Freqüências! A maioria das provas de estatística trabalha as questões tomando por base dados apresentados sob esta forma, ou seja, dados dispostos na Distribuição de Freqüências. Por este motivo, daremos redobrada ênfase a este tópico, reservando, inclusive, uma aula inteira para tratarmos deste assunto. Na Distribuição de Freqüências, os dados são ordenados segundo um critério de magnitude, em classes ou intervalos, permanecendo fixos o fato, o local e a época. Isto é, embora o fenômeno estudado seja único, este sofrerá uma subdivisão em classes! Vejamos o exemplo a seguir:
ESTATÍSTICA
**** Ponto 2 – PRIMEIROS CONCEITOS ****
Altura dos alunos do curso X. – 27/08/2002 Alturas (m) Nº de alunos 1,50 |----- 1,60 14 1,60 |----- 1,70 29 1,70 |----- 1,80 37 1,80 |----- 1,90 18
Pág. 7 de 7
1,90
|----- 2,00
2
Observemos que o fenômeno estudado é único (altura dos alunos), todavia está se subdividindo em várias classes! Temos, pois, a classe dos alunos com altura variando entre 1,50m e 1,60m; a classe dos alunos com altura entre 1,60m e 1,70m, e assim por diante. Quando formos detalhar, em uma próxima aula, a Distribuição de Freqüências, voltaremos a falar sobre as classes e sobre todos os demais elementos deste tipo de série estatística! OK! Chega de teoria por hoje... Ficamos agora com algumas questões de concursos, e o gabarito comentado iniciará a aula seguinte. Até lá, e um grande abraço! EXERCÍCIOS DE HOJE 1. (TCU-93) Assinale a opção correta: a) Estatística Inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos. b) O processo utilizado para se medir as características de todos os membros de uma dada população recebe o nome de censo. c) A Estatística Descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma população com base na observação de uma amostra. d) Uma população só pode ser caracterizada se forem observados todos os seus componentes. e) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória. 2. (TCDF-95) Assinale a opção correta: a) Em Estatística, entende-se por população um conjunto de pessoas. b) A variável é discreta quando pode assumir qualquer valor dentro de determinado intervalo. c) Freqüência relativa de uma variável aleatória é o número de repetições dessa variável. d) A série estatística é cronológica quando o elemento variável é o tempo. e) Amplitude total é a diferença entre dois valores quaisquer do atributo. 3. (TTN-94) Marque a opção correta: a) Um evento tem, no mínimo, dois elementos de espaço-amostra de um experimento aleatório. b) Em um experimento aleatório uniforme todos os elementos do espaço-amostra são iguais. c) Dois experimentos aleatórios distintos têm, necessariamente, espaços-amostra distintos. d) Uma parte não-nula do espaço-amostra de um experimento aleatório define um evento. e) Um experimento aleatório pode ser repetido indefinidamente, mantidas as condições iniciais.
ESTATÍSTICA
*** PONTO 3 – Distribuição de Freqüências ***
Página 1 de 8
DISTRIBUIÇÃO DE FREQÜÊNCIAS Conforme combinado na aula passada, iniciamos hoje com o comentário dos exercícios que ficaram. Vamos a eles: 1. (TCU-93) Assinale a opção correta: a) Estatística Inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos. FALSO. Vimos que síntese é a palavra que resume as primeiras etapas do processo estatístico (coleta, organização e descrição dos dados), que fazem parte da Estatística Dedutiva (a Estatística do D). b) O processo utilizado para se medir as características de todos os membros de uma dada população recebe o nome de censo. VERDADEIRO. É exatamente o conceito de censo, que abrange a totalidade dos elementos da população investigada. c) A Estatística Descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma população com base na observação de uma amostra. FALSO. Análise dos dados e tomada de decisões são as etapas finais do processo estatístico, e pertencem à Estatística Indutiva ou Inferencial (a Estatística do I). Percebamos que os itens (a) e (c) vieram com os conceitos invertidos! d) Uma população só pode ser caracterizada se forem observados todos os seus componentes. FALSO. Vimos que existe a possibilidade de se trabalhar apenas com uma parte da população, um subconjunto, que deverá ser representativo do todo. Estamos falando da amostra, e o estudo correspondente, a amostragem. e) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória. FALSO.
2. (TCDF-95) Assinale a opção correta: a) Em Estatística, entende-se por população um conjunto de pessoas. FALSO. De graça esta! Faltam aqui as duas características que definem uma população: o interesse em se extrair dela uma informação e que todos os seus elementos tenham ao menos uma característica comum. b) A variável é discreta quando pode assumir qualquer valor dentro de determinado intervalo. FALSO. É esse justamente o conceito de variável contínua (aquela que se mede!). Contrariamente, a variável discreta ou descontínua (aquela que se conta) não pode assumir qualquer valor. c) Freqüência relativa de uma variável aleatória é o número de repetições dessa variável. FALSO. Ainda não falamos sobre isso. Este assunto, dos tipos de freqüências, só será visto na quarta aula, então vamos por eliminação!
ESTATÍSTICA
*** PONTO 3 – Distribuição de Freqüências ***
Página 2 de 8
d) A série estatística é cronológica quando o elemento variável é o tempo. VERDADEIRO. Isso já vimos e está totalmente de acordo. Só recordando, outros sinônimos de série cronológica são: séries temporais, históricas ou de marcha. Nelas, o elemento que sofre variação é a época. e) Amplitude total é a diferença entre dois valores quaisquer do atributo. FALSO. Também não falamos ainda sobre Amplitude Total, mas por eliminação já matamos que é falsa. Este conceito surgirá no final da aula de hoje! Então, após estudar a presente aula, retorne a este item para comprovar que está errado!
3. (TTN-94) Marque a opção correta: a) Um evento tem, no mínimo, dois elementos de espaço-amostra de um experimento aleatório. FALSO. Para resolver esta questão, vamos nos lembrar da Teoria do Dado. O Evento é o resultado do experimento aleatório. Joguei o dado e deu {5}. Logo, {5} é o evento. Ora, {5} é apenas um dos elementos do Espaço Amostral deste experimento, logo a opção é incorreta. b) Em um experimento aleatório uniforme todos os elementos do espaço-amostra são iguais. FALSO. Inclusive já comentamos este item na aula passada. Se todos os elementos do Espaço Amostral fossem iguais, já se poderá conhecer, a priori, qual será o resultado do Experimento Aleatório. Isso vai de encontro, como sabemos, ao próprio conceito de Experimento Aleatório. c) Dois experimentos aleatórios distintos têm, necessariamente, espaços-amostra distintos. FALSO. Tomemos dois experimentos aleatórios distintos: o lançamento do dado A, e o lançamento do dado B. Lancei o dado A, e o resultado, ou seja, o evento foi {3}. Lancei o dado B, e o resultado foi, adivinhem, {3} também. O “necessariamente” do enunciado matou o item... d) Uma parte não-nula do espaço-amostra de um experimento aleatório define um evento. FALSO. Esta é boa! Bastante sutil! Para entendê-la tínhamos que lembrar que Espaço Amostral e Evento são conceitos que surgem em momentos distintos. Ou seja, o Espaço Amostral é conhecido antes da realização do Experimento Aleatório; enquanto que Evento só é conhecido após a sua realização. Daí, podemos passar o resto da vida a jogar um dadinho na mesa, e nunca – em tempo algum – o resultado dar {5}. Ou seja, um valor do Espaço Amostral, enquanto não se tornar resultado de um Experimento Aleatório, jamais será tomado por Evento. e) Um experimento aleatório pode ser repetido indefinidamente, mantidas as condições iniciais. VERDADEIRO. O item mais fácil da questão. Quem começou a resolvê-la de trás para frente, matou esta questão na hora! Temos aqui apenas uma parte do conceito de Experimento Aleatório. A bem da verdade, as últimas provas da ESAF não têm exigido diretamente os conceitos que aprendemos na aula passada. Todavia, não poderíamos jamais deixar de conhecê-los, por serem o alicerce do programa.
ESTATÍSTICA
*** PONTO 3 – Distribuição de Freqüências ***
Página 3 de 8
Hoje, mergulharemos na Distribuição de Freqüência, para conhecê-la aprofundadamente. Não tenho receio em afirmar que estas primeiras aulas são as mais importantes do nosso curso. Em breve, comprovaremos isso mais concretamente! Vamos à Distribuição de Freqüências... Conforme vimos na aula passada, a Distribuição de Freqüências é um tipo de série estatística, ou seja, uma tabela que informa o resultado de uma pesquisa estatística, de forma que, olhando-se para ela, sabe-se o objeto da pesquisa – a variável –, além do local e da época em que foi esta pesquisa realizada. Vimos também que, na Distribuição de Freqüências, a variável estudada é única, não varia; contudo, esta mesma variável estará subdividida em classes. A grande maioria dos livros e apostilas ensina a forma de se construir uma Distribuição de Freqüências, a partir dos elementos fornecidos. Aqui nos diferenciaremos destes autores, por uma razão bem simples: se o programa do concurso já pede que se calcule tantas e tantas medidas, então o elaborador não vai querer que você perca tempo para construir a Distribuição. Ela já vem pronta, ou quase! Veremos nas duas próximas aulas que existe, sim, um trabalho preliminar a ser feito na Distribuição de Freqüências, que diz respeito às colunas de freqüência, e que deve anteceder à resolução da prova. Mas isso só aprenderemos nas aulas que virão! Partiremos, portanto, de uma Distribuição de Freqüências já fornecida. Vejamos abaixo um exemplo, que nos mostra a variável “altura” dos alunos de uma classe. Altura dos alunos (m) 1,50 |⎯ 1,60 1,60 |⎯ 1,70 1,70 |⎯ 1,80 1,80 |⎯ 1,90 1,90 |⎯ 2,00 Total
Freqüências 6 11 19 10 4 50
Observe que neste exemplo, trabalhamos com a variável “estatura”, a qual classifica-se, conforme já visto, como uma variável quantitativa contínua! O entendimento das mesas elaboradoras, para efeito de uma questão teórica, é que em uma Distribuição de Freqüências só se pode trabalhar com variáveis contínuas, nunca com as discretas. Obviamente adotaremos esta corrente. Olhando a tabela acima, talvez surja a pergunta: onde estão as identificações de lugar e época da pesquisa, que devem constar numa série estatística? O questionamento procede, porém saibamos, desde já, que muitas questões de prova costumam trazer apenas a tabela, com as classes e freqüências, sem maiores esclarecimentos acerca sequer da variável que se está apresentando. Daí, concluímos: para identificar que os dados apresentados estão em forma de uma Distribuição de Freqüências, bastará observar o fato de os elementos estarem agrupados em classes. Se estiverem agrupados em classes, pronto: é uma Distribuição de Freqüências.
ESTATÍSTICA
*** PONTO 3 – Distribuição de Freqüências ***
Página 4 de 8
Analisemos, agora, detalhadamente, cada um dos elementos de uma Distribuição de Freqüências. Posso afirmar, sem medo de cometer exageros, que este tópico é a base da resolução de uma prova de estatística. Sem se dominar, sem se conhecer a fundo estes elementos de uma Distribuição, pouco se pode fazer numa prova!
Æ Classes: Consistem em um conceito intuitivo: são aquelas subdivisões dos elementos do conjunto. As classes são sempre definidas por dois limites – inferior e superior. No exemplo das alturas dos alunos, temos que aquela distribuição apresenta cinco classes. Vemos que a primeira classe é a que vai de 1,50m a 1,60m; a segunda classe vai de 1,60m a 1,70m e assim por diante. A quinta classe vai de 1,90m a 2,00m. Não há dificuldades em identificar as classes de uma Distribuição de Freqüências. Aprenderemos em breve que convém verificar se o número de classes da Distribuição é par ou ímpar, para efeito de analisar a existência de simetria no conjunto. (Veremos isso a seu tempo!).
Æ Intervalo de Classe: Existe uma diferença sutil entre o que entendemos por classe e por intervalo de classe! Um exemplo simples elucidará o fato: se tomarmos, por exemplo, a quarta classe do nosso exemplo de Distribuição de Freqüências, veremos que esta classe vai de 1,80m a 1,90m. Eis a questão: um aluno que meça exatamente 1,90m integrará esta quarta classe? Ora, olhando-se atentamente, vemos que este valor 1,90m também faz parte da quinta classe (como limite inferior!). E aí? O aluno com 1,90m será computado na quarta ou na quinta classe? Aí é que entra o conceito de intervalo de classe! Dependendo da nomenclatura utilizada pela questão para construir as classes, teremos definidos os intervalos de classe, e saberemos responder à questão colocada. São as seguintes as nomenclaturas possíveis para o intervalo: i) 1,80 |⎯ 1,90 : diz-se intervalo fechado à esquerda e aberto à direita. O tracinho na vertical indica intervalo fechado; a ausência deste tracinho indica intervalo aberto. O intervalo fechado significa inclusão, enquanto o intervalo aberto significa exclusão. Daí, neste caso, teremos que o presente intervalo inclui o limite inferior desta classe e exclui o seu limite superior. Logo, um aluno com exatamente 1,90m não estaria participando desta classe. Note bem: para este exemplo, a classe vai de 1,80m a 1,90m; porém, o intervalo de classe vai somente de 1,80m a 1,89m. ii) 1,80 ⎯| 1,90 : aqui temos a situação inversa, ou seja, intervalo aberto à esquerda e fechado à direita. Esta nomenclatura implica na exclusão do limite inferior e inclusão do limite superior da classe. Neste caso, aquele aluno de exatos 1,90m estaria participando desta classe, cujo intervalo está variando de 1,81m a 1,90m. iii) 1,80 |⎯| 1,90 : intervalo fechado à esquerda e à direita. Vêem-se aqui incluídos neste intervalo tanto o limite inferior quanto o limite superior da classe. É o único caso em que o intervalo de classe se confunde com a própria classe. Um aluno com 1,90m estaria participando desta classe, bem como um aluno com 1,80m. ESTATÍSTICA
*** PONTO 3 – Distribuição de Freqüências ***
Página 5 de 8
iv) 1,80 ⎯ 1,90 : intervalo aberto à esquerda e à direita. Excluem-se deste intervalo ambos os limites – inferior e superior –
da classe. Neste caso, somente seriam computados nesta classe alunos cuja altura variasse entre 1,81m a 1,89m. Conhecidas as possibilidades para a definição dos intervalos de classes, uma boa notícia: 99,99% das Distribuições de Freqüências presentes nas questões de concurso usam uma mesma nomenclatura para esta definição, qual seja: intervalo fechado à esquerda e aberto à direita (linf |⎯ lsup ). Esta é a nomenclatura clássica, incluindo-se no intervalo o limite inferior da classe e excluindo-se o superior. Considerando-se, pois, esta nomenclatura clássica, observamos que, uma vez que o limite superior da classe não está incluído no intervalo, faz-se necessário que o limite inferior da classe seguinte seja, necessariamente, igual ao limite superior da classe precedente. Se assim não fosse, haveria uma descontinuidade, e como já foi citado, trabalhamos aqui com dados contínuos! Em palavras mais fáceis: onde acaba uma classe, começa a próxima! Ou ainda: o limite superior de uma classe coincide com o limite inferior da classe seguinte. Observemos: Altura dos alunos 1,50 |⎯ 1,60 1,60 |⎯ 1,70 1,70 |⎯ 1,80 1,80 |⎯ 1,90 1,90 |⎯ 2,00
Æ Limites de uma classe: São os seus extremos, mais conhecidos como limite inferior (linf) e limite superior (lsup). Já vimos que classe nem sempre é o mesmo que intervalo de classe, todavia, para se definir os limites (inferior e superior) de uma classe, basta olhar onde ela começa e termina, não se levando em conta a questão do intervalo de classe. Por exemplo, para a seguinte classe: 1,80 |---- 1,90 , teremos que o limite inferior é 1,80 e o limite superior é 1,90. Só isso! Olhando para a Distribuição acima, qual seria o limite superior da quarta classe? Naturalmente que a resposta será 1,90! Æ Ponto Médio de uma Classe: Como o próprio nome indica, Ponto Médio é aquele elemento que está no meio da classe, ou seja, que divide a classe em duas partes iguais. Doravante, designaremos Ponto Médio por PM, e o calcularemos do seguinte modo:
PM =
l sup + l inf 2
Considerando a primeira classe do nosso exemplo: (1,50 |--- 1,60). Ora, neste caso até no olho se pode afirmar que entre 1,50 e 1,60 estará o 1,55, certo? Certíssimo! Ocorre que nem sempre dá para se dizer o resultado sem fazer as contas.
ESTATÍSTICA
*** PONTO 3 – Distribuição de Freqüências ***
Daí, faríamos: (1,50 + 1,60) / 2
=
3,10 / 2
Página 6 de 8
= 1,65 = PM
Construamos, agora, a coluna dos Pontos Médios da nossa Distribuição de Freqüências! Teremos o seguinte: Altura dos alunos 1,50 |⎯ 1,60 1,60 |⎯ 1,70 1,70 |⎯ 1,80 1,80 |⎯ 1,90 1,90 |⎯ 2,00
PM
1,55 1,65 1,75 1,85 1,95
Se observarmos bem, constataremos que os Pontos Médios de uma distribuição estão dispostos em uma progressão aritmética, ou seja, a diferença entre dois pontos médios consecutivos é sempre uma constante! Observemos que essa diferença entre dois pontos médios consecutivos, neste exemplo, é igual a 0,10 (gravemos este valor!). Guardemos, desde já, mais esta seguinte informação: o Ponto Médio é o legítimo representativo de uma classe, ou seja, é o elemento que melhor representa cada classe! Usaremos este dado no futuro. Æ Amplitude de um Intervalo de Classe: Tomaremos a palavra amplitude como sinônimo da palavra tamanho. Se estamos falando em amplitude da classe, trata-se do tamanho da classe. Um conceito muito simples e útil! Designaremos a amplitude da classe por h, e a determinaremos da seguinte maneira:
h = l sup − l inf Determinemos a amplitude das classes do nosso exemplo: 1,50 1,60 1,70 1,80 1,90
|--|--|--|--|---
1,60 1,70 1,80 1,90 2,00
Æ Æ Æ Æ Æ
h h h h h
= = = = =
1,60 1,70 1,80 1,90 2,00
– – – – –
1,50 1,60 1,70 1,80 1,90
Æ Æ Æ Æ Æ
h h h h h
= = = = =
0,10 0,10 0,10 0,10 0,10
Observamos, pois, que as classes todas têm mesma amplitude! Ou seja, o h é sempre o mesmo! Neste caso, o h é igual a 0,10 (já vimos este valor antes?). Ora, agora há pouco vimos que para esta mesma Distribuição a distância entre dois pontos médios consecutivos era igual a 0,10! Coincidência? Nenhuma! Concluímos que a diferença entre dois Pontos Médios consecutivos é igual à Amplitude da Classe! Daí, descobrimos uma nova forma, mais prática, de construir a coluna dos pontos médios: basta calcularmos o primeiro Ponto Médio – o PM da primeira classe –, e depois, sairmos somando sempre o valor da amplitude da classe h. Senão, vejamos: no nosso exemplo, o primeiro Ponto Médio é 1,55 e a amplitude da classe h=0,10. Teremos, pois:
ESTATÍSTICA
1,50 1,60 1,70 1,80 1,90
|--|--|--|--|---
1,60 1,70 1,80 1,90 2,00
Æ Æ Æ Æ Æ
*** PONTO 3 – Distribuição de Freqüências ***
PM PM PM PM PM
= = = = =
1,55 1,65 1,75 1,85 1,95
Æ Æ Æ Æ
1,55 1,65 1,75 1,85
+ + + +
0,10 0,10 0,10 0,10
= = = =
1,65 1,75 1,85 1,95
= = = =
o o o o
Página 7 de 8
próximo próximo próximo próximo
PM! PM! PM! PM!
Descobriremos agora algumas relações possíveis que envolvem Ponto Médio, Amplitude da Classe e os limites inferior e superior de uma classe! Imaginemos que a classe é a reta seguinte, iniciando no limite inferior e terminando no limite superior. Vejamos: linf |
lsup |
Agora lembremo-nos que o Ponto Médio – PM – é aquele elemento que está no centro da classe. Então teremos: linf |
PM |
lsup |
Agora nos lembramos: Amplitude é o mesmo que tamanho. O tamanho da classe é o h. Vejamos também que, uma vez que o Ponto Médio divide a classe em duas partes iguais, a distância do limite inferior até o PM será (h/2); assim como será (h/2) a distância do PM até o limite superior. Teremos: h/2 linf |
h/2 PM |
lsup |
h Apenas olhando para a figura acima, concluímos que o limite superior de uma classe é o Ponto Médio do intervalo dessa classe somado com a metade da Amplitude de classe, ou seja:
⎛h⎞ l sup = PM + ⎜ ⎟ ⎝2⎠ Concluímos ainda que o limite inferior de uma classe é o Ponto Médio do intervalo dessa classe subtraído da metade da amplitude de classe, ou seja:
⎛h⎞ l inf = PM − ⎜ ⎟ ⎝2⎠ Æ Amplitude Total da Distribuição: Chamamos antes amplitude de tamanho. Logo, Amplitude Total, designada por AT, consiste simplesmente no tamanho do conjunto inteiro. É um conceito facílimo e há duas formas de se calcular.
ESTATÍSTICA
*** PONTO 3 – Distribuição de Freqüências ***
Página 8 de 8
A primeira forma é fazer o cálculo da diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo).
AT = L max− L min A segunda maneira de determinarmos a Amplitude Total será simplesmente multiplicarmos o valor da Amplitude da Classe – h – pelo número de classes da Distribuição. O resultado será o mesmo. AT = (número de classes).h Difícil é decidir qual destas duas maneiras é a mais fácil para se chegar ao valor da AT. Adiante veremos que a Amplitude Total é também considerada uma Medida de Dispersão! A seu tempo... De conversa por hoje já chega!!! Agora, passemos aos exercícios... Gabarito comentado, você já sabe, só no início da próxima aula. Até lá, e um grande abraço! EXERCÍCIOS DE HOJE 1. Para o conjunto abaixo, determine o que se pede: Xi fi 10 !--- 25 2 25 !--- 40 7 40 !--- 55 11 55 !--- 70 13 70 !--- 85 8 85 !--- 100 4 a) Qual a amplitude da classe? b) Qual a amplitude total? c) Construa a coluna dos Pontos Médios 2. Se os pontos médios de uma distribuição de freqüências dos pesos dos estudantes de uma classe são: 52, 58, 64, 70, 76 e 82, determine a amplitude e os limites da quinta classe: a) 5; (61 !--- 66) b) 6; (73 !--- 79) c) 5; (79 !--- 84) d) 6; (67 !--- 73)
ESTATÍSTICA
*** PONTO 4 - TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS ***
Pág. 1 de 9
TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS Oi, pessoal! Vamos retomar, pelos exercícios que ficaram da aula passada. 1. Para o conjunto abaixo, determine o que se pede: Xi fi 10 !--- 25 2 25 !--- 40 7 40 !--- 55 11 55 !--- 70 13 70 !--- 85 8 85 !--- 100 4 Sol.: Questão das mais fáceis, apenas para efeitos de fixação! a) Qual a amplitude da classe? Resp.) h=15 Basta lembrar que “amplitude da classe = tamanho da classe”. Daí: (25-10=15; 40-25=15; ...) b) Qual a amplitude total? Resp.) AT=90 Claro! Amplitude Total é o tamanho de todo o conjunto. Assim, podemos fazer: (Lsup – Linf)=100–10=90, ou ainda AT={h.(número de classes)}=6x15=90 c) Construa a coluna dos Pontos Médios Resp.) Basta fazermos a conta do PM para a primeira classe (a mais de cima), e daí, sairmos somando com o valor do h, que é 15. Vejamos:
10 25 40 55 70 85
Xi !--!--!--!--!--!---
25 40 55 70 85 100
fi 2 7 11 13 8 4
PM 17,5 32,5 47,5 62,5 77,5 92,5
Æ Æ Æ Æ Æ Æ
(10+25)/2 (17,5 + 15) (32,5 + 15) (47,5 + 15) (62,5 + 15) (77,5 + 15)
2. Se os pontos médios de uma distribuição de freqüências dos pesos dos estudantes de uma classe são: 52, 58, 64, 70, 76, 82, determine a amplitude e os limites da quinta classe: a) 5; (61 !--- 66) b) 6; (73 !--- 79) c) 5; (79 !--- 84) d) 6; (67 !--- 73) Sol.: Aqui precisamos lembrar dos conceitos e da relação que existe entre Amplitude de Classe – h – e os Pontos Médios – PM. Sabemos que a distância entre dois Pontos Médios é igual à Amplitude da Classe. Assim, já matamos que o h=6. (58-52=6; 64-58=6; 70-64=6 e assim por diante).
ESTATÍSTICA
*** PONTO 4 - TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS ***
Pág. 2 de 9
Ora, conhecendo o h, trabalharemos para descobrir a primeira classe, cujo PM é igual a 52. Façamos o desenho desta classe, para podermos enxergar melhor: (h/2)=3
(h/2)=3
linf |
PM=52 |
lsup |
h=6 Daí, tomaremos aquelas duas relações entre PM, Amplitude h e os limites da classe, quais sejam...
⎛h⎞ l sup = PM + ⎜ ⎟ ⎝2⎠
e
⎛h⎞ l inf = PM − ⎜ ⎟ ⎝2⎠
... e chegaremos aos seguintes valores: Æ lsup = (52 + 3) = 55
e
linf = (52 – 3) = 49
Pronto! Conhecendo a primeira classe, praticamente matamos a questão! Vamos desenhar a estrutura desta Distribuição de Freqüências, e ver o que já temos: 49 ? ? ? ? ?
Xi !--!--!--!--!--!---
55 ? ? ? ? ?
PM 52 58 64 70 76 82
Como já sabemos da aula passada, onde acaba uma classe começa a próxima, ou seja, o limite superior de uma classe é igual ao limite inferior da classe seguinte. Logo, na segunda classe, o limite inferior será 55, ok? Daí, ficaremos assim:
49 55 ? ? ? ?
Xi !--!--!--!--!--!---
55 ? ? ? ? ?
PM 52 58 64 70 76 82
Para completar a segunda classe, ou seja, para descobrir o seu limite superior, bastará somar o limite inferior com a Amplitude da Classe, o h. Não é claro isso? Teremos que, para esta segunda classe, lsup = 55 + 6 = 61.
ESTATÍSTICA
*** PONTO 4 - TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS ***
Pág. 3 de 9
Ficaremos agora com: 49 55 ? ? ? ?
Xi !--!--!--!--!--!---
55 61 ? ? ? ?
PM 52 58 64 70 76 82
Para determinarmos o restante das classes, só precisaremos continuar com este mesmo procedimento: Æ O limite inferior da classe é igual ao limite superior da classe anterior; e Æ o limite superior da classe é o seu limite inferior somado à Amplitude da Classe, h. Daí, ao final, teremos a seguinte Distribuição de Freqüências: 49 55 61 67 73 79
Xi !--!--!--!--!--!---
55 61 67 73 79 85
PM 52 58 64 70 76 82
A questão perguntou a respeito da quinta classe, e as respostas são as seguintes: Resp.) h=6 ; linf=73 e lsup=79 Æ Letra B.
Entraremos neste instante em um tópico crucial do programa: o conhecimento dos diferentes tipos de freqüências – as colunas de freqüência – que podem ser construídas e utilizadas em uma Distribuição! Direi porque este tópico é fundamental: sem saber como trabalhar com as colunas de freqüências, de nada servirá conhecermos todas as fórmulas que usaremos na prova; corremos o risco de errar uma questão após a outra...! Agora que consegui prender sua atenção, vamos ao que interessa. Por primeiro, saibamos que trabalharemos com freqüências que podem ser absolutas ou relativas. Designadas pela letra f, minúscula ou maiúscula, como segue: f Æ Freqüência Absoluta. F Æ Freqüência Relativa. O que diferencia a freqüência absoluta (f) da freqüência relativa (F) é o fato de que, na absoluta trabalha-se com número de elementos; enquanto que na relativa trabalha-se com percentual de elementos! Logo entenderemos isso melhor! Existem seis tipos de freqüências, sendo três freqüências absolutas e três freqüências relativas! São elas as seguintes:
ESTATÍSTICA
*** PONTO 4 - TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS ***
Absolutas
fi fac fad
Æ freqüência absoluta simples Æ freqüência absoluta acumulada crescente Æ freqüência absoluta acumulada decrescente
Relativas
Fi Fac Fad
Æ freqüência relativa simples Æ freqüência relativa acumulada crescente Æ freqüência relativa acumulada decrescente
Pág.4 de 9
Aprenderemos como se construir essas colunas de freqüências e o significa cada uma delas! Antes, porém, é preciso conhecer o Caminho Pedras, que será usado para se construir tais freqüências. Ei-lo:
que das
fad fi
⇒
fad
Caminho das Pedras!
Fac Fi Fad Este caminho indica o seguinte: a freqüência absoluta simples, fi, é a mãe, por assim dizer, direta ou indiretamente, de todos os outros tipos de freqüências. São diretamente originadas por ela (fi) as freqüências absolutas acumuladas, crescente (fac) e decrescente (fad), bem como a freqüência relativa simples (Fi)! Desta última originam-se as freqüências relativas acumuladas, crescente (Fac) e decrescente (Fad). Além de ser a mãe das demais freqüências, a absoluta simples (fi) é a mais importante delas: seu conhecimento se faz necessário na determinação de praticamente tudo o que se costuma cobrar numa prova de Estatística, como cálculo da média, moda, mediana, desvio-padrão, variância, coeficiente de variação, medidas de assimetria, medidas de curtose, medidas separatrizes etc. Daí a pergunta: se a fi é assim tão essencial numa prova, será ela sempre fornecida pelas questões? Eis o ponto! Até alguns anos atrás, era já um fato costumeiro que os enunciados trouxessem (de bandeja) a coluna da fi. Tornou-se algo tão comum, que muita gente foi surpreendida quando isso deixou de acontecer! De fato, em provas ocorridas nos últimos três ou quatro anos, os enunciados passaram a fornecer outras freqüências, que não a fi, embora as questões continuassem a exigir todas aquelas medidas cujo conhecimento da freqüência absoluta simples seria essencial. E então? Como proceder? Simples! Basta percorrer o caminho das pedras ao contrário, ou seja, o caminho de volta, para se chegar da freqüência fornecida à freqüência absoluta simples. Vamos antes conhecer cada uma das freqüências!
Æ Freqüência Absoluta Simples (fi) Indica, classe.
simplesmente,
quantos
elementos
do
conjunto
pertencem
a
cada
ESTATÍSTICA
*** PONTO 4 - TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS ***
Pág. 5 de 9
Tomemos nosso exemplo dos alunos de uma sala de aula: Altura 1,50 1,60 1,70 1,80 1,90
dos alunos |⎯ 1,60 |⎯ 1,70 |⎯ 1,80 |⎯ 1,90 |⎯ 2,00 Total
fi
6 11 19 10 4 50
A fi da primeira classe é 6, o que indica que há 6 elementos do conjunto que participam da primeira classe. Traduzindo, para este caso: há 6 alunos com altura entre 1,50m e 1,60m (na verdade, até 1,59m! Vide intervalo de classe!) A fi da segunda classe é 11, ou seja, há 11 elementos do conjunto que participam da segunda classe. Ou ainda: são 11 alunos que medem entre 1,60m e 1,70m (mais precisamente, até 1,69m). E assim por diante! Uma observação importante: a soma das freqüências absolutas simples é chamada de freqüência total ou tamanho do conjunto e corresponde, obviamente, ao número total de elementos do conjunto. Este total de elementos é, geralmente, designado pela letra n. No nosso exemplo, temos que n = 50, ou seja, nosso conjunto tem 50 elementos (50 alunos na sala!). Quando a questão apresentar a Distribuição de Freqüências já com a coluna da fi construída, então ótimo! Já poderemos até começar a resolver nossa prova! Contudo, quando isto não acontecer e, em vez de ser fornecida a fi, a prova trouxer uma das outras freqüências – fac, fad, Fi, Fac ou Fad – será necessário, antes que se inicie a resolução das questões, que se determine a coluna da fi, perfazendo o caminho de volta do Caminho das Pedras!
Æ Freqüência Absoluta Acumulada Crescente (fac) A fac é de fácil compreensão se utilizarmos um exemplo! Primeiramente, aprendamos como se constrói esta coluna de freqüência. Pelo caminho das pedras, sabe-se que isto se faz partindo-se da fi. Precisamos saber que a fac tem um apelido, qual seja, a freqüência do “abaixo de”. Como seu apelido é “abaixo de”, indicaremos esta coluna também com uma setinha para baixo, e assim, lembraremos que ela será construída de cima para baixo (no mesmo sentido da seta!). Tudo o que precisamos saber é que, na primeira classe (a mais de cima), a freqüência absoluta acumulada crescente (fac) tem o mesmo valor que a freqüência simples (fi)! Vejamos: Altura dos alunos 1,50 1,60 1,70 1,80 1,90
|⎯ |⎯ |⎯ |⎯ |⎯ Total
1,60 1,70 1,80 1,90 2,00
fi
6 11 19 10 4 n=50
fac ↓ 6 . . . .
ESTATÍSTICA
*** PONTO 4 - TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS ***
Pág. 6 de 9
Agora, para construir o restante da coluna da fac, nos bastará apenas somar com a diagonal. Portanto, somaremos a fac com a próxima fi, ou seja, somaremos com a fi da classe seguinte! Vejamos:
Altura dos alunos
fac ↓ 6 (= à primeira fi)
1,50
|⎯
1,60
fi 6
1,60
|⎯
1,70
11
17
(= 6 + 11)
1,70
|⎯
1,80
19
36
(= 17 + 19)
10
46
(= 36 + 10)
1,80
|⎯
1,90 4
50
(= 46 + 4)
1,90
|⎯ Total
2,00 n=50
Se você é bom observador (e eu já dei uma forcinha...), já terá visto que a fac da última classe é igual ao total de elementos do conjunto (n)! Isso não foi mera coincidência! Se ao construir a fac, o último valor dessa coluna for diferente do n, então refaça suas contas. Como se vê, não há dificuldades em se construir a coluna da fac! Repetese, na primeira classe, a freqüência simples (fi), e daí soma-se sempre com a diagonal também da fi. Agora, vejamos o significado desta freqüência absoluta acumulada crescente: conforme o próprio apelido desta freqüência indica, a fac de uma classe significa o número de elementos do conjunto que tem valor abaixo do limite superior da própria classe! Tomando o nosso exemplo, se perguntarmos quantos alunos desta classe tem estatura abaixo de 1,80m, veremos que participam da resposta as freqüências envolvidas nas três primeiras classes desta Distribuição. Sendo que há 6 alunos na primeira classe, 11 alunos na segunda classe e 19 alunos na terceira. Somadas as freqüências simples destas três classes (6+11+19), chegamos a um total de 36 alunos. Exatamente o valor da freqüência absoluta acumulada crescente da terceira classe! Ou seja, o valor 36 da fac da terceira classe significa que existem 36 alunos com altura abaixo de 1,80m (que é o limite superior desta terceira classe)! Não é fácil? De novo: o que significa o valor 46 que está na fac da quarta classe? Significa que há 46 alunos com altura abaixo de 1,90m (limite superior desta quarta classe)! OK? Como dito anteriormente, teremos, na resolução da prova, que conhecer a freqüência absoluta simples – fi. Precisaremos desta fi para calcular quase tudo o que as questões irão pedir! Logo, se na prova vier uma Distribuição de Freqüências que forneça a freqüência absoluta acumulada crescente – fac – em vez da freqüência simples, não poderemos começar a resolver nada, antes de encontrar a fi. Acima, aprendemos a construir a fac partindo da fi. Estávamos seguindo o caminho das pedras. Agora, faremos o caminho de volta: fac para fi!
ESTATÍSTICA
*** PONTO 4 - TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS ***
Pág. 7 de 9
Vejamos: Altura dos alunos 1,50 |⎯ 1,60 1,60 |⎯ 1,70 1,70 |⎯ 1,80 1,80 |⎯ 1,90 1,90 |⎯ 2,00 Total
fac
fi
6 17 36 46 50
? ? ? ? ?
n=50
Neste caso, a volta do caminho das pedras se fará da seguinte forma: já sabemos que a fi e a fac têm, na primeira classe, o mesmo valor! Daí, repete-se a freqüência da primeira classe da fac na fi. Teremos: Altura dos alunos 1,50 |⎯ 1,60 1,60 |⎯ 1,70 1,70 |⎯ 1,80 1,80 |⎯ 1,90 1,90 |⎯ 2,00 Total
fac
fi
6 17 36 46 50
6 ? ? ? ?
n=50
Agora lembre-se: no caminho de volta do caminho das pedras nós não somaremos com a diagonal! Somar com a diagonal é o processo da ida no caminho das pedras! O caminho de volta é diferente! Trabalharemos com a coluna da fac, fazendo apenas uma subtração: próxima fac menos fac anterior! Só isso: próxima fac menos fac anterior. O resultado da subtração vai ser a freqüência absoluta simples, fi. Senão, vejamos: Altura dos alunos 1,50 |⎯ 1,60
fac
6
fi
6
1,60 |⎯
1,70
17 (17-6=)
11
1,70 |⎯
1,80
36 (36-17=)
19
1,80 |⎯
1,90
46 (46-36=)
10
1,90 |⎯ 2,00 Total
50 (50-46=)
4 n=50
Convém novamente ressaltar: antes de iniciarmos a resolução das questões, é preciso atentar para qual foi a freqüência fornecida. Caso tenha sido a freqüência absoluta simples (fi), então ótimo, já se poderá começar a resolver a prova. Caso contrário, não há o que pensar: será preciso encontrar a fi, antes de qualquer coisa!
ESTATÍSTICA
*** PONTO 4 - TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS ***
Pág. 8 de 9
Æ Freqüência Absoluta Acumulada Decrescente (fad) Aprenderemos, inicialmente, como se constrói a freqüência absoluta acumulada decrescente e, depois, qual o seu significado. Retomando o caminho das pedras vemos que também a fad será construída a partir da freqüência absoluta simples (fi). A freqüência absoluta acumulada decrescente (fad) também tem um apelido: freqüência do “acima de”. Com este apelido, usaremos para esta freqüência uma setinha apontada para cima! No mesmo sentido desta seta iremos construir esta coluna, ou seja, de baixo para cima. Desse modo, na última classe (a mais de baixo), a fad terá o mesmo valor que a fi. Vejamos: Altura dos alunos (m)
fi
fad ↑
1,50 1,60 1,70 1,80 1,90
6 11 19 10 4
. . . . 4
|⎯ |⎯ |⎯ |⎯ |⎯ Total
1,60 1,70 1,80 1,90 2,00
n=50
Para completar a coluna, basta subirmos sempre somando com a diagonal, ou seja, somando a fad com a próxima fi (a fi da diagonal), do modo abaixo descrito: Altura dos alunos
fi
fad ↑
1,50
|⎯
1,60
6
1,60
|⎯
1,70
11
44 (=33+11)
1,70
|⎯
1,80
19
33 (=14+19)
1,80
|⎯
1,90
10
14 (=4+10)
2,00
4
1,90
|⎯ Total
50 (=44+6)
4
n=50
Observe que, quando usamos o caminho das pedras para construir as freqüências acumuladas, utilizamos sempre esse artifício de somar na diagonal. No caso da fac, descemos somando com a fi da diagonal; no caso da fad, subimos! E agora, qual o significado desta coluna? Por exemplo, vamos descobrir o que significa o valor 33 da terceira classe da fad. Se perguntarmos quantos elementos do conjunto apresentam valor maior que 1,70m, ou seja, quantos alunos desta classe tem estatura acima de 1,70m, perceberemos que participam da resposta a terceira, a quarta e a quinta classes. Teremos, então, 19 alunos na terceira classe, 10 alunos na quarta classe e 4 alunos na quinta classe, totalizando 33 alunos, estes com altura maior (ou igual) a 1,70m. Se formos diretamente na coluna da freqüência absoluta acumulada decrescente, na linha correspondente à terceira classe, acharemos justamente este valor: 33.
ESTATÍSTICA
*** PONTO 4 - TRABALHANDO COM AS FREQÜÊNCIAS ABSOLUTAS ***
Pág. 9 de 9
Concluímos, pois, que a freqüência absoluta acumulada decrescente de uma classe (fad) indica o número de elementos do conjunto que tem valor acima do limite inferior desta mesma classe. Outro exemplo: vejamos o que significa o valor 14 constante na quarta classe da coluna da fad? Significa exatamente que existem 14 alunos na classe, com valor acima de 1,80m, que é o limite inferior desta quarta classe! Entendase este “acima de 1,80m” como “maior ou igual a 1,80m”. Fácil, não? Somente isso! As provas mais recentes têm trazido a seguinte cilada: fornecem a freqüência absoluta acumulada decrescente – fad – e pedem que sejam determinadas medidas de posição, de dispersão etc. Neste caso, obviamente, fazse imprescindível o conhecimento da freqüência absoluta simples – fi – como já foi dito anteriormente. Para isso, teremos que percorrer o sentido de volta do caminho das pedras. Partindo da última classe da coluna da fad (cuja freqüência é igual à da fi), faremos apenas uma subtração: próxima fad menos fad anterior! O resultado da subtração vai ser a freqüência absoluta simples, fi. Vejamos: Altura dos alunos 1,50 1,60 1,70 1,80 1,90
|⎯ |⎯ |⎯ |⎯ |⎯ Total
1,60 1,70 1,80 1,90 2,00
fad ↑
50 44 33 14 4
(50-44=) (44-33=) (33-14=) (14-4=)
fi
6 11 19 10 4 n=50
Agora, sim! Após construída a coluna da freqüência absoluta simples, estamos prontos para iniciarmos a resolução da prova. Em outras palavras: não basta ao candidato deter o conhecimento de todas as fórmulas (que já não são poucas!) das medidas de posição, dispersão, assimetria, curtose etc! É preciso saber trabalhar com as colunas de freqüência, sob pena de sair errando uma questão após outra, somente por uma desatenção! Ficamos hoje por aqui, tendo concluído a apresentação das freqüências absolutas. Próxima aula, conheceremos as freqüências relativas e a forma de trabalhar com elas. Deixarei os exercícios desta aula acumularem com os da aula seguinte, quando encerraremos esta teoria das colunas de freqüências. Até lá, e um grande abraço!
ESTATÍSTICA
*** Ponto 5 - TRABALHANDO COM AS FREQÜÊNCIAS RELATIVAS *** Pág. 1 de 7
TRABALHANDO COM AS FREQÜÊNCIAS RELATIVAS Oi, minha gente! Como não ficaram exercícios remanescentes da aula passada, partiremos imediatamente para o assunto de hoje, dando seqüência ao estudo das colunas de freqüência.
Æ Freqüência Relativa Simples (Fi) Agora que conhecemos as três colunas de freqüências absolutas, passaremos às freqüências relativas. O que as diferencia – freqüências absolutas e relativas – é o fato de que as absolutas indicam (como o próprio nome sugere) valores absolutos, ou seja, indicam o número de elementos; enquanto que as relativas indicam percentuais de elementos. Designam-se as freqüências simples com a letra “f ” (minúscula) e as relativas pela maiúscula “F”. Daí, não podemos nos esquecer: se a questão trata de número de elementos, pensaremos em freqüências absolutas; se a questão trata de percentual de elementos, pensaremos em freqüências relativas. A primeira coluna de freqüência relativa que veremos é a Freqüência Relativa Simples – Fi, que será originada a partir da freqüência absoluta simples fi (conforme ilustra o caminho das pedras!) e, por sua vez, dará origem aos dois outros tipos de freqüência relativa. Relembremos esta parte do caminho das pedras: Fac fi
Fi Fad
A freqüência relativa simples – Fi – será determinada por meio de uma conta, uma divisão, que é a seguinte:
⎛ fi ⎞ ⎟ Fi = ⎜ ⎜ ∑ fi ⎟ ⎝ ⎠ Onde fi é a freqüência absoluta simples da classe, e Σfi (somatório da freqüência absoluta simples) é o número de elementos do conjunto, ou seja, é o nosso “n”. Já vimos que este “n” será encontrado simplesmente somando-se a coluna da freqüência absoluta simples – fi. Daí, teremos:
⎛ fi ⎞ Fi = ⎜ ⎟ ⎝n⎠ Portanto, teremos que fazer esta divisão para cada uma das classes, para assim completarmos a coluna da freqüência relativa simples. Vejamos o nosso exemplo:
ESTATÍSTICA
*** Ponto 5 - TRABALHANDO COM AS FREQÜÊNCIAS RELATIVAS *** Pág. 2 de 7
Altura dos alunos 1,50 |⎯ 1,60
Fi
Fi
6
0,12 ou 12% (=6/50)
1,60
|⎯
1,70
11
0,22 ou 22% (=11/50)
1,70
|⎯
1,80
19
0,38 ou 38% (=19/50)
1,80
|⎯
1,90
10
0,20 ou 20% (=10/50)
1,90
|⎯ Total
2,00
4
0,08 ou 8%
(=4/50)
n=50
Vamos ilustrar um exemplo de como estas contas foram elaboradas. Para a primeira classe, como tínhamos fi = 5, a conta foi a seguinte: 6 / 50 = 0,12 (= 12%) Observemos que a resposta em termos unitários (0,12) significa a mesmíssima coisa que a resposta em termos percentuais (12%). Apenas é uma maneira diferente de se representar. Tanto é assim que, nas provas, podem vir fornecidas de qualquer dos dois formatos (12% ou 0,12). Para passar do modo unitário para o percentual, basta deslocar a vírgula duas casas para a direita e acrescer o símbolo do percentual (%). Atentemos para o seguinte fato: quando começamos a construir esta coluna da Fi, verificamos que o resultado da conta, neste nosso exemplo, é sempre – em termos percentuais – o dobro da freqüência simples fi. Vejamos: na primeira classe, a fi é 6 e a Fi é 12% (6x2=12); na segunda classe, a fi é 11 e a Fi é 22% (11x2=22). Ora, se o candidato quiser continuar fazendo sempre aquela divisão, irá constatar que, para este nosso exemplo, a regra já está estabelecida (uma vez que dividir por 50 resultaria o mesmo efeito que multiplicar por 2, acrescentando o símbolo do percentual!). Esta observação na hora da prova pode nos dar alguns segundos de vantagem sobre a concorrência! Percebemos, portanto, que não há dificuldade alguma em se construir a Fi. Basta nos lembrarmos da divisão, e pronto! Agora, qual o significado desta coluna de freqüência? Muito simples: a Freqüência Relativa Simples indica o percentual de elementos que pertence a cada classe. No nosso exemplo, o valor 20% presente na quarta classe da Fi significa apenas que 20% do total dos elementos do conjunto têm altura entre 1,80 e 1,90m (1,89m para ser mais exato. Vide intervalo de classe). Ou seja, fazem parte da quarta classe, 20% dos elementos do conjunto. A Fi da segunda classe é 22%. Isto significa que há 22% do total de elementos do conjunto que estão compreendidos nesta classe, ou seja, com altura entre 1,60 e 1,70m (1,69m, exatamente). E assim por diante! Eventualmente, pode a prova fornecer a Fi e precisarmos encontrar a fi, freqüência absoluta simples. Neste caso, mais uma vez, percorreremos o sentido de retorno do caminho das pedras. Aqui a coisa será bem simples. Basta usar a mesma fórmula que vimos acima, agora isolando a fi em vez da Fi.
Teremos que:
fi = Fi . n
Ou seja, multiplicaremos, ao invés de dividirmos! Atenção: se isto acontecer na nossa prova (e já aconteceu!), observe que o enunciado terá, necessariamente, que fornecer o “n”, ou seja, terá que informar o número total de elementos do conjunto! Vejamos o nosso exemplo, e suponhamos que a questão informou que o número total de elementos do nosso conjunto é n=50.
ESTATÍSTICA
*** Ponto 5 - TRABALHANDO COM AS FREQÜÊNCIAS RELATIVAS *** Pág. 3 de 7
Daí, teremos: Altura dos alunos 1,50 |⎯ 1,60
Fi 12% (ou 0,12)
fi 6 (= 0,12 x 50)
1,60
|⎯
1,70
22% (ou 0,22)
11 (= 0,22 x 50)
1,70
|⎯
1,80
1,80
|⎯
1,90
1,90
|⎯ Total
38% (ou 0,38)
19 (= 0,38 x 50)
20% (ou 0,20)
10 (=0,20 x 50)
8% (ou 0,08)
4 (=0,08 x 50)
2,00 n=50 (dado da questão)
Uma vez dispondo da coluna da freqüência absoluta simples – fi – estamos finalmente aptos a iniciar a resolução da prova. Se você é bom observador, deve ter notado o seguinte: o somatório da coluna da freqüência relativa simples (Fi) será sempre, necessariamente, 100% (ou 1,00 se usarmos a notação unitária em vez da percentual). Isto é até uma redundância, pois se a Fi significa o percentual de elementos do conjunto que pertence a cada classe, se somarmos os percentuais de todas as classes teremos a totalidade do conjunto, ou seja, 100%. Portanto, se formos obrigados a construir a coluna da Freqüência Relativa Simples, uma boa maneira de constatarmos se acertamos as contas é somarmos esta coluna. Se der 100%, é sinal que provavelmente acertamos. Se der diferente de 100%, é certeza que erramos! Æ Freqüência Relativa Acumulada Crescente (Fac) Gerada a partir da Freqüência Relativa Simples, a Fac é de construção semelhante à freqüência absoluta crescente. O processo é o mesmo. A diferença consiste apenas no fato de que a fac é oriunda da fi, enquanto a Fac nasce da Fi. Ou seja, as acumuladas absolutas – fac e fad – derivam da freqüência absoluta simples fi; enquanto que as acumuladas relativas – Fac e Fad – derivam da freqüência relativa simples Fi. Basta lembrar do caminho das pedras: fad fi
⇒
fad
Caminho das Pedras!
Fac Fi Fad Da mesma forma que a fac, também a Fac será apelidada de coluna do “abaixo de”, e será construída de cima para baixo, a partir da Fi. Observemos que na primeira classe, ambas as colunas – Fi e Fac – têm o mesmo valor. Daí, para se completar a Fac basta sair somando na diagonal. Vejamos, no nosso exemplo, como se faz a Fac:
ESTATÍSTICA
*** Ponto 5 - TRABALHANDO COM AS FREQÜÊNCIAS RELATIVAS *** Pág. 4 de 7
Altura dos alunos
Fi
Fac ↓ 12% (= à primeira fi)
1,50
|⎯
1,60
12%
1,60
|⎯
1,70
22%
34% (= 12% + 22%)
1,70
|⎯
1,80
38%
72% (= 34% + 38%)
1,80
|⎯
1,90
20%
92% (= 72% + 20%)
2,00
8%
1,90
|⎯ Total
100% (= 92% + 8%)
Agora o significado desta coluna Fac: representa o percentual de elementos do conjunto com valor “abaixo do” limite superior da classe correspondente. Por exemplo, se perguntarmos qual o significado do valor 34% presente na segunda classe da Fac: simplesmente que há 34% dos elementos do conjunto que têm estatura “abaixo de” 1,70m (que é o limite superior desta classe). Se conferirmos na coluna da Fi, confirmaremos que de fato, são 12% da primeira classe, e mais 22% da segunda. Total: 34%. Outro exemplo: o que significa o valor 92% na quarta classe da Fac? Apenas que 92% dos elementos do conjunto têm altura “abaixo de” 1,90m (limite superior desta classe). E assim por diante. E se a prova, em vez de trazer a Fi para a construção da Fac, fizer exatamente o contrário, ou seja, fornecer a Fac para construirmos a Fi? Neste caso percorreremos a volta do caminho das pedras, de forma análoga a que utilizamos na caso das freqüências absolutas, ou seja, na coluna da Fac, faremos “próxima Fac menos a Fac anterior”. Vejamos: Altura dos alunos 1,50 1,60 1,70 1,80 1,90
|⎯ |⎯ |⎯ |⎯ |⎯ Total
1,60 1,70 1,80 1,90 2,00
Fac ↓
12% 34% 72% 92% 100%
(34%-12%=) (72%-34%=) (92%-72%=) (100%-92%=)
Fi
12% 22% 38% 20% 8% 100%
Conforme já sabemos, a coluna de freqüências imprescindível para iniciarmos a resolução de uma prova de estatística é a da freqüência absoluta simples – fi. Se, por acaso, o enunciado da prova fornecer apenas a Freqüência Relativa Acumulada Crescente, Fac, o passo que fizemos acima será apenas o primeiro para chegarmos à fi. Uma vez de posse da Freqüência Relativa Simples (como fizemos acima), teremos depois que passar da Fi para a fi. E este segundo passo já foi feito por nós hoje mesmo, na página anterior! Ou seja, para passarmos de qualquer das duas freqüências relativas acumuladas, ou Fac ou Fad, para a freqüência absoluta simples, fi, teremos que fazê-lo em dois momentos distintos; sendo o primeiro passo chegarmos à Freqüência Relativa Simples, Fi. Desta, chegaremos finalmente à freqüência absoluta simples, fi.
ESTATÍSTICA
*** Ponto 5 - TRABALHANDO COM AS FREQÜÊNCIAS RELATIVAS *** Pág. 5 de 7
Æ Freqüência Relativa Acumulada Decrescente (Fad) Conforme indicado no caminho das pedras, nasce também a Fad a partir da Freqüência Relativa Simples, Fi. Seu apelido, da mesma forma que nas freqüências absolutas, é coluna do “acima de”. E será construída de baixo para cima! Portanto, na última classe, Fad e Fi terão o mesmo valor. Atento(a) como eu sei que você é, tenho certeza que até já sabe como formar esta coluna. Começando de baixo (da última classe), subiremos somando com a diagonal da Fi. Vejamos o nosso exemplo:
1,50
|⎯
1,60
12%
Fad ↑ 100% (=88%+12%)
1,60
|⎯
1,70
22%
88% (=66%+22%)
1,70
|⎯
1,80
38%
66% (=28%+38%)
1,80
|⎯
1,90
20%
28% (=8%+20%)
Altura dos alunos
1,90
|⎯ Total
Fi
8%
2,00
8%
100%
O que significa a Fad? Significa o percentual de elementos do conjunto que tem valor acima do limite inferior da classe correspondente. Por exemplo: o valor 28% presente na quarta classe da Fad significa o quê? Apenas que há 28% dos elementos do conjunto com estatura acima de 1,80m. (20% da quarta classe mais 8% da quinta classe). Outro exemplo: o que significa o valor 88% presente na segunda classe da Fad? Que 88% dos elementos do conjunto têm altura acima de 1,60m (que é o limite inferior!). Obviamente, sabemos que a prova pode fornecer a Fad, para termos que encontrar a Fi. Já sabemos que estas duas colunas têm o mesmo valor na última classe. Daí, trabalhando na coluna da Fad, faremos apenas aquela subtração que já conhecemos: “próxima Fad menos Fad anterior”. A resposta será a Fi. Senão, vejamos:
1,50
|⎯
1,60
↑ 100% (100%-88%)
1,60
|⎯
1,70
88% (88%-66%=)
22%
1,70
|⎯
1,80
66% (66%-28%=)
38%
1,80
|⎯
1,90
28% (28% - 8%)
20%
Altura dos alunos
1,90
|⎯ Total
2,00
Fad
8%
Fi
12%
8%
Como bom observador que é, você deve ter percebido que em qualquer das Freqüências Relativas Acumuladas, Fac ou Fad, estará presente o valor 100%.
ESTATÍSTICA
*** Ponto 5 - TRABALHANDO COM AS FREQÜÊNCIAS RELATIVAS *** Pág. 6 de 7
No caso da Fad, o 100% estará na primeira classe; já na Fac, aparecerá o 100% na última classe. Estamos falando em 100% por estarmos usando a notação percentual; caso estivéssemos usando a notação unitária, teríamos, em lugar de 100%, o valor da unidade (1,00). Em uma prova antiga da ESAF a questão perguntava se as Freqüências Relativas Acumuladas necessariamente começavam ou terminavam com a unidade. Isto é verdadeiro! No caso da Fad (veja acima) começamos com a unidade (100%); no caso da Fac, encerramos com ela! OK! Enfim, concluímos o estudo das colunas de freqüências de uma Distribuição. Agora vamos entrar na parte prática. Veremos, por meio dos exercícios abaixo, como as provas têm exigido esse conhecimento. O importante é recordar que, logo de cara, será nosso objetivo chegarmos à freqüência absoluta simples – fi. É exatamente o que faremos nestas questões que se seguem. EXERCÍCIOS DE HOJE
A ordem é apenas a mesma para todas as questões abaixo: a partir dos dados fornecidos pelo enunciado, tete construir a freqüência absoluta simples. Respostas comentadas no início da próxima aula. Até lá e um grande abraço! 01) Extraído da prova do AFRF-2000: Freqüências Acumuladas de Salários Anuais, em Milhares de Reais, da Cia. Alfa Classes de Freqüências Salário Acumuladas (3 ; 6] 12 (6 ; 9] 30 (9 ; 12] 50 (12 ; 15] 60 (15 ; 18] 65 (18 ; 21] 68 02) Extraído da prova de AFRF-2002.1: Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. As questões de 38 a 43 referem-se a esses ensaios. Classes 70-90 90-110 110-130 130-150 150-170 170-190 190-210
P (%) 5 15 40 70 85 95 100
ESTATÍSTICA
*** Ponto 5 - TRABALHANDO COM AS FREQÜÊNCIAS RELATIVAS *** Pág. 7 de 7
03) Extraído da prova de Agente Fiscal de Tributos Estaduais – PI: A Tabela abaixo mostra a distribuição de freqüências obtida de uma amostra aleatória dos salários anuais em reais de uma firma. As freqüências são acumuladas. Classes de Salários (5.000-6.500) (6.500-8.000) (8.000-9.500) (9.500-11.000) (11.000-12.500) (12.500-14.000) (14.000-15.500)
Freqüências 12 28 52 74 89 97 100
04) Extraído da prova de Fiscal de Tributos Estaduais – PA: A tabela de freqüências abaixo deve ser utilizada nas questões 21, 22 e 23 e apresenta as freqüências acumuladas (F) correspondentes a uma amostra da distribuição dos salários anuais de economistas (Y) – em R$1.000,00, do departamento de fiscalização da Cia. X. Não existem realizações de Y coincidentes com as extremidades das classes salariais. Classes 29,5 – 39,5 39,5 – 49,5 49,5 - 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5
F 2 6 13 23 36 45 50
05) Extraído da prova de AFRF-2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
Boa sorte!
– – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Freqüência (f) 4 8 14 20 26 18 10
ESTATÍSTICA *** Ponto 06 - EXERCÍCIOS DE COLUNAS DE FREQÜÊNCIAS *** Pág. 1 de 6
EXERCÍCIOS DE COLUNAS DE FREQÜÊNCIAS 01) Extraído da prova do AFRF/2000: Freqüências Acumuladas de Salários Anuais, em Milhares de Reais, da Cia. Alfa Classes de Freqüências Acumuladas Salário (3 ; 6] 12 (6 ; 9] 30 (9 ; 12] 50 (12 ; 15] 60 (15 ; 18] 65 (18 ; 21] 68 Sol.: O cabeçalho da prova apresentou a distribuição de freqüências acima, com apenas a coluna das classes, e uma coluna de freqüências que foi chamada de “freqüências acumuladas”. As questões que se seguiam, iriam solicitar o cálculo de medidas de posição, dispersão, assimetria, curtose etc. Logo, sabemos que não seria possível iniciar a resolução da prova sem antes conhecermos a freqüência absoluta simples – fi. Vamos ao caso: quando a prova trouxe uma coluna a quem chamou unicamente de freqüências acumuladas, o candidato vai lembrar-se inicialmente que há quatro tipos de freqüências acumuladas: duas absolutas acumuladas (fac e fad) e duas relativas acumuladas (Fac e Fad). Daí, a primeira preocupação é saber se trata-se de uma freqüência absoluta ou relativa. Já sabemos que a diferença entre estes dois grupos de freqüências é que a absoluta diz respeito a número de elementos, enquanto a relativa trata de percentual de elementos do conjunto. Observando os valores fornecidos pela prova, constatamos que não são valores percentuais (como 12%, 30% ou 0,12 , 0,30 etc), e também vimos que no título da coluna havia apenas “freqüências acumuladas”, desacompanhado de um sinal de porcentagem “%”. Se assim o fosse, estaríamos diante de uma freqüência relativa. Como não houve a presença de nenhum desses indicadores, concluímos que a coluna fornecida é uma freqüência acumulada absoluta! Restam assim duas opções: absoluta acumulada crescente ou decrescente. Isto é ainda mais fácil de concluir. Basta olharmos para a seqüência dos valores presentes nesta coluna. Se os valores estiverem aumentando, a freqüência é crescente; se estiverem diminuindo, decrescente. No caso, temos: 12, 30, 50, 60, ... ; daí a conclusão: estamos trabalhando com uma coluna de freqüência absoluta acumulada crescente! Esta descoberta é o primeiro passo da prova! Agora, resta-nos chegar à freqüência absoluta simples. Vejamos: Classes de Salário ( 3 ; 6] ( 6 ; 9] ( 9 ; 12] (12 ; 15] (15 ; 18] (18 ; 21]
fac ↓ 30 50 60 65 68
12 (30 – (50 – (60 – (65 – (68 –
fi
12=) 30=) 50=) 60=) 65=)
12 18 20 10 5 3
ESTATÍSTICA *** Ponto 06 - EXERCÍCIOS DE COLUNAS DE FREQÜÊNCIAS *** Pág. 2 de 6
02) Extraído da prova de AFRF-2002.1: Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. As questões de 38 a 43 referem-se a esses ensaios. Classes 70-90 90-110 110-130 130-150 150-170 170-190 190-210
P (%) 5 15 40 70 85 95 100
Sol.: Aqui a coisa já foi mais interessante um pouco! Veja que a prova trouxe a distribuição de freqüências com apenas duas colunas: a das classes, e uma chamada de “P(%)”. No enunciado, foi dito que “P representa a freqüência relativa acumulada”, não deixando com isso qualquer dúvida a respeito de a freqüência ser absoluta ou relativa. Agora que sabemos que é relativa e que é acumulada, basta olhar para os seus valores para podermos concluir se será acumulada crescente ou decrescente. Aí não tem segredo: 5, 15, 40, 70, ... é uma seqüência crescente. Conclusão: estamos diante de uma coluna de freqüência relativa acumulada crescente, a nossa conhecida Fac! Como já se era de esperar, as questões deste enunciado irão exigir o conhecimento da freqüência absoluta simples, fi. Conhecê-la é agora o nosso objetivo. Lembremo-nos de que, quando queremos chegar à fi, partindo de uma freqüência relativa, temos, necessariamente, que conhecer o número de elementos do conjunto “n”. Este foi fornecido no enunciado: “...foram examinados 200 itens...”, ou seja, n=200. Como primeiro passo, passaremos da Fac para a coluna da freqüência relativa simples Fi. Vejamos: Classes Fac ↓ 70-90 5% 5% 90-110 15% (15%-5%=) 10% 110-130 40% (40%-15%=) 25% 130-150 70% (70%-40%=) 30% 150-170 85% (85%-70%=) 15% 170-190 95% (95%-85%=) 10% 190-210 100% (100%-95%=) 5% Feito isso, resta encontrar agora a fi, partindo que há entre estes dois tipos de freqüências, já nossa Fi = fi / n Teremos: 1.ª Classe: 2.ª Classe: 3.ª Classe:
ou, isolando o fi:
fi = 0,05 x 200 = 10 fi = 0,10 x 200 = 20 fi = 0,25 x 200 = 50
Fi (ou 0,05) (ou 0,10) (ou 0,25) (ou 0,30) (ou 0,15) (ou 0,10) (ou 0,05) da Fi, usando a relação conhecida:
fi = Fi . n
ESTATÍSTICA *** Ponto 06 - EXERCÍCIOS DE COLUNAS DE FREQÜÊNCIAS *** Pág. 3 de 6
Mesmo antes de concluir estes cálculos, o bom observador já notou que a relação entre estas duas freqüências consiste em multiplicar a Fi por 2 e tirar o sinal de porcentagem! É claro que se o candidato não tivesse essa percepção, iria ainda assim chegar ao mesmo resultado. Continuando as contas: 4.ª 5.ª 6.ª 7.ª
Classe: Classe: Classe: Classe:
fi fi fi fi
= = = =
0,30 0,15 0,10 0,05
x x x x
200 200 200 200
= = = =
60 30 20 10
Daí, teremos finalmente a nossa coluna da freqüência absoluta simples: Classes 70-90 90-110 110-130 130-150 150-170 170-190 190-210
Fac 5% 15% 40% 70% 85% 95% 100%
(15%-5%=) (40%-15%=) (70%-40%=) (85%-70%=) (95%-85%=) (100%-95%=)
5% 10% 25% 30% 15% 10% 5%
Fi (ou 0,05) (ou 0,10) (ou 0,25) (ou 0,30) (ou 0,15) (ou 0,10) (ou 0,05)
fi 10 20 50 60 30 20 10
Somente neste momento a resolução das questões da prova poderia ser iniciada! Em outras palavras: mesmo que fossem fornecidas todas as fórmulas da prova (o que não acontece...), se este trabalho inicial de encontrar a freqüência absoluta simples não fosse feito, o candidato correria o risco de errar todas as questões, uma após outra! 03) Extraído da prova de Agente Fiscal de Tributos Estaduais – PI: A Tabela abaixo mostra a distribuição de freqüências obtida de uma amostra aleatória dos salários anuais em reais de uma firma. As freqüências são acumuladas. Freqüências Classes de Salários (5.000-6.500) 12 (6.500-8.000) 28 (8.000-9.500) 52 (9.500-11.000) 74 (11.000-12.500) 89 (12.500-14.000) 97 (14.000-15.500) 100 Sol.: Vamos tentar descobrir o tipo de freqüência que foi fornecida neste enunciado. Absoluta ou relativa? Como isso não foi explicitado na questão, temos que buscar os sinais! Se as freqüências não trazem um símbolo de percentagem (%) nem no cabeçalho da coluna, nem ao lado das freqüências, então fica patente que se trata de uma freqüência absoluta. É exatamente este nosso caso! Daí, uma vez que o enunciado já nos disse que “as freqüências são acumuladas”, resta saber se será acumulada crescente ou decrescente. Aí é moleza, basta ver os valores da coluna {12, 28, 52, 74,...}, ou seja, uma seqüência crescente. Daí, concluímos: a coluna apresentada na questão é uma fac – freqüência absoluta acumulada crescente. Para chegarmos à freqüência absoluta simples, fi, teremos que percorrer o sentido de volta do caminho das pedras, trabalhando com a coluna da fac e fazendo sempre próxima fac menos fac anterior.
ESTATÍSTICA *** Ponto 06 - EXERCÍCIOS DE COLUNAS DE FREQÜÊNCIAS *** Pág. 4 de 6
Vejamos: Classes de Salários fi fac ↓ (5.000-6.500) 12 12 (6.500-8.000) 28 (28-12=) 16 (8.000-9.500) 52 (52-28=) 24 (9.500-11.000) 74 (74-52=) 22 (11.000-12.500) 89 (89-74=) 15 (12.500-14.000) 97 (97-89=) 8 (14.000-15.500) 100 (100-97=) 3 E aí? Já estamos ficando práticos? É só uma questão de treino!
04) Extraído da prova de Fiscal de Tributos Estaduais – PA: A tabela de freqüências abaixo deve ser utilizada nas questões 21, 22 e 23 e apresenta as freqüências acumuladas (F) correspondentes a uma amostra da distribuição dos salários anuais de economistas (Y) – em R$1.000,00, do departamento de fiscalização da Cia. X. Não existem realizações de Y coincidentes com as extremidades das classes salariais.
Classes 29,5 – 39,5 39,5 – 49,5 49,5 - 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5
F 2 6 13 23 36 45 50
Sol.: Por certo você já percebeu que alguns enunciados, no intuito de confundir, chamam freqüências simples com a letra maiúscula F. Isso não deve nos iludir. Quando formos iniciar a prova, temos que ter plena certeza do tipo de freqüência que estamos trabalhando! No caso deste enunciado, também nada foi explicitado sobre a freqüência ser do tipo absoluta ou relativa. Novamente, procuraremos os “sinais” que indicariam ser uma freqüência relativa. Basicamente fazemos duas observações: 1)Existe o símbolo de % no cabeçalho da coluna? 2)Existe o símbolo de % ao lado das freqüências? Sendo ambas estas respostas negativas, tudo indica que se trata de freqüências absolutas! É este o presente caso. Disse expressamente o enunciado que estamos com freqüências acumuladas. Como estão dispostas em uma seqüência crescente {2, 6, 13, 23...}, já matamos que a freqüência é acumulada crescente. Daí, chegamos finalmente à nossa conclusão: a prova forneceu uma coluna de freqüências absolutas acumuladas crescentes – fac. Perfazendo o sentido de volta do caminho das pedras, chegaremos à fi, daquela forma que já conhecemos: próxima fac menos fac anterior. Vejamos:
Classes 29,5 – 39,5 39,5 – 49,5 49,5 - 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5
6 13 23 36 45 50
fac ↓ 2 (6-2=) (13-6=) (23-13=) (36-23=) (45-36=) (50-45=)
fi 2 4 7 10 13 9 5
ESTATÍSTICA *** Ponto 06 - EXERCÍCIOS DE COLUNAS DE FREQÜÊNCIAS *** Pág. 5 de 6
05) Extraído da prova de AFRF-2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
– – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Freqüência (f) 4 8 14 20 26 18 10
Sol.: E aí, fizeram essa também? Quem fez? Infelizmente, tenho que comunicar que quem fez qualquer coisa nesta questão já errou!... Na verdade, já está tudo feito! Eu coloquei esse enunciado aqui só pra ver se vocês estão atentos! Ora, o enunciado não disse expressamente, nem deu qualquer sinal de se tratar de uma freqüência relativa, pelo que concluímos que se trata de uma freqüência absoluta. Além disso, o enunciado também nada disse a respeito de esta freqüência ser acumulada, donde deduzimos que é freqüência absoluta. Finalmente, trata-se de uma freqüência absoluta simples, a nossa fi. Alguém caiu nessa? Se caiu, alegre-se! Melhor errar em casa que errar na prova... Para que nós possamos ficar mais bem treinados com estas colunas de freqüências, colocarei abaixo alguns outros exercícios, todos com o objetivo de chegarmos, a partir dos dados fornecidos, à freqüência absoluta simples, fi. Como já vimos repetidamente os procedimentos para resolver esses exercícios, na próxima aula darei apenas as respostas, sem comentá-las. Estou certo que já não haverá mais dificuldades! Seguem os exercícios e eu fico hoje por aqui. Prosseguimos na próxima aula. Um grande abraço e até lá! EXERCÍCIOS DE HOJE De acordo coluna da 01. A à
com os dados fornecidos por cada uma das questões abaixo, encontre a freqüência absoluta simples: tabela abaixo apresenta as freqüências acumuladas (k) relacionadas distribuição de uma amostra de 500 elementos. Classes k 10-20 100% 20-30 95% 30-40 85% 40-50 70% 50-60 40% 60-70 15% 70-80 5%
ESTATÍSTICA *** Ponto 06 - EXERCÍCIOS DE COLUNAS DE FREQÜÊNCIAS *** Pág. 6 de 6
02. A tabela abaixo apresenta as freqüências acumuladas (F) relacionadas à seguinte distribuição: Classes 10-20 20-30 30-40 40-50 50-60 60-70 70-80
F 5 15 40 70 85 95 100
03. A tabela abaixo apresenta as freqüências (W) relacionadas à distribuição de uma amostra de 200 elementos. Classes 10-20 20-30 30-40 40-50 50-60 60-70 70-80
W (%) 5 15 40 70 85 95 100
04. A tabela abaixo apresenta as freqüências acumuladas (Z) relacionadas à seguinte distribuição de freqüências: Classes 10-20 20-30 30-40 40-50 50-60 60-70 70-80 Boa sorte!
Z 100 95 85 70 40 15 5
ESTATÍSTICA - Ponto dos concursos
Ponto 7
pag. 1 de 4
APRESENTAÇÃO DOS DADOS Oi, turma! Conforme combinado, começamos hoje com as respostas dos exercícios que ficaram da aula passada. Antes só uma pergunta: fizeram as questões? Olha lá, hein? o maior engano que existe é o próprio! Vamos às respostas: 01. O procedimento desta questão é Fad Æ Fi Æ fi: Classes 10-20 20-30 30-40 40-50 50-60 60-70 70-80
Fi 5% 10% 15%75 30% 25% 10% 5%
Fad↑ 100% 95% 85% 70% 40% 15% 5%
fi 25 50 150 125 50 25
02. O procedimento desta questão é fac Æ fi: Classes 10-20 20-30 30-40 40-50 50-60 60-70 70-80
fac↓ 5 15 40 70 85 95 100
fi 5 10 25 30 15 10 5
03. O procedimento desta questão é Fac Æ Fi Æ fi: Classes 10-20 20-30 30-40 40-50 50-60 60-70 70-80
Fac↓ 5% 15% 40% 70% 85% 95% 100%
Fi 5% 10% 25% 30% 15% 10% 5%
fi 10 20 50 60 30 20 10
04. O procedimento desta questão é fad Æ fi: Classes 10-20 20-30 30-40 40-50 50-60 60-70 70-80
fad ↑ fi 100 5 95 10 85 15 70 30 40 25 15 10 55
E aí? Tudo certo? Espero que sim! O negócio é prestar atenção e não se deixar iludir pelas aparências. Creio que a “casca de banana” que pode ter ensejado algum erro estava presente na terceira questão, em que o enunciado não falava que a freqüência era acumulada. Acertei?
ESTATÍSTICA - Ponto dos concursos
Ponto 7
pag. 2 de 4
Ora, neste caso, apesar do silêncio do enunciado, teríamos que lembrar que no caso das freqüências relativas (que é o nosso!), o somatório da coluna tem necessariamente que ser igual a 100%. Além disso, sabemos que nas relativas acumuladas a coluna ou começa (Fad) ou termina (Fac) com 100%. Daí, não restaria nenhuma dúvida de que esta freqüência relativa era acumulada. Certo? Vamos a aula de hoje... que por sinal é bem light! Dando seqüência à matéria, temos que nos deter aqui em um ponto básico, que consiste em reconhecer as três formas mais usuais de como os dados de um conjunto são apresentados. Sabemos que as questões das provas irão nos pedir que calculemos as medidas de posição, de dispersão, de assimetria, de curtose etc, em relação aos dados de um conjunto. Portanto, vamos agora nos familiarizar com as maneiras de como os enunciados expõem os elementos com os quais iremos trabalhar. Vamos a elas: Æ O Rol: Como já explicado em aula passada, o rol nada mais é que uma relação dos dados do conjunto, dispostos um após outro, em uma ordem crescente ou decrescente. Passemos a um exemplo que aconteceu na prova de Auditor-Fiscal da Receita Federal de 1998. Vejamos este enunciado, transcrito a seguir: “Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomada numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13,14, 15, 15, 15, 16, 16, 18, 23” Notemos que o enunciado trouxe os dados do conjunto em forma de Rol, e pediu que se calculassem a Mediana e a Variância. Esta última é uma medida de dispersão, que veremos futuramente. Porém, para se calcular a Variância, tínhamos que conhecer a Média do conjunto. Logo depois, na questão seguinte desta prova, o enunciado pedia que se calculasse a Moda reportando-se aos dados do presente enunciado. Ou seja, para este Rol, seria preciso calcular a Média, a Moda e a Mediana - as três medidas de Tendência Central, que estudaremos muito em breve! Æ Dados Tabulados Não-Agrupados em Classes: Uma outra maneira de se apresentarem os dados da questão seria dispondo-os em uma tabela, todavia sem agrupá-los em classes, ou seja, trabalhando-os de forma individualizada, na coluna Xi. Vejamos o exemplo abaixo: Xi fi 0 2 1 5 2 7 3 4 4 3 5 1 Na coluna do Xi estão os elementos do conjunto; na coluna à direita, estão as freqüências absolutas simples, ou seja, o número de vezes que cada elemento se repete no conjunto. É possível, facilmente, transformarmos esta tabela em um rol. Senão, vejamos:
ESTATÍSTICA - Ponto dos concursos
Ponto 7
pag. 3 de 4
O elemento 0 (zero) aparece duas vezes (fi=2); o elemento 1 aparece 5 vezes (fi=5), e assim por diante. Logo teríamos o seguinte rol: {0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5} Note que o rol e a tabela acima representam exatamente o mesmo conjunto, só que apresentados de formas distintas. O que diferencia os Dados Tabulados Não-Agrupados (que passaremos a chamar apenas Dados Tabulados) da Distribuição de Freqüências, é que nos Dados Tabulados, os elementos Xi são dispostos de forma individualizada, enquanto que na Distribuição de Freqüências, os elementos estão dispostos em classes. Diz-se que, nos Dados Tabulados não há perda de informação. Por exemplo, se perguntarmos quantas vezes aparece no conjunto acima o elemento 3, basta conferirmos na coluna da freqüência, e responderemos: 4 vezes. Æ Distribuição de Freqüências: Desta já falamos exaustivamente! A principal característica desta forma de apresentação dos dados é justamente a disposição dos elementos em classes! Neste caso, diz-se que há perda de informação. Vejamos o exemplo abaixo: Classes 0-10 10-20 20-30 30-40 40-50
fi 3 7 12 8 5
Se perguntarmos quantas vezes exatamente aparecem no conjunto o elemento 8 (oito), não saberemos responder. Diremos apenas que os elementos entre 0 e 10 aparecem 3 vezes (fi=3), mas não podemos dar uma informação precisa acerca de um elemento isoladamente considerado. São, portanto, estas três maneiras de os dados virem normalmente presentes numa questão de prova. Ressaltamos que a distribuição de freqüências é, de longe, a forma preferida pelas mesas elaboradoras de concursos. Por isso, daremos sempre grande ênfase a ela, como, aliás, já o temos feito. Observação: é bem verdade que vários (bons) autores não vêem distinção entre as duas últimas formas de apresentação dos dados que mostramos acima, chamando-as ambas de Distribuição de Freqüências. Não nos cabe aqui entrar nesta discussão, mesmo porque não atende nossos objetivos. Até para efeitos didáticos, e isso facilitará raciocínios futuros, continuaremos a separá-las em “Distribuição de Freqüências” e “Dados Tabulados”, conforme os dados venham ou deixem de vir dispostos em classes. Hoje, ficamos por aqui! Essa aula foi até para vocês poderem dar uma respirada! Seria interessante que vocês me dessem um retorno, para eu ter uma idéia se estou correndo demais, ou se o ritmo está bom assim deste jeito. Se ninguém disser nada, eu vou-me embora... Aqui é assim: quem manda é o freguês! Aliás, quero abrir um parênteses para agradecer os e-mails afetuosos que tenho recebido desta “sala lotada” de novos alunos virtuais que eu ganhei, vindos dos quatro cantos do país! Muito obrigado, mesmo! Próximo Ponto, voltaremos com um assunto muito em voga: a interpolação linear da ogiva! A partir desta próxima aula, estaremos
ESTATÍSTICA - Ponto dos concursos
Ponto 7
pag. 4 de 4
aptos a resolver a primeira questão da prova de estatística da ESAF! É mole, não? Um grande abraço e até lá! Observação: você que está interessado somente na nossa matéria, poderá deixar de imprimir essa última página, que só tem abobrinha! E ainda economiza uma folha!
Estatística – Ponto dos Concursos
Ponto 8-Interpolação Linear da Ogiva 1
INTERPOLAÇÃO LINEAR DA OGIVA
Até a última aula vimos as noções introdutórias do nosso curso. Somente hoje estaremos aptos a iniciar a resolução da prova. O assunto que veremos agora passou a elencar as provas de estatística da ESAF já há alguns anos, mais ou menos desde o AFRF de 2001, e desde então não mais deixou de ser cobrado. Trata-se de uma questão muito fácil, embora o nome do assunto possa assustar um pouco. Começaremos com um exemplo bem simples. Vejamos a Distribuição de Freqüências abaixo:
0 10 20 30 40 50
Xi |--|--|--|--|--|---
10 20 30 40 50 60
fi 5 8 13 11 7 3
Se a questão da prova perguntasse, por exemplo, quantos elementos deste conjunto têm valor abaixo de 30, como responderíamos? Ora, observando as classes desta distribuição, vemos facilmente que “participam desta resposta” os elementos das três primeiras classes. Desta forma, teríamos 5 elementos na primeira classe (abaixo de 10), mais 8 elementos na segunda classe (de 10 a 20) e finalmente 13 elementos na terceira classe (valores de 20 a 30). Somando tudo, nossa resposta seria 26. Essa foi fácil, não? Mais uma vez: a pergunta agora é “quantos elementos deste conjunto têm valor acima de 40?” Também sem grandes dificuldades, percebemos que “participam desta resposta” os elementos das duas últimas classes, ou seja, elementos com valor de 40 a 50 (quinta classe) e de 50 a 60 (sexta classe). Logo, como temos 7 elementos na penúltima, e 3 elementos na última classe, nossa resposta seria a soma, ou seja, 10 elementos. Até aqui, sem problemas, certo? # A Questão: A nova pergunta é: quantos elementos deste mesmo conjunto têm valor menor ou igual a 28? Observando os limites das classes apresentadas, percebemos que 28 não é nem limite superior, nem inferior de qualquer destas classes. Na verdade, o valor 28 encontra-se dentro da terceira classe! Para completar o enunciado, a questão vai pedir ainda que determinemos esta resposta utilizando-nos da Interpolação Linear da Ogiva. E aí? Pulamos pra próxima questão? De jeito nenhum! Embora ainda nem tenhamos falado de Ogiva (ou de outros gráficos estatísticos), teremos já total condição de resolver este problema, fazendo uso de uma regra de três simples, a mais fácil possível. Percebamos que é fácil deduzir que a primeira e a segunda classes participarão da resposta integralmente, porém a terceira classe (20 |--- 30) participará apenas parcialmente do resultado!
Página 1 de 8
Estatística – Ponto dos Concursos
Ponto 8-Interpolação Linear da Ogiva
Ou seja:
0 10 20 30 40 50
Xi |--|--|--|--|--|---
10 20 30 40 50 60
fi 5 8 13 11 7 3
Æ participa integralmente da resposta! Æ participa integralmente da resposta! Æ participa parcialmente da resposta!
O segredo então é trabalharmos com esta classe que participa apenas parcialmente da resposta! Daí faremos: A terceira classe tem amplitude h-10, e freqüência simples fi=13 Daí, a primeira linha da regra de três está formada: 10 ---- 13 (dez está para treze!) Traduzindo: nesta amplitude de 10, temos 13 elementos. Para o complemento da regra de três pensaremos o seguinte: a questão quer saber “menor ou igual a 28”. Ora, menor ou igual a 28 nesta classe, nós teremos desde o limite inferior da classe (20) até o próprio 28. Ou seja, a amplitude desejada para esta classe neste momento será apenas esta diferença: (28 – 20) = 8. Daí, a segunda linha da regra de três será: 8 ---- X (oito está para X) Ou seja, nesta amplitude de apenas 8, quantos elementos teremos? (X=?) Agora, nossa regra de três completa será: 10-------- 13 8 -------- X Multiplicamos cruzando e chegaremos a: X = (8 . 13) / 10 -> E: X = 104 / 10 -> Donde: X = 10,4 Observemos que este calculado (10,4) é apenas a participação da terceira classe em nossa resposta! O valor que de fato procuramos reunirá também as freqüências das duas primeiras classes desse conjunto, as quais, como vimos, participam integralmente do resultado!
Daí, teremos: Æ Primeira classe:(0 |--- 10) Æ Æ Segunda classe: (10 |--- 20) Æ
5 elementos (fi=5) 8 elementos (fi=8) Página 2 de 8
Estatística – Ponto dos Concursos
Ponto 8-Interpolação Linear da Ogiva
Æ Terceira classe:(20 |--- 30) Æ 10,4 elementos (X=10,4) ----------------------Total de elementos: 23,4 elementos Æ Resposta da questão! Obviamente que este resultado reflete apenas uma aproximação, ou seja, uma estimativa, uma vez que quando trabalhamos com a Distribuição de Freqüências teremos efetivamente uma perda de informação. Mas não nos preocupemos: embora essa resposta seja o reflexo de uma aproximação, ela nos garantirá um ponto de verdade a mais na nossa prova! # Outro exemplo: Uma nova questão agora pergunta, para aquela mesma distribuição de freqüências: “quantos elementos deste conjunto têm valor maior ou igual a 34?” Aqui está de novo o nosso conjunto:
0 10 20 30 40 50
Xi |--|--|--|--|--|---
10 20 30 40 50 60
fi 5 8 13 11 7 3
Observamos que este valor, 34, não é limite inferior ou superior de nenhuma das classes, ao contrário, está dentro da quarta classe. Constatamos, ainda, pela mera observação, que se a questão pede elementos com valores acima de 34, esta quarta classe participará da resposta apenas de forma parcial. Enquanto isso, as duas últimas classes participarão integralmente do resultado. Ou seja:
0 10 20 30 40 50
Xi |--|--|--|--|--|---
10 20 30 40 50 60
fi 5 8 13 11 7 3
Æ participa parcialmente da resposta! Æ participa integralmente da resposta! Æ participa integralmente da resposta!
Ficou fácil perceber que teremos que trabalhar a regra de três com a quarta classe, para descobrir quantos de seus elementos participarão da resposta. Para compor a regra de três, inicialmente trabalhamos com a classe inteira. E nesta quarta classe, temos amplitude h=10 e freqüência simples fi=11. Portanto, a primeira linha da regra de três será a seguinte: 10 --- 11 (dez está para onze!) Ora, para esta mesma quarta classe, maiores ou iguais a 34 serão os elementos 34 a 40. Ou seja, a amplitude desejada na resposta para essa classe será apenas esta diferença: 40 – 34 = 6. Daí, a segunda linha da regra de três será: 6
----
X
(seis está para X)
Ou seja, na amplitude de 6 teremos X elementos. Página 3 de 8
Estatística – Ponto dos Concursos
Ponto 8-Interpolação Linear da Ogiva
Portanto, nossa regra de três completa será a seguinte: 10 ---- 11 6 ---- X Resolvendo, teremos: X = (6 . 11) / 10
Æ
E: X = 6,6
Ou seja, em relação à quarta classe, participam da resposta apenas 6,6 elementos! Para chegarmos ao resultado da questão, todavia, temos de nos lembrar que as freqüências das duas derradeiras classes terão participação integral. Daí, teremos: Æ Quarta classe:(30 |--- 40) Æ 6,6 elementos (X=6,6) Æ Quinta classe:(40 |--- 50) Æ 7 elementos (fi=7) Æ Sexta classe: (50 |--- 60) Æ 3 elementos (fi=3) ----------------------Total de elementos: 16,6 elementos Æ Resposta da questão! A questão é basicamente isso! Há algumas variações possíveis, como por exemplo, em vez de a questão perguntar “quantos elementos”, ela perguntaria “qual o percentual de elementos”, ou seja, em vez de trabalharmos com a freqüência absoluta simples (fi), trabalharíamos com a freqüência relativa simples (Fi). Outra variação é aquela em que a questão pergunta “quantos elementos do conjunto têm valor acima de X e abaixo de Y?”, de forma que X e Y são valores não coincidentes com os limites inferiores ou superiores das classes da distribuição. Neste caso, teríamos duas classes participando parcialmente da resposta, logo, teríamos que fazer duas regras de três: uma para a classe em que o X estará inserido, outra para a classe a qual pertence o Y.
# Variação Importante: Existe, todavia, uma variação desta questão digna de nota! Seria um enunciado do tipo que se segue:
0 10 20 30 40
Xi |--|--|--|--|---
10 20 30 40 50
Fi 5% 22% 33% 12% 8%
Considerando a distribuição de freqüências acima, em que Fi representa a freqüência relativa simples, determine, via interpolação linear da ogiva, qual o elemento deste conjunto que não é superado por 45% das observações de Xi. Página 4 de 8
Estatística – Ponto dos Concursos
Ponto 8-Interpolação Linear da Ogiva
E agora? Complicou? Pulamos para a próxima questão? Ainda não: raciocinemos juntos. Temos aí uma coluna com as freqüências relativas, e a questão pergunta, em outras palavras, qual o elemento (Xi) que está abaixo de 45% do total de elementos do conjunto.
Vejamos: a primeira classe tem 5% dos elementos, ok? A segunda classe tem 22%. Somando estas duas primeiras freqüências relativas, teremos já 27% do total dos elementos. Agora: de 27% para chegarmos a 45%, quanto falta? Obviamente que faltam ainda 18%, certo? É a diferença (45%-27%=18%). Tudo bem até aqui? Seguindo: se eu preciso andar mais 18% a partir da segunda classe, (para chegar aos 45% desejados) e a próxima classe, que é a terceira, já tem 33% dos elementos do conjunto, isso significa que a resposta que estamos procurando estará exatamente dentro desta terceira classe! Senão, vejamos: já tínhamos 27% dos elementos acumulados nas duas primeiras classes. Se somássemos a esses 27% os 33% da terceira classe, passaríamos a 60% dos elementos do conjunto. E o nosso objetivo é chegarmos aos 45%. Daí, trabalharemos formando uma regra de três simples para a terceira classe, cuja freqüência relativa participa apenas parcialmente na busca do resultado! De antemão, já sabemos que nossa resposta estará dentro da terceira classe, ou seja, será um valor no intervalo de 20 a 30. A nossa situação é a seguinte:
0 10 20 30 40
Xi |--|--|--|--|---
10 20 30 40 50
Fi 5% 22% 33% 12% 8%
Æ 5% acumulados! Æ 27% acumulados! Æ Faltam 18% para chegarmos aos 45%
Daí, faremos nossa regra de três com o seguinte raciocínio: na terceira classe, temos amplitude h=10 e freqüência relativa Fi=33%. Logo, a primeira linha da regra de três será: 10 --- 33% (dez está para trinta e três por cento) Ou seja, conjunto.
em
uma
amplitude
de
10
temos
33%
dos
elementos
do
Para construir a segunda linha da regra de três, pensaremos assim: nos interessam nesta terceira classe apenas 18% dos elementos, que serão necessários para acumularmos os 45% desejados. Daí, faremos: X --- 18% (X está para dezoito por cento) Ou seja: qual será a amplitude (X=?) desta terceira classe, que abrangerá apenas 18% dos seus elementos? A regra de três completa é a seguinte: 10 --- 33% X --- 18% Página 5 de 8
Estatística – Ponto dos Concursos
Ponto 8-Interpolação Linear da Ogiva
Multiplicando em cruz, teremos: X = (18%.10)/33% Æ E: X = 5,45 Agora o mais importante: como usar esse X encontrado? Somando-o ao limite inferior da terceira classe! Vamos tentar entender: se estamos no limite inferior da terceira classe (linf=20) e somamos a este a amplitude da classe inteira (h=10), chegaríamos ao limite superior (lsup=30). Todavia, não nos interessa somar o limite inferior com a amplitude da classe, pois assim “avançaríamos” mais 33% dos elementos. Queremos avançar apenas 18% dos elementos, o que corresponde a uma amplitude de X=5,45 , conforme calculamos acima. Logo, para chegarmos ao resultado solicitado pela questão, faremos: 20 + 5,45 = 25,45 Æ Resposta da questão! É isso! Na seqüência, a transcrição de algumas questões de provas recentes elaboradas pela ESAF, nas quais este assunto foi exigido. O gabarito comentado principiará nossa próxima aula. Até lá e um grande abraço!
EXERCÍCIOS DE HOJE
Extraído do AFRF-2002.1: 01. Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações
coincidentes com os extremos das classes. Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
P (%) 5 15 40 70 85 95 100
Assinale a opção que corresponde à estimativa da freqüência relativa de observações de X menores ou iguais a 145. a) 62,5% b) 70,0% c) 50,0% d) 45,0% Página 6 de 8
Estatística – Ponto dos Concursos
Ponto 8-Interpolação Linear da Ogiva
e) 53,4% 02. Extraída do AFRF-2001: Freqüências acumuladas de salários anuais, em milhares de reais, da Cia. Alfa. Classes de salários 3 6 9 12 15 18
; ; ; ; ; ;
6 9 12 15 18 21
Freqüências acumuladas 12 30 50 60 65 68
Suponha que a tabela de freqüências acumuladas tenha sido construída a partir de uma amostra de 10% dos empregados da Cia. Alfa. Deseja-se estimar, utilizando interpolação linear da ogiva, a freqüência populacional de salários anuais iguais ou inferiores a R$7.000,00 na Cia. Alfa. Assinale a opção que corresponde a este número. a) 150 b) 120 c) 130 d) 160 e) 180 03. Extraída do AFRF-2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte:
Classes 29,4 --- 39,5 39,5 --- 49,5 49,5 --- 59,5 59,5 --- 69,5 69,5 --- 79,5 79,5 --- 89,5 89,5 --- 99,5
Freqüência (f) 4 8 14 20 26 18 10
Assinale a opção que corresponde à estimativa do número de indivíduos com valores do atributo X menores ou iguais a 95,5 e maiores do que 50,5. a) 700 b) 638 c) 826 d) 995 e) 900 04. Extraída do Fiscal de Tributos Estaduais do PI – 2001:
Página 7 de 8
Estatística – Ponto dos Concursos
Ponto 8-Interpolação Linear da Ogiva
A tabela abaixo mostra a distribuição de freqüências obtida de uma amostra aleatória dos salários anuais em reais de uma firma. As freqüências são acumuladas. Classes de (5.000 – (6.500 – (8.000 – (9.500 – (11.000 – (12.500 – (14.000 –
Salários 6.500) 8.000) 9.500) 11.000) 12.500) 14.000) 15.500)
Freqüências 12 28 52 74 89 97 100
Deseja-se estimar, via interpolação da ogiva, o nível salarial populacional que não é ultrapassado por 79% da população. Assinale a opção que corresponde a essa estimativa. a)R$ 10.000,00 b)R$ 9.500,00 c)R$ 12.500,00 d)R$ 11.000,00 e)R$ 11.500,00
05. Extraída do Fiscal de Tributos Estaduais do PA – 2002: A tabela de freqüências abaixo correspondentes a uma amostra economistas (Y)- em R$1.000,00, X. Não existem realizações de classes salariais.
Classes 29,4 --- 39,5 39,5 --- 49,5 49,5 --- 59,5 59,5 --- 69,5 69,5 --- 79,5 79,5 --- 89,5 89,5 --- 99,5
apresenta as freqüências acumuladas (F) da distribuição dos salários anuais de do departamento de fiscalização da Cia. Y coincidentes com as extremidades das
F 2 6 13 23 36 45 50
Assinale a opção que corresponde ao valor q, obtido por interpolação da ogiva, que, estima-se, não é superado por 80% das realizações de Y. a) 82,0 b) 80,0 c) 83,9 d) 74,5 e) 84,5 Boa sorte!
Página 8 de 8
ESTATÍSTICA – Ponto dos Concursos
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Página 1 de 10
RESOLUÇÃO DOS EXERCÍCIOS DE INTERPOLAÇÃO DA OGIVA Olá, amigos! Nós, de novo! E ai? Resolveram as questões da última aula? Espero que tenham tentado ( e conseguido, obviamente!). Faremos apenas as resoluções e os comentários pertinentes àquelas questões e, nas próximas aulas avançaremos na matéria. Vamos lá! Extraído do AFRF-2002.1 1. Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balançco de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes P(%) 70-90 5 90-110 15 110-130 40 130-150 70 150-170 85 170-190 95 190-210 100
Assinale a opção que corresponde à estimativa da freqüência relativa de observações de X menores ou iguais a 145. a) 62,5% d) 45,0% b) 70,0% e) 53,4% c) 50,0% Sol.: Esta questão pede a resposta em valores percentuais, ou seja, ela quer que trabalhemos com freqüências relativas, mais especificamente com a freqüência relativa simples (Fi). Essa constatação foi fácil! Resta agora verificar se a coluna fornecida foi já a Fi, ou se foi alguma outra. Ora, o enunciado foi explícito, afirmando que a coluna P “representa a freqüência relativa acumulada”. Já aprendemos, neste caso, o que fazer para chegarmos à coluna da Freqüência Relativa Simples (Fi). Esse estudo já foi objeto do Ponto n.º 05 (“Trabalhando com as Freqüências Acumuladas”) e na segunda página do Ponto n.º 06 (“Exercícios de Colunas de Freqüências”) trabalhamos exatamente este enunciado, de forma que chegamos ao seguinte: Classes 70-90 90-110 110-130 130-150 150-170 170-190 190-210
Fac ↓ 5% 15% (15%-5%=) 40% (40%-15%=) 70% (70%-40%=) 85% (85%-70%=) 95% (95%-85%=) 100% (100%-95%=)
Fi 5% 10% 25% 30% 15% 10% 5%
A questão quer saber valores “menores ou iguais a 145”. É fácil verificar que este valor (145) está inserido na quarta classe (130 |-- 150). Logo, trabalharemos a regra de três exatamente aí, tendo em vista que as freqüências relativas das três primeiras classes participarão integralmente da resposta. Ou seja, a situação será a seguinte: Página 1 de 10
ESTATÍSTICA – Ponto dos Concursos
Classes 70-90 90-110 110-130 130-150 150-170 170-190 190-210
Fi 5% 10% 25% 30% 15% 10% 5%
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Æ Æ Æ Æ
participa participa participa participa
Página 2 de 10
integralmente da resposta! integralmente da resposta! integralmente da resposta! parcialmente da resposta!
A primeira parte desta regra de três levará em conta a quarta classe completa. Temos uma amplitude de h=20 e uma freqüência relativa simples de Fi=30%. Daí: 20 --- 30% (vinte está para trinta por cento) Na segunda parte da regra de três, trabalhamos com a classe “quebrada”. Ora, menores ou iguais a 145, nesta classe, nós temos de 130 até 145. Logo, para este enunciado, a amplitude aqui desejada será esta diferença: (145 – 130)=15. Daí, teremos: 15 --- X%
(quinze está para X%)
Nossa regra de três completa ficará assim: 20 --- 30% 15 --- X% Resolvendo, ficaremos com: X = (15 . 30%)/20
Æ
X = 450%/20 Æ X=22,5%
Logo, este valor encontrado será a parcela de participação da quarta classe na resposta! Contudo, é evidente que as freqüências relativas das três primeiras classes também participarão do resultado, e de forma integral, como vimos acima! Assim, teremos: Æ Æ Æ Æ
Primeira classe:(70 Segunda classe: (90 Terceira classe:(110 Quarta classe: (130
|--- 90) Æ 5% dos elementos (Fi=5%) |--- 110) Æ 10% dos elementos (Fi=10%) |--- 130) Æ 25% dos elementos (Fi=25%) |--- 150) Æ 22,5% dos elementos (X=22,5%) ------------------------------------Total: 62,5% dos elementos! Æ Resposta!
02. Extraída do AFRF-2001: Freqüências acumuladas de salários anuais, em milhares de reais, da Cia. Alfa. Classes de salários Freqüências acumuladas Página 2 de 10
ESTATÍSTICA – Ponto dos Concursos
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Página 3 de 10
3 ; 6 12 6 ; 9 30 9 ; 12 50 12 ; 15 60 15 ; 18 65 18 ; 21 68 Suponha que a tabela de freqüências acumuladas tenha sido construída a partir de uma amostra de 10% dos empregados da Cia. Alfa. Deseja-se estimar, utilizando interpolação linear da ogiva, a freqüência populacional de salários anuais iguais ou inferiores a R$7.000,00 na Cia. Alfa. Assinale a opção que corresponde a este número. a) 150 b)120 c)130 d) 160 e)180 Sol.: Esta questão é para observadores! Pra começo de conversa, o enunciado vem falando que as freqüências representam uma amostra de 10% dos empregados, ou seja, apenas 10% dos elementos do conjunto estão representados na amostra. Observado isto, a questão pede um resultado referente à “freqüência populacional”. Ora, “populacional” significa “da população”! Se a amostra representa 10% da população, qualquer resultado encontrado para a amostra terá que ser multiplicado por 10, para se chegar ao resultado correspondente da população. Claro: 10%(amostra) x 10 = 100%(população) Outra coisa: os limites das classes são valores expressos na casa das unidades (3, 6, 9) e das dezenas (12, 15, 18, 21) e o enunciado fala em valores “iguais ou inferiores a 7.000”. A explicação está acima da tabela, quando a questão diz “freqüências... em milhares de reais”. Ou seja, onde existe um 3, leia-se 3.000; onde existe um 9, leia-se 9.000, e assim por diante. Tudo isso é feito para tentar complicar um pouco o raciocínio do aluno, todavia, na essência, a questão é fácil do mesmo jeito! Feitas estas preleções exordiais (!), temos que passar àquele trabalho já conhecido nosso, de chegarmos aos valores da freqüência absoluta simples – fi. Isso já o fizemos no Ponto n.º6 (“Exercícios de Colunas de Freqüências”), quando trabalhamos exatamente este enunciado. O resultado foi o seguinte: Classes de Salários (3 ; 6] (6 ; 9] (9 ; 12] (12 ; 15] (15 ; 18] (18 ; 21]
30 50 60 65 68
fac ↓ 12 (30 – 12=) (50 – 30=) (60 – 50=) (65 – 60=) (68 – 65=)
fi 12 18 20 10 5 3
Pois bem! Valores iguais ou inferiores a R$7.000,00 passarão a ser, para nós, valores iguais ou inferiores a 7 (conforme vimos acima a questão dos milhares de reais!). Pela simples observação, constataremos que participa integralmente da resposta a freqüência da primeira classe. Já a segunda classe participará apenas parcialmente do resultado. Ou seja: Classes de Salários (3 ; 6]
fi 12
Æ participa integralmente da resposta! Página 3 de 10
ESTATÍSTICA – Ponto dos Concursos
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Página 4 de 10
(6 ; 9] 18 Æ participa parcialmente da resposta! (9 ; 12] 20 (12 ; 15] 10 (15 ; 18] 5 (18 ; 21] 3 Daí, trabalhando a regra de três com a segunda classe (naturalmente!), teremos: 3 --- 18 1 --- X Multiplicando em cruz, chegamos a: X = (1 . 18)/3 Æ
X = 6
Acharemos a resposta somando ao X a participação integral da primeira classe. Daí: Æ Primeira classe:(3 |--- 6) Æ 12 elementos (fi=12) Æ Segunda classe: (6 |--- 9) Æ 6 elementos (X=6) ------------------------Total: 18 elementos! Conforme a observação que fizemos no início desta resolução, os resultados obtidos para a amostra teriam que ser multiplicados por 10, para chegarmos aos resultados da população. Em vista disso, faremos: 18 x 10 = 180 Æ Resposta da Questão!
03. Extraída do AFRF-2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes 29,4 --- 39,5 39,5 --- 49,5 49,5 --- 59,5 59,5 --- 69,5 69,5 --- 79,5 79,5 --- 89,5 89,5 --- 99,5
Freqüência (f) 4 8 14 20 26 18 10
Assinale a opção que corresponde à estimativa do número de indivíduos com valores do atributo X menores ou iguais a 95,5 e maiores do que 50,5. a) 700 b)638 c)826 d)995 e)900 Sol.: Esta questão é mais trabalhosa, mas igualmente fácil! Apenas que teremos dois trabalhos, em vez de um! Ou seja, faremos duas regras de três, com as duas classes que participarão parcialmente do resultado! Vamos lá! Novamente nesse enunciado, a questão veio com aquela história de amostra e população! Disse que a amostra é de 100 e que a população é de 1000 indivíduos! Ora, deduzimos que a população é “10 vezes” o tamanho da amostra. Logo, qualquer resultado encontrado para a amostra terá que ser multiplicado por 10, para se chegar ao correspondente resultado da população! Até aqui, tudo bem! Página 4 de 10
ESTATÍSTICA – Ponto dos Concursos
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Página 5 de 10
A questão ofereceu ainda algumas facilidades: primeiramente, ela já forneceu a freqüência absoluta simples (fi), e pediu como resposta um “número de indivíduos”, ou seja, ela quer que trabalhemos exatamente com esta fi. Valores maiores que 50,5 e menores que 95,5! Quais as classes que participarão desta resposta? Vejamos: Classes 29,4 --- 39,5 39,5 --- 49,5 49,5 --- 59,5 59,5 --- 69,5 69,5 --- 79,5 79,5 --- 89,5 89,5 --- 99,5
Freqüência (f) 4 8 14 Æ participa parcialmente! 20 Æ participa integralmente! 26 Æ participa integralmente! 18 Æ participa integralmente! 10 Æ participa parcialmente!
Daí, teremos que fazer duas regras de três: uma para cada classe que participa apenas parcialmente da resposta. Ficarão assim: Primeira Regra de Três, referente à terceira classe: 10 --- 14 9 --- X Daí: X = (9 . 14)/10
Æ
X = 126/ 10 Æ X = 12,6
Segunda Regra de Três, referente à última classe: 10 --- 10 6 --- Y Daí: Y = (6 . 10)/10
Æ Y = 60 / 10
Æ
Y = 6
Finalmente, passamos à composição do resultado: Æ Æ Æ Æ Æ
Terceira classe: Quarta classe: Quinta classe: Sexta classe: Sétima classe:
(49,5|--- 59,5) Æ 12,6 elementos (X=12,6) (59,5|--- 69,5) Æ 20 elementos (fi=20) (69,5 |--- 79,5) Æ 26 elementos (fi=26) (79,5 |--- 89,5) Æ 18 elementos (fi=18) (89,5 |--- 99,5) Æ 6 elementos (Y=6) ------------------------Total: 82,6 elementos!
Como pretendemos chegar ao resultado relacionado à população, temos que multiplicar a resposta da amostra por 10, conforme vimos acima! Ficaremos assim: 82,6 x 10 = 826
Æ
Resposta da Questão!
Página 5 de 10
ESTATÍSTICA – Ponto dos Concursos
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Página 6 de 10
04. Extraída do Fiscal de Tributos Estaduais do PI – 2001: A tabela abaixo mostra a distribuição de freqüências obtida de uma amostra aleatória dos salários anuais em reais de uma firma. As freqüências são acumuladas. Classes de (5.000 – (6.500 – (8.000 – (9.500 – (11.000 – (12.500 – (14.000 –
Salários 6.500) 8.000) 9.500) 11.000) 12.500) 14.000) 15.500)
Freqüências 12 28 52 74 89 97 100
Deseja-se estimar, via interpolação da ogiva, o nível salarial populacional que não é ultrapassado por 79% da população. Assinale a opção que corresponde a essa estimativa. a)R$10.000,00 b)R$9.500,00 c)R$12.500,00 d)R$11.000,00 e)R$11.500,00 Sol.: Novamente aqui se faz necessário trabalhar as colunas de freqüências para se chegar à freqüência absoluta simples, fi. Como isso já foi feito no Ponto n.º06 (“Exercícios de Colunas de Freqüências”), partiremos para o resultado, como segue abaixo: Classes de Salários (5.000-6.500) (6.500-8.000) (8.000-9.500) (9.500-11.000) (11.000-12.500) (12.500-14.000) (14.000-15.500)
28 52 74 89 97 100
fac ↓ 12 (28-12=) (52-28=) (74-52=) (89-74=) (97-89=) (100-97=)
fi 12 16 24 22 15 8 3
Aqui, precisaremos ir além, uma vez que o enunciado pede os salários “não ultrapassados por 79% da população”. Quero dizer que precisaremos encontrar a coluna da freqüência relativa simples (Fi). Para isso, usamos a relação que há entre esta Fi e a freqüência absoluta simples (fi). No caso desta questão, será facílimo este trabalho, pois o número de elementos da questão é n=100. Daí, teremos: Classes de Salários (5.000-6.500) (6.500-8.000) (8.000-9.500) (9.500-11.000) (11.000-12.500) (12.500-14.000) (14.000-15.500)
28 52 74 89 97 100
fac ↓ 12 (28-12=) (52-28=) (74-52=) (89-74=) (97-89=) (100-97=)
fi 12 16 24 22 15 8 3
Fi 12% 16% 24% 22% 15% 8% 3%
Página 6 de 10
ESTATÍSTICA – Ponto dos Concursos
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Página 7 de 10
Pois bem! Você já deve ter percebido que esta questão é exatamente semelhante àquele exemplo da aula passada (Ponto 08), a quem denominamos “Variação Importante”. É isso mesmo! Então, vamos verificar como ficam os valores acumulados da freqüência relativa – Fi -, a fim de descobrirmos com qual das classes trabalharemos nossa regra de três. Vejamos: na primeira classe, temos 12% dos elementos do conjunto; somando aos 28% da segunda classe, passamos a 40%; somando agora esses 40% acumulados com os 24% da terceira classe, passaríamos então a 52% dos elementos; somando a esses 52% acumulados os 22% da quarta classe, chegamos aos 74% do total de elementos; finalmente, somando os 74% já acumulados aos 15% da quinta classe, passaríamos já aos 89% dos elementos deste conjunto! Ou seja, quando chegamos à quinta classe, se adicionarmos toda a sua freqüência relativa, ultrapassaremos os 79% desejados pelo enunciado! Conclusão: trabalharemos a regra de três com a quinta classe da nossa distribuição! Atenção agora: antes de chegarmos à quinta classe, tínhamos acumulados 74% do total dos elementos. Para chegarmos aos 79% desejados pela questão, teremos que “avançar” mais quanto? Ora, a diferença: (79% - 74%)=5%. Ou seja: faltam 5% dos elementos da quinta classe para chegarmos a nossa resposta! Nossa situação, portanto, é a seguinte: Classes de Salários (5.000-6.500) (6.500-8.000) (8.000-9.500) (9.500-11.000) (11.000-12.500) (12.500-14.000) (14.000-15.500)
fac ↓ 12 28 52 74 89 97 100
fi
Fi
12 16 24 22 15 8 3
12% 16% 24% 22% 15% 8% 3%
Æ Æ Æ Æ Æ
12% acumulados 28% acumulados 52% acumulados 74% acumulados faltam 5% para chegarmos aos 79%!
Trabalhando a regra de três na quinta questão, ficaremos com: 1500 --- 15% X --- 5% Daí, teremos: X = (1500.5%)/15% Æ E: X=500 Traduzindo: 500 elementos representam exatamente 5% do total de elementos do conjunto, que precisaríamos “avançar” nesta quinta classe, para chegarmos aos 79% desejados. Cuidado agora para saber o que fazer com esse valor encontrado! Como havíamos visto na aula passada, este valor X=500 será somado ao limite inferior da classe na qual trabalhamos a regra de três. Daí, ficaremos com: 11.000 + 500 = 11.500 Æ Resposta da Questão!
Página 7 de 10
ESTATÍSTICA – Ponto dos Concursos
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Página 8 de 10
05. Extraída do Fiscal de Tributos Estaduais do PA – 2002: A tabela de freqüências abaixo apresenta as freqüências acumuladas (F) correspondentes a uma amostra da distribuição dos salários anuais de economistas (Y)- em R$1.000,00, do departamento de fiscalização da Cia. X. Não existem realizações de Y coincidentes com as extremidades das classes salariais. Classes F 29,4 --- 39,5 2 39,5 --- 49,5 6 49,5 --- 59,5 13 59,5 --- 69,5 23 69,5 --- 79,5 36 79,5 --- 89,5 45 89,5 --- 99,5 50 Assinale a opção que corresponde ao valor q, obtido por interpolação da ogiva, que, estima-se, não é superado por 80% das realizações de Y. a) 82,0 b) 80,0 c) 83,9 d) 74,5 e) 84,5 Sol.: Aqui, mais uma questãozinha no modelo da anterior! Deseja-se encontrar o valor não superado por 80% dos elementos. Já sabemos, portanto, que vamos trabalhar com a freqüência relativa simples, Fi! A análise da coluna de freqüência fornecida já foi realizada no Ponto n.º06, em que trabalhamos este enunciado, para chegarmos à freqüência absoluta simples. O resultado foi o seguinte: Classes 29,5 – 39,5 39,5 – 49,5 49,5 - 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5
6 13 23 36 45 50
fac ↓ 2 (6-2=) (13-6=) (23-13=) (36-23=) (45-36=) (50-45=)
fi 2 4 7 10 13 9 5
Feito isso, passaremos à construção da coluna da Freqüência Relativa Simples. Basta usarmos a relação (Fi=fi/n) para chegarmos ao seguinte: Classes 29,5 – 39,5 39,5 – 49,5 49,5 - 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5
fac ↓ 2 6 13 23 36 45 50
fi 2 4 7 10 13 9 5
Fi 4% 8% 14% 20% 26% 18% 10%
Observemos que o “n” neste caso foi igual a 50, que é o valor da fac da última classe! Já sabemos disso, naturalmente! Faremos agora a análise dos valores acumulados da Fi, para descobrirmos com qual das classes trabalharemos a nossa regra de três. Na primeira classe, temos 4% dos elementos; somando com os 8% da segunda classe, passamos a 12%; somando estes 12% acumulados com os 14% da terceira classe, passamos a 26%; somando estes 26% acumulados com os 20% da quarta classe, chegamos aos 46% dos elementos do conjunto; (...calma, ta Página 8 de 10
ESTATÍSTICA – Ponto dos Concursos
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Página 9 de 10
chegando!); somando os 46% acumulados com os 26% da quinta classe, chegamos a 72% do total dos elementos; finalmente, somando estes 72% acumulados até aqui com os 18% da sexta classe, já passaríamos dos 80% desejados pelo enunciado! Ou seja, até a quinta classe já acumulamos 72% do total dos elementos. Quanto falta “avançar” para alcançarmos os 80% procurados pela questão? Apenas a diferença: (80% - 72%) = 8%. Traduzindo: teremos que “avançar” 8% na sexta classe, para chegarmos à resposta! Ficou evidente que trabalharemos nossa regra de três na sexta classe desta distribuição. A situação é a seguinte: Classes 29,5 – 39,5 39,5 – 49,5 49,5 – 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5
fac 2 6 13 23 36 45 50
fi 2 4 7 10 13 9 5
Fi 4% 8% 14% 20% 26% 18% 10%
Æ Æ Æ Æ Æ Æ
4% acumulados 12% acumulados 26% acumulados 46% acumulados 72% acumulados faltam 8% para chegarmos aos 80%!
A regra de três que faremos é a seguinte: 10 --- 18% X --- 8% Daí, teremos que: X = (10 . 8%)/18%
Æ
E: X=4,4
Finalmente, somando o valor encontrado ao limite inferior da sexta classe, chegaremos à resposta: 79,5 + 4,4 = 83,9
Æ Resposta da Questão!
E aí, meus bons amigos, como nos saímos? Espero que bem! De qualquer forma, ninguém sai perdendo: quem acertou, porque já começa a sentir segurança; quem errou, porque não vai errar mais, e com isso, já garantiu um ponto extra na próxima prova! Tenho recebido vários e-mails me pedindo pra apressar o passo. Outros tantos pedem que eu continue nesse ritmo... O fato é que estou trabalhando nossas aulas na medida que o tempo me permite! Peço licença agora para fazer uma pequena propaganda ao pessoal de Fortaleza: estou tentando formar uma turma preparatória de Estatística e Matemática Financeira. Aproveito o ensejo para lembrar que apenas com este curso o aluno já estará se preparando para várias provas, como Fiscal da Receita, Fiscal de Fortaleza (ISS), Fiscal do Estado do Ceará (ICMS) e Fiscal do INSS, além de outros... Início IMEDIATO!! Aos interessados (se houver algum), peço que me mandem um e-mail. Obrigado! Próxima aula, começaremos as medidas de posição! A primeira a ser vista será a Média! O bonde está andando, minha gente! Página 9 de 10
ESTATÍSTICA – Ponto dos Concursos
Ponto 9 – Resulução dos exercícios de interpolação da ogiva
Página 10 de 10
O “dever de casa” de hoje é revisar todas as aulas passadas, e refazer todos os exercícios que foram propostos até aqui! Isso é importante que seja feito, porque daqui pra frente, a matéria vai se acumulando, se acumulando... e quem não revisar o que já aprendeu, vai esquecendo, esquecendo... até não saber mais nem o que é um rol! Fico por aqui. Um grande abraço e até a próxima!
Página 10 de 10
ESTATÍSTICA-Ponto dos Concursos
Ponto 10-DISTRIBUIÇÃO DE FREQÜENCIAS SIMÉTRICAS
Página 1 de 8
DISTRIBUIÇÃO DE FREQÜENCIAS SIMÉTRICAS Olá amigos! Eu havia dito na última aula que iniciaríamos, na seqüência, as medidas de posição, a começar pela Média! Ocorreu-me, todavia, que seria mais interessante e mais conveniente apresentar um tópico bastante simples da nossa matéria, e que, eventualmente, nos poderá ser extremamente útil, sobretudo na determinação destas mesmas medidas – média, moda e mediana! Destarte, embora o estudo da Média fique adiado para a próxima aula, estou certo de que não sairemos perdendo com isso! (Vocês mesmos me dirão no futuro!). Hoje, portanto, iremos analisar a Distribuição de Freqüência, quanto a um aspecto da maior relevância: a Simetria do conjunto. Falar em simetria de uma distribuição é falar, a grosso modo, de como os elementos do conjunto se “distribuem” entre as classes. Se o fazem de uma forma “eqüitativa” ou não, ou por outra, de uma forma simétrica ou assimétrica. Para que o assunto seja mais “palpável”, apresentaremos o gráfico mais importante da Estatística (pelo menos, para nós concurseiros!): o chamado HISTOGRAMA! # Histograma: Sempre que desejarmos representar graficamente uma Distribuição de Freqüências, o faremos por meio deste tipo de gráfico! Então, lembraremos que o Histograma é o gráfico que é um “retrato” da nossa distribuição! E é muito fácil de ser construído e interpretado. No eixo das abscissas (o horizontal), estarão dispostos os elementos do conjunto – Xi – agrupados, naturalmente, em classes. Enquanto que nas ordenadas (eixo vertical) ficarão as freqüências absolutas simples – fi. Vejamos abaixo: fi (freqüência simples)
Xi (classes) Daí, as classes serão representadas por retângulos (um para cada classe), cuja base será determinada pelos limites da classe (linf e lsup) e cuja altura, pela freqüência absoluta simples – fi. Vejamos o exemplo abaixo, considerando a seguinte Distribuição de freqüências: Classes 0 |--- 10 10|--- 20 20|--- 30 30|--- 40 40|--- 50 50|--- 60 60|--- 70 70|--- 80 80|--- 90 90|--- 100 100|--- 110
fi 2 3 6 9 12 15 12 9 6 3 2
ESTATÍSTICA-Ponto dos Concursos
Ponto 10-DISTRIBUIÇÃO DE FREQÜENCIAS SIMÉTRICAS
Página 2 de 8
Teremos para esse conjunto, o seguinte Histograma:
Percebamos que para cada classe haverá um retângulo, cuja altura nos dirá a freqüência correspondente! Mais simples, impossível! Só de olharmos para o Histograma, já temos uma excelente noção visual de como os elementos deste conjunto se distribuem. No caso desse nosso conjunto, se traçarmos um pontilhado dividindo o gráfico (verticalmente) em duas metades, teremos o seguinte:
O que um bom observador constataria neste momento? Que os elementos do conjunto estão distribuídos de uma forma simétrica, a considerar como referência a classe intermediária! Todos perceberam? É como se a linha pontilhada fosse um “espelho”. Notaram? Outro exemplo! Façamos o mesmo procedimento, ou seja, encontremos o Histograma e tracemos uma linha divisória partindo da classe intermediária, para a seguinte Distribuição de Freqüência:
ESTATÍSTICA-Ponto dos Concursos
Ponto 10-DISTRIBUIÇÃO DE FREQÜENCIAS SIMÉTRICAS
Classes 0 |--- 10 10|--- 20 20|--- 30 30|--- 40 40|--- 50 50|--- 60 60|--- 70 70|--- 80 80|--- 90 90|--- 100 100|--- 110
Página 3 de 8
fi 2 6 11 15 8 7 6 4 3 2 1
Nosso Histograma agora será o seguinte:
Separando-o em duas metades a partir da classe intermediária, ficaremos com o seguinte:
ESTATÍSTICA-Ponto dos Concursos
Ponto 10-DISTRIBUIÇÃO DE FREQÜENCIAS SIMÉTRICAS
Página 4 de8
Facilmente verificamos que, para esse último exemplo, não ocorreu a mesma simetria observada naquele primeiro conjunto que estudamos. Ou seja, tomando a classe intermediária da distribuição como referência, os elementos não se dispuseram de uma forma simétrica. Percebamos que aqui a linha pontilhada não funcionou como um “espelho”! Diz-se, nesse caso, que esta distribuição é assimétrica. Surge a pergunta: precisaremos construir um Histograma sempre que desejarmos saber se uma Distribuição de Freqüências é simétrica? Claro que não! Apresentamos o Histograma com o intuito de proporcionar um melhor entendimento – uma melhor idéia inicial – do que vem a ser a simetria! Quando, porém, desejarmos afirmar se uma distribuição é simétrica ou não, o faremos utilizando uma técnica que, aliás, não será encontrada em nenhum livro de Estatística (que se preze!): a Técnica do Elevador, que passamos a explicar neste momento. # “Técnica do Elevador”: Antes de mais nada, uma observação importante: doravante, sempre que nos depararmos com uma Distribuição de Freqüências, a primeira preocupação que teremos será justamente a seguinte: SABER SE A DISTRIBUIÇÃO É SIMÉTRICA, ou não! Qual a razão disso? Oportunamente, veremos as facilidades de se determinar as medidas de posição (média, moda e mediana) para uma distribuição simétrica, sem necessitar fazer uma só conta! Por hora, nossa preocupação será apenas identificar quando a distribuição será simétrica. E isto é facílimo! CASO 01) Distribuição com número ímpar de classes. Se a distribuição apresenta um número ímpar de classes, o primeiro passo é achar a classe intermediária. Por exemplo, sendo cinco classes, a intermediária é a terceira, pois ficam duas classes para cima e duas para baixo. Se a distribuição tiver sete classes, a intermediária será a quarta: ficarão três classes para cima e três para baixo; e assim por diante. Vejamos os exemplos abaixo:
ESTATÍSTICA-Ponto dos Concursos
Ponto 10-DISTRIBUIÇÃO DE FREQÜENCIAS SIMÉTRICAS
Distribuição com sete classes: Classes 70-90 90-110 110-130 130-150 Æ 150-170 170-190 190-210
Página 5 de 8
Classe intermediária!
Distribuição com cinco classes: Classes 10-20 20-30 30-40Æ Classe intermediária! 40-50 50-60 Feito isso, analisaremos se a distribuição é simétrica observando a coluna da freqüência absoluta simples – fi – partindo da classe intermediária. Vejamos o exemplo abaixo: Classes 70-90 90-110 110-130 130-150 150-170 170-190 190-210
fi 7 16 28 35 28 16 7
Partindo da freqüência simples da classe intermediária, basta comparar as freqüências das classes “vizinhas” para cima e para baixo. Ou seja, “subindo e descendo um andar”, na coluna da fi, observamos que os valores são iguais. Para efeitos mneumônicos, estamos utilizando a infalível “Técnica do Elevador”. Vejamos: Classes 70-90 90-110 110-130 130-150 150-170 170-190 190-210
fi 7 16 28 35 28 16 7
Se as freqüências que achamos com este procedimento são iguais, então prosseguimos com a mesma tática, ou seja, “subindo e descendo um andar”, a partir de onde paramos. Desse modo, partindo das duas freqüências 28, subiremos e desceremos um andar, e chegaremos ao seguinte:
ESTATÍSTICA-Ponto dos Concursos
Ponto 10-DISTRIBUIÇÃO DE FREQÜENCIAS SIMÉTRICAS
Classes 70-90 90-110 110-130 130-150 150-170 170-190 190-210
Página 6 de 8
Fi 7 16 28 35 28 16 7
Novamente, valores iguais: 16! Em sendo iguais, continuaremos “subindo e descendo um andar”, a partir destas freqüências 16. Finalmente, teremos: Classes 70-90 90-110 110-130 130-150 150-170 170-190 190-210
Fi 7 16 28 35 28 16 7
Chegamos, daí, ao final da utilização da Técnica do Elevador, subindo e descendo um andar a partir da freqüência absoluta simples da classe intermediária, e constatamos que, a cada vez que subíamos e descíamos uma classe na coluna da fi, os valores destas freqüências eram os mesmos! Conclusão: estamos diante de uma distribuição de freqüências simétrica! Se em pelo menos uma das aplicações da técnica do elevador, ou seja, em qualquer das vezes que subirmos e descermos um andar, encontrarmos dois valores de fi diferentes, então a distribuição não será simétrica, mas assimétrica! Em 99,9% das questões de concurso, as distribuições simétricas não aparecem! Pois facilitaria sobremaneira a resolução da prova, como veremos oportunamente. Mas, doravante, toda vez que surgir uma distribuição de freqüências em nossa frente, teremos esta preocupação: verificar se ela é simétrica, ou se não o é! CASO 02) Distribuição com número par de classes. Se a distribuição trouxer um número par de classes, nosso primeiro passo será, igualmente, identificar as classes intermediárias, que agora serão duas (em vez de uma só). Por exemplo, sendo quatro classes, as intermediárias serão a segunda e a terceira, pois ficará uma classe para cima e uma para baixo. Se a distribuição tiver seis classes, as intermediárias serão a terceira e a quarta: ficarão duas classes para cima e duas para baixo; e assim por diante. Vejamos os exemplos abaixo: Distribuição com quatro classes: Classes 10-20 20-30 Æ Classe intermediária! 30-40 Æ Classe intermediária! 40-50 Distribuição com seis classes:
ESTATÍSTICA-Ponto dos Concursos
Classes 10-20 20-30 30-40 40-50 50-60 60-70
Ponto 10-DISTRIBUIÇÃO DE FREQÜENCIAS SIMÉTRICAS
Æ Æ
Página 7 de 8
Classe intermediária! Classe intermediária!
Isso feito, procederemos exatamente da forma como fizemos no primeiro caso (número ímpar de classes), e aplicaremos a técnica do elevador, analisando a coluna da freqüência absoluta simples – fi – partindo das duas classes intermediárias. Vejamos o exemplo abaixo: Classes 10-20 20-30 30-40 40-50 50-60 60-70
fi 7 15 23 23 15 7
Para início de conversa, as duas freqüências absolutas simples destas duas classes intermediárias têm que ser iguais. Caso contrário, nossa análise já estaria encerrada. Considerando, portanto, a igualdade entre as fi das classes intermediárias, prosseguiríamos comparando as freqüências das classes “vizinhas” para cima e para baixo. Ou seja, “subindo e descendo um andar”, na coluna da fi, observamos que os valores são iguais. Vejamos: Classes 10-20 20-30 30-40 40-50 50-60 60-70
fi 7 15 23 23 15 7
Se as freqüências que achamos com este procedimento são iguais, então prosseguimos com a mesma tática, ou seja, “subindo e descendo um andar”, a partir de onde paramos. Desse modo, partido das duas freqüências 15, subiremos e desceremos um andar, e chegaremos ao seguinte: Classes 10-20 20-30 30-40 40-50 50-60 60-70
fi 7 15 23 23 15 7
Chegamos, novamente, ao final da utilização da técnica do elevador, para este exemplo. Constatamos que, a cada vez que subíamos e descíamos uma classe na coluna da fi, os valores destas freqüências eram o mesmo! Conclusão: simétrica!
estamos
novamente
diante
de
uma
distribuição
de
freqüências
ESTATÍSTICA-Ponto dos Concursos
Ponto 10-DISTRIBUIÇÃO DE FREQÜENCIAS SIMÉTRICAS
Página 8 de 8
Ressaltamos mais uma vez que a Distribuição só será Simétrica se, em todas as vezes que “subirmos e descermos um andar”, encontrarmos o mesmo valor de fi! Caso contrário, estamos diante de uma distribuição assimétrica. Este assunto, Simetria da Distribuição, guarda estreita relação com as medidas de posição! Quando, em um futuro próximo, concluirmos o estudo destas medidas – média, moda e mediana -, retornaremos a falar de Assimetria e passaremos a conhecer melhor este assunto. Aprenderemos que uma distribuição, no tocante à sua simetria, pode assumir uma das seguintes três situações: ser simétrica, ou de assimetria positiva, ou ainda de assimetria negativa. Aprenderemos também que, apenas conhecendo duas quaisquer destas medidas de posição, já teremos como afirmar em qual das três situações de simetria se encontra aquele conjunto! Mas isso a seu tempo! Hoje ficamos por aqui. Vou ver se consigo espremer as horas do meu dia, para tentar adiantar um pouco nossa matéria. Acreditem-me: tenho feito o que posso! Conto com a paciência (eu sei que é difícil!) de vocês, meus alunos virtuais! Próxima aula, impreterivelmente, iniciaremos o assunto da Média! Um grande abraço e até a próxima! PS: Não tem exercício desse assunto, portanto minha recomendação é ainda de uma boa revisão do que foi visto! Sobretudo pra que ainda não a fez...!
ESTATÍSTICA-Ponto dos Concursos
Ponto 11-MÉDIA ARITMÉTICA
Página 1 de 14
MÉDIA ARITMÉTICA Agora é pra valer! Todos bem? Vamos iniciando hoje as Medidas de Posição! Se uma prova de Estatística tiver apenas uma questão, há imensa chance de ela versar sobre este assunto. Portanto, nem preciso falar da importância desta aula, e das seguintes! Adiante! A Média é a mais importante das Medidas de Posição e saber calculá-la é simplesmente essencial para qualquer prova de Estatística. Quando a questão pedir que se calcule a Média, simplesmente isso, estaremos tratando da Média Aritmética. Na verdade, há outros dois tipos de Média: a Geométrica e a Harmônica. Como estas duas últimas costumam ser quase sempre ignoradas nas provas, embora presentes no programas dos editais, as explicaremos mais adiante, em uma aula à parte. Æ Média para o Rol: Caso a questão da prova nos forneça os dados do conjunto dispostos em forma de um rol, utilizaremos para o cálculo da Média a seguinte fórmula:
⎛ ∑ Xi ⎞ ⎟ X =⎜ ⎜ n ⎟ ⎝ ⎠ Para quem não está familiarizado, o símbolo Σ significa “somatório”, entendendo-se que teremos que somar o que estiver disposto após ele. No nosso caso, ΣXi nos indica que somaremos os elementos (Xi) do rol. Conforme o restante da fórmula, em seguida, dividiremos o resultado desta soma pelo número de elementos do conjunto, o nosso “n”. Vejamos um exemplo! Calcule a média aritmética do conjunto abaixo: {1, 3, 5, 7, 9, 11, 13} Não há nenhuma dificuldade em se constatar que o conjunto foi apresentado sob a forma de um rol. Aliás, temos uma aula passada – o Ponto nº07 – em que falamos das formas de apresentação dos dados! Daí, identificado o rol, resta apenas aplicarmos a fórmula: → X = 49 → Y = 7 7 7 Facílimo, não? Pena que não sejam tão freqüentes questões assim... só bem raramente! Sol.:
X = (1 + 3 + 5 + 7 + 9 + 11 + 13)
Æ Média para Dados Tabulados: Quando o conjunto nos for apresentado sob a forma de Dados Tabulados Não Agrupados em Classes (vide Ponto nº07!), nossa Média será calculada pela seguinte fórmula:
ESTATÍSTICA-Ponto dos Concursos
Ponto 11-MÉDIA ARITMÉTICA
Página 2 de 14
⎛ ∑ Xi ⋅ fi ⎞ ⎟ X =⎜ ⎜ ⎟ n ⎝ ⎠ Observemos que, neste caso, para chegarmos ao somatório dos elementos do conjunto, será preciso construirmos a coluna “Xi.fi”, e depois obtermos sua soma. Vejamos um exemplo. Calcular a média aritmética dos dados do conjunto abaixo: Xi 4 5 6 7 8
fi 1 5 6 5 3 n=20
Como primeiro passo construiremos a coluna Xi.fi! Obtendo o somatório desta coluna, precisaremos apenas dividi-lo pelo número total de elementos n. Observemos que o n – número de elementos do conjunto – será calculado pela soma da coluna da freqüência absoluta simples – fi. Ou seja, n = ∑fi . Isso será sempre assim, ou seja, sempre que os dados do conjunto vierem apresentados em uma tabela – ou dados tabulados, ou distribuição de freqüências – o “n” será o somatório da coluna fi. Daí, teremos: Xi 4 5 6 7 8 Soma E, finalmente:
fi 1 5 6 5 3 20
X = (124 / 20)
Xi.fi 4x1=4 5x5=25 6x6=36 7x5=35 8x3=24 124 →
X = 6,2
Æ Média para Distribuição de Freqüências: Aqui nossa atenção deve ser redobrada! E por uma razão muito simples: a grande e considerável maioria das questões de prova que pedem o cálculo da Média costuma apresentar o conjunto sob a forma de uma Distribuição de Freqüências. Logo, é quase certo nos depararmos com essa situação, na qual teremos que utilizar, para determinação da Média, a seguinte fórmula:
⎛ ∑ PM . fi ⎞ ⎟ X =⎜ ⎜ ⎟ n ⎝ ⎠ Comecemos a juntar as peças do quebra-cabeça: no Ponto nº07 vimos que o que diferencia os Dados Tabulados da Distribuição de Freqüências é o fato de ESTATÍSTICA-Ponto dos Concursos
Ponto 11-MÉDIA ARITMÉTICA
Página 3 de 14
que nos Dados Tabulados os elementos aparecem individualizados (Xi) e na Distribuição de Freqüências aparecem em classes. Logo, na fórmula da média para “Distribuição” não vai aparecer o Xi – elemento individualizado. Em seu lugar, deve aparecer um elemento que represente a classe. Aí nos lembramos de
uma observação feita no Ponto n.º03, quando tratamos dos elementos da Distribuição de Freqüências, e veremos o que foi dito: o Ponto Médio é o legítimo representativo de uma classe, ou seja, é o elemento que melhor representa cada classe! Daí, para chegarmos à fórmula da Média para a Distribuição de Freqüências, repete-se a fórmula que usamos para Dados Tabulados, e trocamos Xi (elemento individualizado) pelo Ponto Médio – PM – elemento representativo da classe! Vejamos o exemplo abaixo. Exemplo: Calcular a média aritmética dos dados abaixo:
2 4 6 8 10
Xi !--!--!--!--!---
4 6 8 10 12
fi 3 5 10 5 3 n=26
Teremos aqui de criar mais duas colunas para encontrar a solução: a primeira será a coluna dos Pontos Médios e a segunda será a do produto (PM . fi)! Daí, teremos: 2 4 6 8 10
E, finalmente:
Xi !--!--!--!--!--Soma
4 6 8 10 12
fi 3 5 10 5 3 26
X = 182 / 26
PM 3 5 7 9 11
→
PM.fi 9 25 70 45 33 182
X = 7,00
Este cálculo que fizemos acima, ou seja, a fórmula que utilizamos para determinar a Média da Distribuição de Freqüências consiste no que chamaremos de Cálculo Convencional da Média Aritmética. Todavia, existe uma outra forma de se achar esta medida, e que pode se tornar uma resolução mais rápida e, portanto, mais conveniente! Este método alternativo, na verdade, é o que utilizaremos na nossa prova! Trabalharemos, nesta nova forma de calcular a média, com a chamada Variável transformada! Para entendermos este novo método, precisamos antes conhecer algumas propriedades da Média Aritmética. Vamos a elas!
ESTATÍSTICA-Ponto dos Concursos
Ponto 11-MÉDIA ARITMÉTICA
Página 4 de 14
# Propriedades da Média Aritmética: São várias as propriedades da Média! Aprenderemos agora duas delas, necessárias para utilizarmos, na seqüência, o cálculo da Média pela Variável Transformada: Æ 1ª Propriedade) Se a cada elemento de um conjunto numérico qualquer somarmos ou subtrairmos uma constante, a média ficará acrescida ou subtraída desta constante. Toda atenção a esta propriedade! Nós a chamaremos de Propriedade da Soma e Subtração. Precisaremos dela tanto para marcar uma questão teórica, quanto para resolver uma questão de cálculo. E é bem simples. Vejamos um exemplo: Consideremos o conjunto A = {1, 2, 3, 4, 5}, cuja Média será calculada da seguinte maneira:
X = (1 + 2 + 3 + 4 + 5) / 5 X = 15 / 5 X = 3 → E: → Agora, se a cada elemento Xi deste conjunto original A somarmos constante k=5, por exemplo, passaremos a dispor do conjunto B, dado por:
a
B= {6, 7, 8, 9, 10}. Se formos calcular a Média deste novo conjunto B, teremos: →
X = (6 + 7 + 8 + 9 + 10) / 5
E:
X = 40 / 5
→
X = 8
Ora, em vez de calcularmos a Média do grupo B, poderíamos simplesmente aplicar a propriedade da Soma e Subtração! Se a Média do conjunto original é igual a 3, e apenas somamos todos os elementos deste conjunto a uma constante, usando a propriedade, a nova Média, ou seja, a Média do novo conjunto será a Média do conjunto original somada a esta mesma constante. Teremos: Média de B = Média de A + constante Média de B = 3 + 5 = 8 Uma aplicação prática desta propriedade ocorreu na prova de Fiscal da Receita de 1996, quando o enunciado trazia uma Distribuição de Freqüências, e dizia que os elementos ali dispostos seriam as idades dos funcionários de uma empresa na data de 01/01/1990. Na primeira questão, pedia-se o cálculo da Média. Até aqui tudo bem! Acontece que na quarta questão, o enunciado iria falar que seis anos depois, ou seja, em 01/01/1996, o quadro de pessoal da empresa se mantinha o mesmo, as mesmas pessoas, e se pedia então que se calculasse a nova média do conjunto. Bem criativa esta questão (a resolveremos oportunamente), e muito fácil também! Bastava que se percebesse o seguinte: se o conjunto original trazia uma série de idades em uma data, e o novo conjunto trazia as idades destas mesmas pessoas seis anos mais tarde, é lógico que as novas idades são as idades originais somadas a seis! Claro: daqui a seis anos todos teremos a idade de hoje adicionada a seis. Daí, era só aplicar a propriedade! Como a Média do conjunto original, das idades em 1990, já tinha sido calculada na primeira questão, restava apenas tomar este valor e somar mais
ESTATÍSTICA-Ponto dos Concursos
Ponto 11-MÉDIA ARITMÉTICA
Página 5 de 14
seis! E chegava-se à nova resposta! Uma questão de graça... para quem conhecia a propriedade! Agora há pouco, chamamos a atenção para o fato de que a fórmula que apresentamos para o cálculo da Média era a do cálculo convencional. E que iríamos em breve conhecer o método da Variável Transformada. Pois bem, para usarmos esta nova forma de determinar a Média, como veremos logo a seguir, teremos que aplicar também esta Propriedade da Soma e da Subtração, além da próxima,que se segue. Æ 2ª Propriedade) Se cada elemento de um conjunto numérico qualquer for multiplicado ou dividido por uma constante, a média ficará multiplicada ou dividida por esta constante. Tão importante quanto a anterior, chamaremos esta de Propriedade do Produto e da Divisão. É a correspondente da Propriedade da Soma e Subtração, só que para as operações de multiplicação e divisão. Vejamos um exemplo: Seja o conjunto A = {1, 2, 3, 4, 5}, cuja média já conhecemos do exemplo
X =3. Agora, suponhamos que a cada elemento do conjunto anterior: multipliquemos a constante k=5. Passaremos a ter o novo conjunto B = {5, 10, 15, 20, 25}. Se formos calcular a média deste novo conjunto B, faremos: X
= (5 + 10 + 15 + 20 + 25) / 5
Æ
E:
X = 75 / 5
→
X = 15
Ora, poderíamos simplesmente usando a propriedade do Produto e da Divisão, chegarmos ao mesmo resultado. Se a média do conjunto original é igual 3, e cada um desses elementos foi multiplicado pela constante 5, então a nova média (do novo conjunto) será a média anterior, também multiplicada pela constante. Ou seja: Média de B = (Média de A) x (constante) Média de B = 3 x 5 = 15 # Cálculo da Média pela Variável Transformada: Já dispomos do necessário para aprendermos o cálculo da Média pela utilização da Variável Transformada. Já conhecemos a forma convencional de se calcular a Média, pela mera aplicação da fórmula. Todavia, como já foi dito, as últimas provas, sobretudo da ESAF, têm trazido enunciados que tornariam a resolução da questão mais rápida e mais prática se utilizarmos uma outra saída, que é justamente o trabalho com a chamada Variável Transformada. E o que é a variável transformada? Ora, quando a questão apresenta o conjunto original, seja em forma de um rol, ou Dados Tabulados ou de uma Distribuição de Freqüências, estes dados correspondem, obviamente, à Variável Original. Agora, se com cada elemento deste conjunto original, fizermos uma ou mais de uma operação – seja de soma, subtração, produto ou divisão – deixaremos então de trabalhar com a variável original e passaremos a trabalhar com a variável transformada. Portanto, diremos que “a variável ESTATÍSTICA-Ponto dos Concursos
Ponto 11-MÉDIA ARITMÉTICA
Página 6 de 14
original foi transformada” por meio de operações a que foram submetidos todos os elementos do conjunto original. Entenderemos melhor esta explicação por meio de exemplos. Senão, vejamos o seguinte. Consideremos o conjunto abaixo:
0 10 20 30 40
Xi |--|--|--|--|---
fi 9 15 28 17 11 n=80
10 20 30 40 50
PM 5 15 25 35 45
Trata-se, obviamente, de uma Distribuição de Freqüências, em que foi fornecida a variável original Xi, cujos elementos estão dispostos nas classes. Se esta questão pedisse o cálculo da Média, poderíamos encontrá-la pela mera aplicação da fórmula abaixo:
⎛ ∑ PM . fi ⎞ ⎟ X =⎜ ⎜ ⎟ n ⎝ ⎠ Isso seria o que chamamos de cálculo convencional da Média. Para este cálculo, teríamos que construir a coluna do numerador, ou seja: (PM.fi). É o próximo passo: 0 10 20 30 40
Xi |--|--|--|--|---
fi 9 15 28 17 11 n=80
10 20 30 40 50
Daí, teríamos que:
PM 5 15 25 35 45
X = (2060 / 80)
Æ
PM.fi 45 225 700 595 495 Σ=2060 E: X = 25,75
Observemos que as contas que fomos obrigados a fazer na construção desta coluna (PM.fi) são trabalhosas e poderiam vir a ser bastante mais demoradas, sobretudo se as classes tivessem como Pontos Médios valores nãointeiros, ou seja, valores “quebrados”, o que ocorre com freqüência nas provas de concursos. Aí é que entra a Variável Transformada! Iremos, portanto, construir uma nova coluna, que será a coluna da transformação da variável original. Criaremos esta coluna logo após a coluna dos Pontos Médios. Para construir a coluna da transformação, poderemos usar sempre a seguinte sugestão: 90 No numerador, fazer PM subtraído do primeiro Ponto Médio (o PM da primeira classe); e 91 Dividir o resultado pela Amplitude da Classe, o h. Só isso! Vejamos na prática transformação deste nosso exemplo: ESTATÍSTICA-Ponto dos Concursos
Xi 0 10 20 30 40
|--|--|--|--|---
10 20 30 40 50
como
ficaria
a
Ponto 11-MÉDIA ARITMÉTICA
fi
PM
9 15 28 17 11 n=80
5 15 25 35 45
nossa
coluna
Página 7 de 14
(PM – 5) 10 0 1 2 3 4
da
Vejamos que a coluna (PM – 5)/10 é exatamente aquilo que sugerimos acima: no numerador,(PM – 5) é justamente a subtração dos Pontos Médios pelo primeiro PM (que é 5); e depois dividimos por 10, que é a amplitude da classe. Observe que, sempre que construirmos uma coluna de transformação da variável original por meio desta sugestão apresentada acima, teremos como resultado os mesmos valores: uma seqüência dos números inteiros, iniciando pelo zero! Feito isto, temos agora que “batizar” a coluna que acabamos de construir! Ora, neste momento já não mais estamos com a variável original Xi! Acabamos de transformá-la em uma outra variável! Desse modo, poderemos chamar a nova variável por uma outra letra, Yi por exemplo. Ou Wi, ou Zi... fica a gosto do freguês! Neste nosso exercício, chamaremos a nova variável de Yi. E o próximo passo será calcular a Média da Variável Transformada! Aqui, a nossa fórmula original (aquela do cálculo convencional!) sofrerá uma pequena variação. Vejamos: Quando trabalhávamos com a variável original, tínhamos a seguinte fórmula:
⎛ ∑ PM . fi ⎞ ⎟ X =⎜ ⎜ ⎟ n ⎝ ⎠ Agora, que estamos trabalhando com a nova variável Yi, nossa fórmula será dada por:
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠ Observemos que a alteração é mesmo intuitiva: em lugar do Ponto Médio (que representava a variável original Xi) usaremos o Yi, que representa a variável transformada! Perceberemos, agora, como é bem mais fácil construir a coluna (Yi.fi). Senão, vejamos: Xi 0 10 20 30 40
|--|--|--|--|---
10 20 30 40 50
fi
PM
9 15 28 17 11 n=80
5 15 25 35 45
ESTATÍSTICA-Ponto dos Concursos
(PM – 5) = Yi 10 0 1 2 3 4
Ponto 11-MÉDIA ARITMÉTICA
Yi.fi 0 15 56 51 44 166
Página 8 de 14
Calculada a coluna (Yi.fi), o próximo passo é encontrar o valor da Y . Teremos que:
Y
= (166 / 80)
Æ
E: Y = 2,075
Ora, a questão quer saber o valor da Média da variável original Xi, e não a Média desta variável transformada que acabamos de achar. Então, precisamos usar as propriedades da Média (de Soma e Subtração, e de Produto e Divisão), que acabamos de aprender, para chegarmos ao valor que procuramos.
Vamos reconstruir o caminho que usamos para sair da variável original Xi e chegar à variável transformada Yi: Caminho de Ida! Basta olhar para a coluna de transformação, e vermos o que foi feito com o PM (que representa a variável original)!
Variável Original Xi
Æ 1.º) (–5)
Æ 2.º) (÷10)
Æ Variável Transformada Yi
E agora, invertendo o caminho de ida – da variável original para a transformada –, construiremos o caminho de volta, ou seja, aquele que nos trará da variável transformada – Yi – para a variável original – Xi. Basta usar as operações inversas às do caminho de ida. Vejamos o Caminho de Volta:
Variável Transformada
Yi
Æ 1.º)(x10)
Æ 2.º)(+5)
Æ Variável Original Xi
Observemos que a primeira operação do Caminho de Volta é o inverso da última operação do Caminho de Ida, e vice-versa. Ou seja, onde termina um caminho, começa o outro. Bem, usaremos agora apenas o Caminho de Volta, para descobrirmos o valor da Média da variável original. Ora, sabemos que a média da variável transformada é di= = 2,075. Daí, percorremos o Caminho de Volta, aplicando as propriedades da Média. Vejamos: A primeira operação do Caminho de Volta é um Perguntamos: a Média é influenciada pela multiplicação? aprendemos na propriedade! Daí, nossa Média passa a ser:
produto:(x10). Sim, conforme
2,075 x 10 = 20,75 A segunda operação do caminho de volta é uma soma: (+5). Novamente a pergunta: a Média sofre influência de operações de soma? Sim, também de acordo com a propriedade da mèdia! Daí tomando nosso último resultado, faremos: 20,75 + 5 = 25,75 = X Chegamos, portanto, ao valor da nossa usando o método da Variável Transformada!
ESTATÍSTICA-Ponto dos Concursos
média
da
variável
Ponto 11-MÉDIA ARITMÉTICA
original,
Página 9 de 14
Em suma, os passos deste método, do Cálculo da Média pela Variável Transformada, são os seguintes: a)Construir a coluna da variável transformada (aqui chamada Yi), seguindo a sugestão que apresentamos; b)Construir a coluna (Yi.fi) e calcular o seu somatório; c) Encontrar o valor da Média da Variável Transformada, usando a fórmula
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
d)Descrever, a partir do Caminho de Ida, da variável original para a transformada, o caminho inverso, ou seja, o Caminho de Volta, que usaremos para achar a nossa resposta! e)Seguindo, então, esse Caminho de Volta, calcularemos a Média da Variável Original, seguindo as propriedades, e lembrando-nos que a Média é influenciada pelas quatro operações (soma, subtração, produto e divisão). Talvez, a primeira impressão deste método da Variável Transformada seja a de um procedimento trabalhoso, ou complexo. Mas, ao contrário do que possa parecer, trabalhar com a Variável Transformada é, na maioria das vezes, a maneira mais prática de se chegar ao valor da Média. Isso se torna mais verdade ainda se o próprio enunciado já trouxer construída a coluna de transformação da variável original. Foi o que ocorreu, por exemplo, na prova de 1996 do AFRF, transcrita a seguir: (AFTN-96) Para efeito das cinco próximas questões, considere os seguintes dados: DISTRIBUIÇÃO DE FREQÜÊNCIAS DAS IDADES DOS FUNCIONÁRIOS DA EMPRESA ALFA, EM 1º/1/90 Freqüências Classes de di.fi di2.fi di3.fi di4.fi Pontos PM − 37 (fi) Idades = di Médios 5 (anos) (PM) 19,5 24,5 29,5 34,5 39,5 44,5 49,5
!--!--!--!--!--!--!--Total
24,5 29,5 34,5 39,5 44,5 49,5 54,5
2 9 23 29 18 12 7 n=100
22 27 32 37 42 47 52
-3 -2 -1 --1 2 3
-6 -18 -23 --18 24 21 16
18 36 23 --18 48 63 206
-54 -72 -23 --18 96 189 154
162 144 23 --18 192 567 1106
Observemos que a quarta coluna, fornecida pelo enunciado na Distribuição de Freqüências, foi justamente aquela que fez a transformação da variável original. Desta forma, esta transformação ocorreu por meio de duas operações: a primeira, a subtração dos Pontos Médios por 37; a segunda, a divisão por 5. Logo, este foi o caminho que o enunciado escolheu para ESTATÍSTICA-Ponto dos Concursos
Ponto 11-MÉDIA ARITMÉTICA
Página 10 de 14
transformar a variável original na variável transformada, que foi aqui chamada de “di”. Logo, o nosso Caminho de Ida será: Variável Original Xi
Æ 1.º)(– 37)
Æ 2.º)(÷5)
Æ Variável Transformada di
Faremos agora o Caminho de Volta: Variável Transformada
di
Æ 1.º)(x5)
Æ 2.º)(+37)
Æ Variável Original Xi
Calcularemos aqui a Média da variável transformada – di – usando a fórmula alterada, que neste caso será:
⎛ ∑ di ⋅ fi ⎞ ⎟ di = ⎜ ⎜ ⎟ n ⎝ ⎠
Observemos que a distribuição de freqüências fornecida pela prova já trazia, na coluna seguinte, os valores de (di.fi) e o somatório desta coluna, que será utilizado no numerador, como se segue:
di = 16 / 100
Æ
E:
di = 0,16
Finalmente, percorrendo o Caminho de Volta com o valor da Média da Variável Transformada, lembrando-nos de que a Média é influenciada pelas quatro operações, chegaremos ao seguinte: 0,16 x 5 = 0,8
Æ
E: 0,8 + 37 = 37,8 = X
Æ Resposta da Questão!
Para fazer o serviço completo, essa questão acima é exatamente aquela a qual eu me referi quando explicava a Propriedade da Soma e da Subtração, para a Média! Estão lembrados? A Média que acabamos de calcular dizia respeito à idade dos funcionários da empresa em 01/01/1990. Na seqüência, em uma questão posterior, o enunciado falava que estávamos agora em 01/01/1996, ou seja, seis anos após! E pedia a nova média das idades daquele mesmo grupo de pessoas! Moleza pura! Só tínhamos que aplicar a Propriedade da Soma e Subtração e pensar: se se passaram 6 anos, isso quer dizer que cada elemento do conjunto original foi somado à constante 6. Daí, a nova média será a média anterior, somada também a 6. Logo:
X (em 01/01/1996) = X (em 01/01/1990) + 6 Daí: X (em 01/01/1996) = 37,8 + 6 Æ E: X (em 01/01/1996)= 43,8 Æ Resposta! ATENÇÃO: Talvez esteja surgindo a seguinte dúvida: dissemos acima que na hora de construirmos a coluna de transformação, o procedimento sugerido seria dividir PM pelo valor do primeiro Ponto Médio, para, em seguida, dividir este resultado pela amplitude da classe, h. Certo? Porém, na questão acima, o ESTATÍSTICA-Ponto dos Concursos
Ponto 11-MÉDIA ARITMÉTICA
Página 11 de 14
próprio enunciado já trouxe uma coluna de transformação construída, só que de uma outra forma, diferente do que sugerimos! E aí? Ora, os passos que indicamos para chegarmos à coluna de transformação é uma sugestão, que eu recomendo que seja aceita, quando nós tivermos que construir essa coluna! Todavia, se o próprio enunciado já trouxer uma coluna de transformação toda pronta, seja ela como for, então não teremos mais de nos preocupar em construir uma outra coluna! Resumindo: aceitaremos sempre a coluna de transformação fornecida pelo enunciado; quando isso não acontecer, a construiremos adotando a sugestão por nós ensinada! Só isso! -x-x-x-x-x-x-x-x-x-x-xEu sou até capaz de apostar que tem muita gente aí pensando o seguinte: “...esse cara tá é doido se acha que eu vou perder tempo aprendendo essa tal de variável transformada!... vou é usar a minha formulazinha do cálculo convencional, e pronto... o resultado é o mesmo!” Aí eu respondo dizendo que: “Tudo bem! A resposta, de fato, será a mesma! Então, façamos o seguinte: só precisa aprender a Variável Transformada quem quiser passar no concurso, ok?” Na verdade, o que eu quero dizer é que as provas da ESAF não nos têm deixado muita escolha! Inúmeros alunos saem da prova dizendo que não houve tempo suficiente para as questões de Estatística, o que (me perdoem falar) não é verdade! A prova é feita para quem usar todos os artifícios necessários
para economizar o tempo! A Variável Transformada é, talvez, o mais importante desses artifícios! Então, coloquemos uma coisa na cabeça: é muito fácil trabalhar com a Variável Transformada, e ganhar velocidade com essa técnica é apenas uma questão de tempo e de TREINO!! Portanto, na seqüência, colocarei umas questões de concurso (já bem conhecidas nossas!), além de outras que inventarei, apenas para nos dar velocidade e prática com a variável transformada, ok?
EXERCÍCIOS DE HOJE Enunciado Único: Para cada um dos conjuntos abaixo, determine o valor da Média Aritmética, utilizando o método da Variável Transformada. Observação: aproveite o ensejo e refaça, quando necessário, todo aquele trabalho com as colunas de freqüência, para chegar à freqüência absoluta simples!!
01. Trabalhe a Distribuição abaixo:
0 10 20 30 40
Xi !--!--!--!--!---
ESTATÍSTICA-Ponto dos Concursos
10 20 30 40 50
fi 3 5 8 4 2
Ponto 11-MÉDIA ARITMÉTICA
02. Trabalhe a Distribuição abaixo: Xi 0 !--- 15 15 !--- 30 30 !--- 45 45 !--- 60 60 !--- 75 75 !--- 90
Fi 4 7 11 9 5 2
03. Trabalhe a Distribuição abaixo: Xi 0 !--- 7 7 !--- 14 14 !--- 21 21 !--- 28 28 !--- 35
Fi 7 11 15 9 3
04. Trabalhe a Distribuição abaixo: Xi 9,5 !--- 19,5 19,5 !--- 29,5 29,5 !--- 39,5 39,5 !--- 49,5 49,5 !--- 59,5
Fi 4 6 7 5 3
Página 12 de 14
05. Trabalhe a Distribuição abaixo: Xi 90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140 06. Trabalhe a Distribuição abaixo: Xi 30 !--- 40 40 !--- 50 50 !--- 60 60 !--- 70 90 !--- 80 90 !--- 90 90 !--- 100 100 !--- 110 110 !--- 120
ESTATÍSTICA-Ponto dos Concursos
Fi 40 60 140 160 180 120 40 30 20 10
fi 1 3 7 11 14 11 7 3 1
Ponto 11-MÉDIA ARITMÉTICA
Página 13 de 14
07. Extraído do AFRF-2002.1: Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes P (%) 70 – 90 5 90 – 110 15 110 – 130 40 130 – 150 70 150 – 170 85 170 – 190 95 190 – 210 100 08. Extraído do AFRF-2001: Freqüências acumuladas de salários anuais, em milhares de reais, da Cia. Alfa. Classes de salários Freqüências acumuladas 3 ; 6 12 6 ; 9 30 9 ; 12 50 12 ; 15 60 15 ; 18 65 18 ; 21 68
09. Extraído do AFRF-2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência (f) 29,4 --- 39,5 4 39,5 --- 49,5 8 49,5 --- 59,5 14 59,5 --- 69,5 20 69,5 --- 79,5 26 79,5 --- 89,5 18 89,5 --- 99,5 10 10. Extraído do Fiscal de Tributos Estaduais do PI – 2001: A tabela abaixo mostra a distribuição de freqüências obtida de uma amostra aleatória dos salários anuais em reais de uma firma. As freqüências são acumuladas. Classes de Salários Freqüências (5.000 – 6.500) 12 (6.500 – 8.000) 28 (8.000 – 9.500) 52 (9.500 – 11.000) 74 (11.000 – 12.500) 89 (12.500 – 14.000) 97 (14.000 – 15.500) 100
ESTATÍSTICA-Ponto dos Concursos
Ponto 11-MÉDIA ARITMÉTICA
Página 14 de 14
11. Extraído do Fiscal de Tributos Estaduais do PA – 2002: A tabela de freqüências abaixo apresenta as freqüências acumuladas (F) correspondentes a uma amostra da distribuição dos salários anuais de economistas (Y)- em R$1.000,00, do departamento de fiscalização da Cia. X. Não existem realizações de Y coincidentes com as extremidades das classes salariais. Classes F 29,4 --- 39,5 2 39,5 --- 49,5 6 49,5 --- 59,5 13 59,5 --- 69,5 23 69,5 --- 79,5 36 79,5 --- 89,5 45 89,5 --- 99,5 50 -x-x-x-x-x-x-x-x-x-x-xE então, meus amigos? Uma aula de 13 páginas para acertarmos uma questão na prova...! Ainda chamam o funcionário público de “vida boa”... Mas, como diz o ditado, muito pertinentemente: “vida boa é a dos outros!” Deixemos de lado a vida alheia e cuidemos da nossa, mesmo porque uma questão pode nos deixar de fora das vagas do próximo concurso! Acreditem, isso já aconteceu comigo! Foi no AFRF de 2001..., águas passadas. O gabarito comentado iniciará nossa próxima aula! Não perca tempo nem a chance de tentar resolver esses exercícios! O mais importante é tentar! Mãos à obra, portanto! Peço licença para mandar um grande abraço a todos que me têm escrito, com palavras de incentivo e de amizade! Serei injusto por não relacionar a todos, mas dedico esta aula e envio um abraço forte aos seguintes novos amigos que ganhei nestas últimas semanas: o Gean Barreto, de Manaus (e batalhando no Acre!); a turma de Macapá: Stélio, Rubenita e cia. ltda.; a Ana Beatriz, do Recife; a Elba, de Belém; a Cristiane, do Chuí; o Danilo Martins, de São Paulo; a Juliana Maciel, de
Fortaleza; o Ricardo Lopes, de Niterói; e o Diogo Cabeda, de Porto Alegre. Todos futuros AFRF! O abraço agora é para os meus “velhos” amigos do Recife, aqueles responsáveis por eu viver com saudades: Cristiane Abreu (minha grande amiga “Vida Boa”!); Flávia Siqueira (minha irmã, Flavinha!); Fábio Araújo (meu irmão, Fabão!); minha caríssima Vanessa Falcão; os amigos do peito Aquiles Albino e Manuela, do Curso Especial; meu querido professor Pompeu, do Pró-Concurso de Pernambuco e o meu grande amigo professor João Antônio Carvalho (o pai do Pedro Aurélio!). Não poderia esquecer de mencionar meus bons amigos de Suape: Eleonora Carvalho, Luís Antônio Barros, Ângelo Carvalho (e a Maria Júlia!), Scheila Neher (e o Paulão e a Julinha), Luís Augusto, Lomanto, Juarez Miranda, Ginaldo Freire, Vilmarcos Barbosa (e a pequena Eduarda!), Rafael Cavalcanti, Ricardo Kuklinsky, Fernando Dias, Vanisse, Eduardo Martins, Esiel Fernandes, Renato, Ana Helena, Eni Sávio, Alcélio Silva, Telma Timóteo, e aqueles que já saíram de lá: Celene Nogueira (minha eterna “chefinha”), Moisés de Freitas Cabral, Carlos Fernando, Paulo Sérgio Santos, Massachi Kochimizu, Maria das Graças Kochimizu, e José Erison. Posso ter esquecido alguns na lista, mas não aqui no peito! Que Deus abençoe a Regina Célia, Weber Campos e Beatriz! Até a próxima!
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 1 de 20
EXERCÍCIOS DE MÉDIA ARITMÉTICA Olá, amigos! Hoje nossa missão será apenas resolver os exercícios deixados para vocês na última aula! E já! Enunciado Único: Para cada um dos conjuntos abaixo, determine o valor da Média Aritmética, utilizando o método da Variável Transformada. Observação: aproveite o ensejo e refaça, quando necessário, todo aquele trabalho com as colunas de freqüência, para chegar à freqüência absoluta simples!! 01. Trabalhe a Distribuição abaixo:
0 10 20 30 40
Xi !--!--!--!--!---
fi 3 5 8 4 2
10 20 30 40 50
Sol.: Para acharmos a Média pela Variável Transformada, nossos primeiros passos serão construir a coluna dos Pontos Médios, e a coluna de transformação da nossa variável original. A coluna dos PM já é nossa velha conhecida: encontraremos o PM da primeira classe [(linf+lsup)/2], e depois saímos somando com o valor da amplitude da classe (h). Já quanto à coluna de transformação, seguiremos a sugestão apresentada na aula passada: Variável transformada = (PM – primeiro PM) (amplitude da classe) Chamaremos aqui nossa variável transformada de Yi. Xi 0 10 20 30 40
!--!--!--!--!---
10 20 30 40 50
fi
PM
3 5 8 4 2
5 15 25 35 45
(PM-5)= Yi 10 0 1 2 3 4
Agora, recordando o que aprendemos na aula passada, nossa fórmula da Média para a Variável Transformada será a seguinte:
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Página 1 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 2 de 20
Logo, para encontrarmos o numerador, construiremos a coluna (Yi.fi). Ficaremos assim: Xi fi PM (PM-5)= Yi Yi.fi 10 0 !--- 10 3 5 0 0 10 !--- 20 5 15 1 5 20 !--- 30 8 25 2 16 30 !--- 40 4 35 3 12 40 !--- 50 2 45 4 8 n=22 41 Percebam que coloquei o n=22 em destaque, justamente para lembrar que, na Distribuição de Freqüências, encontraremos sempre o número de elementos do conjunto (n) pelo somatório da coluna do fi! Agora, determinaremos o valor da Média da Variável Transformada, que será:
Y = (41/22)
Æ
E: Y = 1,86
Ora, como sabemos, interessa-nos na resposta determinar não o valor da média da variável transformada, mas o da variável original Xi! Para isso, vamos transcrever o caminho utilizado para chegarmos do Xi à variável transformada Yi: Æ Caminho de Ida: (Xi para Yi): 1º)(–5) e 2º)(÷10) Logo, o Caminho de Volta (Yi para Xi), que é o que nos interessa agora, será encontrado simplesmente invertendo as operações do Caminho de Ida, de trás para frente! Teremos: Æ Caminho de Volta: (Yi para Xi): 1º)(x10) e 2º)(+5) Para podermos enxergar melhor essas idas e vindas, podemos até fazer um rápido desenho: Caminho de Ida 1º)(-5)
X =?
e
2º)(÷10)
Xi
Yi 2º)(+5)
e
Y = 1,86
1º)(x10)
Caminho de Volta Percebamos que, onde termina o caminho de ida começa o caminho de volta! Finalmente, o que temos que fazer para chegarmos ao nosso
X
é seguirmos o
caminho de volta, partindo do valor do Y = 1,86. Teremos, que: 1º)(x10)Æ 1,86x10=18,6
e 2º)(+5)Æ 18,6+5=23,6 que é nosso X !
Daí: X = 23,6 Æ Resposta da Questão!
Página 2 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 3 de 20
Antes de prosseguirmos, uma pergunta: todos estão lembrados do motivo de termos feito ambas as operações do caminho de volta (um produto e uma soma)? Ora, foi devido às Propriedades da Média (vimos na aula passada!), que nos dizem que a Média será influenciada pelas quatro operações – soma, subtração, produto e divisão! Em frente...
02. Trabalhe a Distribuição abaixo: Xi fi 0 !--- 15 4 15 !--- 30 7 30 !--- 45 11 45 !--- 60 9 60 !--- 75 5 75 !--- 90 2 Sol.: Novamente, iniciaremos com os passos preliminares, de construir a coluna do Ponto Médio e a coluna de transformação da variável original! Ficaremos assim: Xi 0 15 30 45 60 75
!--!--!--!--!--!---
15 30 45 60 75 90
fi
PM
4 7 11 9 5 2
7,5 22,5 37,5 52,5 67,5 82,5
(PM-7,5)= Yi 15 0 1 2 3 4 5
Agora, construiremos a coluna (Yi.fi). Teremos que: Xi 0 15 30 45 60 75
!--!--!--!--!--!---
15 30 45 60 75 90
Fi
PM
4 7 11 9 5 2 n=38
7,5 22,5 37,5 52,5 67,5 82,5
(PM-7,5)= Yi 15 0 1 2 3 4 5
Yi.fi 0 7 22 27 20 10 86
Daí, calcularemos o valor da Média da nossa variável transformada, Y , usando a nossa fórmula já conhecida:
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Æ Ficaremos com: Y = (86/38) Æ Y =⎜ ⎜ ⎟ n ⎝ ⎠
E: Y =2,26
Agora, é só fazer o “desenho” dos caminhos de ida e volta, que usamos para ir da variável original Xi, para a transformada Yi, e o retorno! Teremos que:
Página 3 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 4 de 20
Caminho de Ida 1º)(-7,5)
X =?
e
2º)(÷15)
Xi
Yi 2º)(+7,5)
e
Y = 2,26
1º)(x15)
Caminho de Volta Ficou fácil, não? Só teremos que percorrer o caminho de volta, partindo de
Y = 2,26, e lembrando-nos que a Média é influenciada pelas quatro operações. Daí, teremos: 1º)(x15)Æ 2,26x15=33,9
e 2º)(+7,5)Æ 33,9+7,5=41,4 que é nosso X !
Daí: X = 41,4 Æ Resposta da Questão! Percebem que está ficando cada vez mais fácil! Em frente... 03. Trabalhe a Distribuição abaixo:
0 7 14 21 28
Xi !--!--!--!--!---
fi 7 11 15 9 3
7 14 21 28 35
Sol.: Primeiros passos: coluna do PM e coluna de transformação! Teremos: Xi 0 7 14 21 28
!--!--!--!--!---
7 14 21 28 35
fi
PM
7 11 15 9 3
3,5 10,5 17,5 24,5 31,5
(PM-3,5)= Yi 7 0 1 2 3 4
Na seqüência, coluna do (Yi.fi). Teremos: Xi 0 7 14 21 28
!--!--!--!--!---
7 14 21 28 35
fi
PM
7 11 15 9 3 n=45
3,5 10,5 17,5 24,5 31,5
(PM-3,5)= Yi 7 0 1 2 3 4
Yi.fi 0 11 30 27 12 80
Página 4 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 5 de 20
Agora, cálculo do Y : ⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(80/45)
Æ
Y =1,77
Agora, o desenho dos caminhos de ida e volta: Caminho de Ida 1º)(-3,5)
X =?
e
2º)(÷7)
Xi
Yi 2º)(+3,5)
e
Y = 1,77
1º)(x7)
Caminho de Volta Finalmente, correremos o caminho de volta, partindo do Y = 1,77: 1º)(x7)Æ 1,77x7=12,4
e 2º)(+3,5)Æ 12,4+3,5=15,9 que é nosso X ! Daí: X = 15,9 Æ Resposta da Questão!
Nas próximas questões, padronizaremos nossos passos, colocando-os em destaque, para facilitar nossa memorização! 04. Trabalhe a Distribuição abaixo:
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
fi 4 6 7 5 3
19,5 29,5 39,5 49,5 59,5
Sol.: i) Coluna do PM e coluna de transformação: Xi 9,5 19,5 29,5 39,5 49,5
!--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
ESTATÍSTICA – Ponto dos Concursos
fi
PM
4 6 7 5 3
14,5 24,5 34,5 44,5 54,5
(PM-14,5)= Yi 10 0 1 2 3 4
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 6 de 20 Página 5 de 20
ii) Coluna do (Yi.fi): Xi 9,5 19,5 29,5 39,5 49,5
!--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi
PM
4 6 7 5 3 n=25
14,5 24,5 34,5 44,5 54,5
Yi.fi
(PM-14,5)= Yi 10 0 1 2 3 4
0 6 14 15 12 47
iii) Cálculo do Y :
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(47/25)
Æ
Y =1,88
iv) Desenho dos caminhos de ida e volta: Caminho de Ida 1º)(-14,5)
X =?
e
2º)(÷10)
Xi
Yi 2º)(+14,5)
e
Y = 1,88
1º)(x10)
Caminho de Volta v) Cálculos do Caminho de Volta, partindo do Y : 1º)(x10)Æ 1,88x10=18,8
e 2º)(+14,5)Æ 18,8+14,5=33,3 que é nosso X !
Daí: X = 33,3 Æ Resposta da Questão! Pronto! Estão traçados os nossos passos nesta assunto! Em frente... 05. Trabalhe a Distribuição abaixo: Xi 90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
fi 40 60 140 160 180 120 40 30 20 10
Página 6 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 7 de 20
Sol.: i) coluna do PM e coluna de transformação: Xi
fi
PM
90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
40 60 140 160 180 120 40 30 20 10
92,5 97,5 102,5 107,5 112,5 117,5 122,5 127,5 132,5 137,5
(PM-92,5)= Yi 5 0 1 2 3 4 5 6 7 8 9
ii) Coluna do (Yi.fi): Xi 90 95 100 105 110 115 120 125 130 135
!--!--!--!--!--!--!--!--!--!---
95 100 105 110 115 120 125 130 135 140
fi
PM
40 60 140 160 180 120 40 30 20 10 n=800
92,5 97,5 102,5 107,5 112,5 117,5 122,5 127,5 132,5 137,5
Yi.fi
(PM-92,5)= Yi 5 0 1 2 3 4 5 6 7 8 9
0 60 280 480 720 600 240 210 160 90 2.840
iii) Cálculo do Y :
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(2840/800)
Æ
Y =3,55
iv) Desenho dos caminhos de ida e volta: Caminho de Ida 1º)(-92,5)
X =?
e
2º)(÷5)
Xi
Yi 2º)(+92,5)
e
Y = 3,55
1º)(x5)
Caminho de Volta
Página 7 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 8 de 20
v) Cálculos do Caminho de Volta, partindo do Y : 1º)(x5)Æ 3,55x5=17,75
e 2º)(+92,5)Æ 17,75+92,5=110,25
Daí: X = 110,25 Æ Resposta da Questão! 06. Trabalhe a Distribuição abaixo:
30 40 50 60 90 90 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
i) coluna do PM e coluna de transformação: Xi 30 40 50 60 70 80 90 100 110
!--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi
PM
1 3 7 11 14 11 7 3 1
35 45 55 65 75 85 95 105 115
(PM-35)= Yi 10 0 1 2 3 4 5 6 7 8
ii) Coluna do (Yi.fi): Xi 30 40 50 60 70 80 90 100 110
!--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi
PM
1 3 7 11 14 11 7 3 1 n=58
35 45 55 65 75 85 95 105 115
(PM-35)= Yi 10 0 1 2 3 4 5 6 7 8
Yi.fi 0 3 14 33 56 55 42 21 8 232
iii) Cálculo do Y :
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(232/58)
Æ
Y =4,0
Página 8 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 9 de 20
iv) Desenho dos caminhos de ida e volta: Caminho de Ida 1º)(-35)
X =?
e
2º)(÷10)
Xi
Yi 2º)(+35)
e
Y = 4,0
1º)(x10)
Caminho de Volta v) Cálculos do Caminho de Volta, partindo do Y : 1º)(x10)Æ 4,0x10=40,0
e 2º)(+35)Æ 40+35=75 Daí: X = 75 Æ Resposta da Questão!
Observação: Daqui a pouco, no finalzinho desta aula, darei uma dica preciosa sobre a média – a primeira Dica de Ouro deste nosso curso! E aí, veremos que dava para dizer a resposta desta questão 06 que acabamos de resolver, sem precisar fazer uma conta sequer!!
07. Extraído do AFRF-2002.1: Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes P (%) 70 – 90 5 90 – 110 15 110 – 130 40 130 – 150 70 150 – 170 85 170 – 190 95 190 – 210 100 Sol.: Estas próximas questões já são nossas conhecidas; apareceram em aulas passadas, no nosso estudo das colunas de freqüências, e no estudo da interpolação da ogiva. Mesmo assim, para não perder a oportunidade, faremos o serviço completo, ou seja, trabalharemos passo a passo o enunciado, até chegarmos à Média pela variável transformada! Iniciaremos com os passos preliminares, para chegarmos à freqüência absoluta simples, fi! A primeira coisa a fazer é descobrir quem é esta coluna P(%). Ora, o enunciado foi claro: “P representa a freqüência relativa acumulada”. Como os valores desta coluna estão dispostos de forma crescente (5, 15, 40...), então concluímos: P(%) é a nossa Fac. Teremos que usar dois passos, para chegarmos à fi. Seguindo o caminho das pedras faremos o seguinte: Fac Æ Fi Æ fi
Página 9 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 10 de 20
Na primeira conversão, faremos “próxima Fac menos Fac anterior” e ficaremos assim: Fac ↓ 5% 15% 40% 70% 85% 95% 100%
Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
Fi 5% 10% 25% 30% 15% 10% 5%
Na segunda conversão, observaremos que o enunciado nos disse que n=200. Daí,usaremos a relação entre Fi e fi, qual seja: fi=Fi.n e ficaremos assim: Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
Fac ↓ 5% 15% 40% 70% 85% 95% 100%
Fi 5% 10% 25% 30% 15% 10% 5%
fi 10 20 50 60 30 20 10
Pronto! Todo esse trabalho preliminar nos serviu apenas para chegarmos à nossa coluna da freqüência absoluta simples. A partir deste ponto é que começaremos os passos necessários para chegarmos à Média! Para enxergarmos mais facilmente, vamos reduzir nossa tabela apenas às duas colunas que nos interessarão agora: a das classes e a fi. Em frente! Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
fi 10 20 50 60 30 20 10
i) coluna do PM e coluna de transformação: Classes 70 90 110 130 150 170 190
– – – – – – –
90 110 130 150 170 190 210
fi
PM
10 20 50 60 30 20 10
80 100 120 140 160 180 200
(PM-80)= Yi 20 0 1 2 3 4 5 6
Página 10 de 20
ESTATÍSTICA – Ponto dos Concursos
ii) Coluna do (Yi.fi): Classes 70 90 110 130 150 170 190
– – – – – – –
iii) Cálculo do Y :
90 110 130 150 170 190 210
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Fi
PM
10 20 50 60 30 20 10 n=200
80 100 120 140 160 180 200
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Yi.fi
(PM-80)= Yi 20 0 1 2 3 4 5 6
Y =(580/200)
Æ
Página 11 de 20
0 20 100 180 120 100 60 580
Y =2,9
iv) Desenho dos caminhos de ida e volta: Caminho de Ida 1º)(-80)
X =?
e
2º)(÷20)
Xi
Yi 2º)(+80)
e
Y = 2,9
1º)(x20)
Caminho de Volta v) Cálculos do Caminho de Volta, partindo do Y : 1º)(x20)Æ 2,9x20=58,0
e 2º)(+80)Æ 58+80=138 Daí: X = 138 Æ Resposta da Questão!
Talvez agora vocês estejam sentindo realmente a importância daquelas nossas aulas iniciais sobre como trabalharmos as colunas de freqüências! Percebam que não adianta de nada conhecer a fórmula da Média, nem todo o procedimento para encontrá-la, caso não soubéssemos como chegar à freqüência absoluta simples! 08. Extraído do AFRF-2001: Freqüências acumuladas de salários anuais, em milhares de reais, da Cia. Alfa. Classes de salários Freqüências acumuladas 3 ; 6 12 6 ; 9 30 9 ; 12 50 12 ; 15 60 15 ; 18 65 18 ; 21 68
Página 11 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 12 de 20
Sol.: Aqui novamente vamos trabalhar os passos preliminares para chegarmos à fi! Quem é esta “freqüências acumuladas” que o enunciado forneceu? Serão freqüências absolutas ou relativas? Como não apresentam nenhum “sinal” de que sejam relativas (nem um símbolo de %, no cabeçalho ou nos próprios valores da coluna), concluímos que se trata de freqüência absoluta. Ora, como esta coluna apresenta os valores dispostos de forma crescente, não resta dúvida que estamos diante de uma freqüência absoluta acumulada crescente – fac! Precisaremos de um único passo (vide caminho das pedras, Ponto 04) construirmos nossa fi! Faremos “próxima fac menos fac anterior”! Teremos: Classes de fi fac ↓ salários 3 ; 6 12 12 6 ; 9 30 18 9 ; 12 50 20 12 ; 15 60 10 15 ; 18 65 5 18 ; 21 68 3
para
Agora, sim: estamos prontos para encontrar a Média! Para simplificar, novamente reduziremos nossa tabela às classes que nos interessarão. Teremos: Classes de fi salários 3 ; 6 12 6 ; 9 18 9 ; 12 20 12 ; 15 10 15 ; 18 5 18 ; 21 3 i) coluna do PM e coluna de transformação: Classes de salários 3 ; 6 6 ; 9 9 ; 12 12 ; 15 15 ; 18 18 ; 21
fi
PM
12 18 20 10 5 3
4,5 7,5 10,5 13,5 16,5 19,5
(PM-4,5)= Yi 3 0 1 2 3 4 5
ii) Coluna do (Yi.fi): Classes de salários 3 ; 6 6 ; 9 9 ; 12 12 ; 15 15 ; 18 18 ; 21 ESTATÍSTICA – Ponto dos Concursos
fi
PM
12 18 20 10 5 3 n=68
4,5 7,5 10,5 13,5 16,5 19,5
(PM-4,5)= Yi 3 0 1 2 3 4 5
Yi.fi 0 18 40 30 20 15 123
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 13 de 20 Página 12 de 20
iii) Cálculo do Y :
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(123/68)
Æ
Y =1,81
iv) Desenho dos caminhos de ida e volta: Caminho de Ida 1º)(-4,5)
X =?
e
2º)(÷3)
Xi
Yi 2º)(+4,5)
e
Y = 1,81
1º)(x3)
Caminho de Volta v) Cálculos do Caminho de Volta, partindo do Y : 1º)(x3)Æ 1,81x3=5,43
e 2º)(+4,5)Æ 5,43+4,5=9,93 Daí: X = 9,93 Æ Resposta da Questão!
09. Extraído do AFRF-2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência (f) 29,4 --- 39,5 4 39,5 --- 49,5 8 49,5 --- 59,5 14 59,5 --- 69,5 20 69,5 --- 79,5 26 79,5 --- 89,5 18 89,5 --- 99,5 10 Sol.: Nesta questão, a coluna de freqüências fornecida já foi a própria fi, de forma que podemos imediatamente passar aos passos do cálculo da média! i) coluna do PM e coluna de transformação: Classes 29,4 39,5 49,5 59,5 69,5 79,5 89,5
---------------
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi
PM
4 8 14 20 26 18 10
34,5 44,5 54,5 64,5 74,5 84,5 94,5
(PM-34,5)= Yi 10 0 1 2 3 4 5 6
Página 13 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 14 de 20
i) Coluna do (Yi.fi): Classes 29,4 39,5 49,5 59,5 69,5 79,5 89,5
---------------
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi
PM
4 8 14 20 26 18 10 n=100
34,5 44,5 54,5 64,5 74,5 84,5 94,5
Yi.fi
(PM-34,5)= Yi 10 0 1 2 3 4 5 6
0 8 28 60 104 90 60 350
iii) Cálculo do Y :
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(350/100)
Æ
Y =3,5
iv) Desenho dos caminhos de ida e volta: Caminho de Ida 1º)(-34,5)
X =?
e
2º)(÷10)
Xi
Yi 2º)(+34,5)
e
Y = 3,5
1º)(x10)
Caminho de Volta v) Cálculos do Caminho de Volta, partindo do Y : 1º)(x10)Æ 3,5x10=35
e 2º)(+34,5)Æ 35+34,5=69,5 Daí: X = 69,5 Æ Resposta da Questão!
10. Extraído do Fiscal de Tributos Estaduais do PI – 2001: A tabela abaixo mostra a distribuição de freqüências obtida de uma amostra aleatória dos salários anuais em reais de uma firma. As freqüências são acumuladas. Classes de Salários Freqüências (5.000 – 6.500) 12 (6.500 – 8.000) 28 (8.000 – 9.500) 52 (9.500 – 11.000) 74 (11.000 – 12.500) 89 (12.500 – 14.000) 97 (14.000 – 15.500) 100
Página 14 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 15 de 20
Sol.: Este enunciado nos forneceu uma coluna com o nome de “freqüências”, e disse expressamente tratar-se de “freqüências acumuladas”. Como não se verificam os “sinais” de que seja uma freqüência relativa, constatamos estar diante de uma coluna de freqüências absolutas. Uma vez que os valores desta coluna aumentam sucessivamente, concluímos: trata-se da fac! Feita esta primeira descoberta, teremos que seguir os passos necessários para chegarmos à freqüência absoluta simples – fi. Para tanto (conforme o retorno do caminho das pedras), faremos “próxima fac menos fac anterior”, e teremos: Classes de Salários fi fac ↓ (5.000 – 6.500) 12 12 (6.500 – 8.000) 28 16 (8.000 – 9.500) 52 24 (9.500 – 11.000) 74 22 (11.000 – 12.500) 89 15 (12.500 – 14.000) 97 8 (14.000 – 15.500) 100 3 Agora, sim: passaremos aos passos para encontrar a Média! Vamos usar a tabela reduzida ao que nos interessa: Classes de Salários fi (5.000 – 6.500) 12 (6.500 – 8.000) 16 (8.000 – 9.500) 24 (9.500 – 11.000) 22 (11.000 – 12.500) 15 (12.500 – 14.000) 8 (14.000 – 15.500) 3 i) coluna do PM e coluna de transformação: Classes de Salários fi (5.000 (6.500 (8.000 (9.500 (11.000 (12.500 (14.000
– – – – – – –
6.500) 8.000) 9.500) 11.000) 12.500) 14.000) 15.500)
12 16 24 22 15 8 3
PM 5.750 7.250 8.750 10.250 11.750 13.250 14.750
(PM-5750)= Yi 1500 0 1 2 3 4 5 6
ii) Coluna do (Yi.fi): Classes de Salários (5.000 (6.500 (8.000 (9.500 (11.000 (12.500 (14.000
– – – – – – –
6.500) 8.000) 9.500) 11.000) 12.500) 14.000) 15.500)
ESTATÍSTICA – Ponto dos Concursos
fi
PM
12 16 24 22 15 8 3 n=100
5.750 7.250 8.750 10.250 11.750 13.250 14.750
(PM-5750)= Yi 1500 0 1 2 3 4 5 6
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Yi.fi 0 16 48 66 60 40 18 248
Página 16 de 20 Página 15 de 20
iii) Cálculo do Y :
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(248/100)
Æ
Y =2,48
iv) Desenho dos caminhos de ida e volta: Caminho de Ida 1º)(-5750)
X =?
e
2º)(÷1500)
Xi
Yi 2º)(+5750)
e
Y = 2,48
1º)(x1500)
Caminho de Volta v) Cálculos do Caminho de Volta, partindo do Y : 1º)(x1500)Æ 2,48x1500=3720
e 2º)(+5750)Æ 3720+5750=9470,
Daí: X = 9.470, Æ Resposta da Questão!
11. Extraído do Fiscal de Tributos Estaduais do PA – 2002: A tabela de freqüências abaixo apresenta as freqüências acumuladas (F) correspondentes a uma amostra da distribuição dos salários anuais de economistas (Y)- em R$1.000,00, do departamento de fiscalização da Cia. X. Não existem realizações de Y coincidentes com as extremidades das classes salariais. Classes F 29,4 --- 39,5 2 39,5 --- 49,5 6 49,5 --- 59,5 13 59,5 --- 69,5 23 69,5 --- 79,5 36 79,5 --- 89,5 45 89,5 --- 99,5 50 Sol.: O enunciado fala em “freqüências acumuladas” e só! Vamos concluir que não são relativas, pela ausência dos “sinais”. E, como estão dispostas crescentemente, constatamos que se trata de uma coluna de freqüências absolutas acumuladas crescentes, a nossa fac.
Página 16 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 17 de 20
Daí, como passo preliminar, encontraremos a coluna da fi, pelo caminho de volta do caminho das pedras, fazendo “próxima fac menos fac anterior”. Teremos o seguinte: fac ↓ 2 6 13 23 36 45 50
Classes 29,4 --- 39,5 39,5 --- 49,5 49,5 --- 59,5 59,5 --- 69,5 69,5 --- 79,5 79,5 --- 89,5 89,5 --- 99,5
Fi 2 4 7 10 13 9 5
Feito isso, estamos prontos para realizarmos os cinco passos necessários para determinarmos a Média, pelo método da variável transformada. Espero que, nesta altura do campeonato, estes passos já tenham “entrado no sangue” de vocês! É que existe uma diferença entre “decorar” e “entrar no sangue”: neste último caso, a memorização é profunda! Dura meses e até anos! Só é preciso usar uma técnica que os japoneses adotam bastante: repetir o estudo, incansavelmente, muitas e muitas vezes, até a exaustão... acreditem-me: funciona! Noutra oportunidade eu ensinarei um método de memorização que criei, e se aplica perfeitamente à Estatística! É o método do chamequinho! Mas, isso é para outra hora... Vamos à Média! i) coluna do PM e coluna de transformação: Classes 29,4 39,5 49,5 59,5 69,5 79,5 89,5
---------------
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi
PM
2 4 7 10 13 9 5
34,5 44,5 54,5 64,5 74,5 84,5 94,5
(PM-34,5)= Yi 10 0 1 2 3 4 5 6
ii) Coluna do (Yi.fi): Classes 29,4 39,5 49,5 59,5 69,5 79,5 89,5
---------------
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi
PM
2 4 7 10 13 9 5 n=50
34,5 44,5 54,5 64,5 74,5 84,5 94,5
(PM-34,5)= Yi 10 0 1 2 3 4 5 6
Yi.fi 0 4 14 30 52 45 30 175
Página 17 de 20
ESTATÍSTICA – Ponto dos Concursos
iii) Cálculo do
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 18 de 20
⎞ ⎛fpo Mo =linf +⎜⎜ ⋅h +fa⎠ ⎝fpo
:
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(175/50)
Æ
Y =3,5
iv) Desenho dos caminhos de ida e volta: Caminho de Ida 1º)(-34,5)
X =?
e
2º)(÷10)
Xi
Yi 2º)(+34,5)
e
Y = 3,5
1º)(x10)
Caminho de Volta v) Cálculos do Caminho de Volta, partindo do Y : 1º)(x10)Æ 3,5x10=35
e 2º)(+34,5)Æ 35+34,5=69,5 Daí: X = 69,5 Æ Resposta da Questão!
Observação: Vou testar a capacidade de observação dos meus alunos virtuais! Existem duas destas 11 questões muito semelhantes! Muito mesmo! Alguém seria capaz de dizer quais? Estou fazendo isso para demonstrar a importância de se estudar por provas passadas! Às vezes, como no caso destas questões 11 e 9, até o resultado é o mesmo!! É certo que isso de dar a mesma resposta é uma exceção, e não importa muito! Mesmo porque ninguém vai sair “decorando” respostas de provas passadas de Estatística! O importante é que o estilo da questão é o mesmo! O mesmo raciocínio! Os mesmos passos! Tudo igual! Talvez essas minhas palavras venham a animar alguém que sempre achou que tivesse problemas com números e matérias afins (matemática, estatística...). Essas pessoas devem ver que estou falando a verdade!! Basta olhar para essas 11 questões que acabamos de fazer! Por isso, meu amigo, minha amiga, acredite: não é coisa impossível gabaritar uma prova de Estatística de concurso! Basta ficar ligado... (como dizem os recifenses! Tá ligado?) Agora, conforme prometido na página 08 (questão 06) desta aula de hoje, ensinarei a primeira Dica de Ouro do nosso curso! E tem relação com o que aprendemos no Ponto 10: Distribuições Simétricas! A dica é muito simples: Dica de Ouro da Média Aritmética Se a distribuição de freqüências é simétrica, e tem um número ímpar de classes, a Média será o Ponto Médio da classe intermediária!
Página 18 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 19 de 20
Exemplo: a questão 06 de hoje! Vejamos: Xi 30 !--- 40 40 !--- 50 50 !--- 60 60 !--- 70 70 !--- 80 80 !--- 90 90 !--- 100 100 !--- 110 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
Æ Classe intermediária Æ PM=75
Daí, nossa média será exatamente esse valor: X =75. E não precisamos fazer uma conta sequer!! Gostaram? Uma pergunta: todo mundo percebeu, quando foi resolver essa questão, que se tratava de uma distribuição simétrica? Se não percebeu é porque não seguiu o meu conselho do Ponto 10. Vou transcrevê-lo novamente: “...doravante, sempre que nos depararmos com uma Distribuição de Freqüências, a primeira preocupação que teremos será justamente a seguinte: SABER SE A DISTRIBUIÇÃO É SIMÉTRICA, ou não!” (PONTO 10, página 4, 4ºparágrafo) Comigo é assim: eu mato a cobra e digo até a página em que eu falei a dica! Agora, a versão da Dica de Ouro para distribuições com número par de classes: Dica de Ouro da Média Aritmética Se a distribuição de freqüências é simétrica, e tem um número par de classes, a Média será o limite superior da primeira classe intermediária, que é igual ao limite inferior da segunda classe intermediária! Vejamos um exemplo:
30 40 50 60 70 80
Xi !--!--!--!--!--!---
40 50 60 70 80 90
fi 1 3 7 7 3 1
Æ Classe intermediária Æ lsup=60 Æ Classe intermediária Æ linf=60
Daí, dispensando-se toda e qualquer conta, concluímos que a nossa média será essa: X =60. Neste caso, é como se as duas classes intermediárias transformassem em uma única classe (50 a 70), cujo PM é exatamente 60.
se
Página 19 de 20
ESTATÍSTICA – Ponto dos Concursos
Ponto 12-EXERCÍCIOS DE MÉDIA ARITMÉTICA
Página 20 de 20
Bem, fica registrada a dica! Conforme já disse anteriormente, é bastante raro aparecer uma distribuição de freqüências simétrica em uma prova de concurso. Mas não é impossível! Se aparecer, já sabemos como tirar proveito disso. Para fechar essa aula, fiquem com o dever de casa de hoje: uma questão do AFRF de 1996. Já falei dessa questão, mas aqui está ela novamente. E é toda de vocês. Encontrem a Média, ok? Fico por aqui. Semana que vem, se Deus quiser, voltaremos com o estudo da Moda! Um grande abraço e até a próxima! (AFTN-96) Para efeito das cinco próximas questões, considere os seguintes dados:
Classes de Idades (anos) 19,5 !--- 24,5 24,5 !--- 29,5 29,5 !--- 34,5 34,5 !--- 39,5 39,5 !--- 44,5 44,5 !--- 49,5 49,5 !--- 54,5 Total
DISTRIBUIÇÃO DE FREQÜÊNCIAS DAS IDADES DOS FUNCIONÁRIOS DA EMPRESA ALFA, EM 1º/1/90 di.fi di2.fi di3.fi Freqüências Pontos PM − 37 = di (fi) Médios 5 (PM) 2 22 -3 -6 18 -54 9 27 -2 -18 36 -72 23 32 -1 -23 23 -23 29 37 --------18 42 1 18 18 18 12 47 2 24 48 96 7 52 3 21 63 189 n=100 16 206 154
di4.fi
162 144 23 --18 192 567 1106
PS: Se eu fosse vocês, faria novamente todas essas 11 questões da aula de hoje! Pra ver se “entra no sangue”... PS: Por favor, qualquer erro que eu tenha cometido nestas resoluções (seja nas contas ou qualquer outro), não deixem de me avisar, ok? PS final: Feliz “dia dos namorados” pra todos! (É hoje...)
Página 20 de 20
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 1 de 15
MODA Olá, amigos! Como se saíram com as questões de Média? Espero que bem! Mesmo porque o bonde não pode parar, e hoje veremos a segunda (e a mais fácil!) medida de posição: a Moda. Analisando o histórico de provas passadas da ESAF, vemos que a Moda é, dentre as medidas de posição, a menos exigida. Isso não quer dizer que nunca seja cobrada, conforme veremos ainda nesta aula, em exercícios extraídos de provas recentes. Normalmente, quando o valor da Moda é exigido em um enunciado, a ESAF costuma pedir, nesta mesma questão, alguma outra coisa além da Moda. Talvez isso porque determinar a Moda seja realmente muito fácil! Vamos a ela... # Conceito: Na linguagem coloquial (as alunas o sabem perfeitamente!), moda é algo que está em evidência, ou seja, algo que se vê bastante! Na Estatística, como o próprio nome sugere, a Moda é aquele elemento que mais vezes aparece no conjunto! (Leia-se: é o elemento de maior freqüência). Sua determinação é bastante simples, como se verá adiante. Æ Moda para o Rol: Determinar a Moda para um rol é uma das coisas mais fáceis deste curso inteiro! Diante de um rol de elementos, para determinar a Moda, só teremos que verificar qual o elemento que mais se repete! Vejamos um exemplo: Consideremos o conjunto abaixo: {1, 2, 2, 2, 3, 3, 5, 6, 6, 7, 7, 7, 7, 7, 8, 8, 9, 9, 9, 9, 10} Ora, verificamos (usando a milenar técnica do dedo) que o elemento que aparece mais vezes no conjunto é o valor “7”. Logo, não resta dúvida: a Moda deste conjunto é 7. Æ Mo = 7 Só isso!! ATENÇÃO: Convém atentar para o fato de que a Moda é o elemento do conjunto que mais se repete, e não o número de vezes que ele aparece! Este último seria a freqüência do elemento, como já o sabemos! Pode parecer uma observação desnecessária, mas muitas pessoas (bem preparadas!) erraram uma questão do AFRF de 1998, por não estarem atentas a esse detalhe! A referida questão trazia um rol, e pedia que se determinasse a Moda. O rol era o seguinte:
{4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13,14, 15, 15, 15, 16, 16, 18, 23} Frisamos o elemento 8 (oito) do conjunto, o qual se repetiu 9 (nove) vezes. E então? Qual seria a Moda, 8 ou 9? Ora, vimos há pouco:
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 2 de 15
a Moda é o elemento que mais se repete. Neste caso, o elemento mais freqüente é o 8 (oito), portanto, resposta da questão! Uma das opções de resposta era o valor 9 (nove), que muita gente, por displicência, acabou marcando. A Moda, portanto, não é a maior freqüência, e sim o elemento de maior freqüência! Ficou claro? Daí, concluímos que, para determinar a Moda de um rol, não há outro caminho, senão usar o bom e velho dedo, e sair contando quantas vezes se repete cada elemento. E só! Suponhamos, conjunto:
agora,
que
a
questão
solicite a Moda do seguinte
{1, 2, 3, 5, 8, 9, 11, 15} Neste caso, pela mera observação, constatamos que não há nenhum elemento que se repita mais vezes que os demais. Ora, todos eles aparecem uma só vez no conjunto! Daí, concluímos: esse conjunto não possui Moda! Dizemos, destarte, que se trata de um conjunto amodal! Analisemos o conjunto abaixo, quanto à presença da Moda: {2, 3, 4, 4, 4, 6, 7, 8} Já inclusive destacamos o elemento 4, que é o que aparece mais vezes no conjunto! Será ele a nossa Moda, portanto: Mo=4. Ora, como só temos aqui uma única Moda, dizemos que se trata de um conjunto unimodal! Ocorre que a prova pode apresentar um rol da seguinte forma: {1, 2, 3, 3, 3, 4, 5, 6, 6, 7, 7, 7, 8, 9, 9} Quantas Modas? Duas, naturalmente: o 3 (três) Estamos, portanto, diante de um conjunto dito bimodal!
e
o
7
(sete).
E se o conjunto possuir três ou mais Modas, como no exemplo abaixo? {1, 2, 2, 2, 2, 3, 4, 5, 5, 5, 5, 7, 7, 8, 8, 8, 8, 9, 13, 15} Neste caso, diremos que o conjunto é multimodal! Daí, nós chegamos à seguinte conclusão: a Moda é de fato uma medida atípica, porque tanto pode nem existir, quanto pode haver uma, ou duas, ou várias Modas no mesmo conjunto. Diferentemente da Média que, conforme já estudamos, sempre existe e é única! Recapitulando: Æ Conjunto sem Æ Conjunto com Æ Conjunto com Æ Conjunto com
Moda: Amodal; uma única Moda: Unimodal; duas Modas: Bimodal; três ou mais Modas: Multimodal.
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 3 de 15
Essa aula de Moda é um “refresco”, depois de estudarmos o cálculo da Média pela Variável Transformada! Só há uma coisa mais fácil que calcular a Moda de um rol, e é exatamente determinar a Moda para Dados Tabulados. Senão, vejamos: Æ Moda para Dados Tabulados: Suponhamos que a questão da prova solicitou que se determine a Moda do seguinte conjunto abaixo: Xi 1 2 3 4 5 6
fi 3 7 10 15 3 2
Verificamos que, nesta questão, os elementos não estão apresentados sob a forma de um rol; também não vieram subdivididos em classes! Vemos que, embora tabelados, os dados foram dispostos individualmente (vide a coluna do Xi). Por isso, dizemos que estamos diante de “Dados Tabulados Não Agrupados em Classes”, ou simplesmente, “Dados Tabulados”. (Vide Ponto nº07: Apresentação dos Dados). Quando isso ocorrer, ou seja, quando os elementos forem apresentados sob esta forma de “Dados Tabulados”, para determinarmos a Moda só teremos que procurar, na coluna do fi, qual é a maior freqüência! Vejamos: Xi 1 2 3 4 5 6
fi 3 7 10 15 3 2
Æ maior freqüência!
Feito isto, nosso trabalho se resumirá a identificar o elemento Xi ao qual corresponde aquela maior freqüência. Ou seja: Xi 1 2 3 4 5 6
fi 3 7 10 15 3 2
Æ maior freqüência!
ESTATÍSTICA-Ponto dos Concursos
Neste caso, fi=15, referente Æ Mo = 4. Está feito: Só isso! Mais fácil,
Ponto 13 – MODA
Página 4 de 15
verificamos que a maior freqüência simples ao elemento Xi=4! Logo, nossa Moda será
(>fi) é o elemento 4.
nossa Moda é simplesmente o elemento de maior freqüência. impossível!
Æ Moda para Distribuição de Freqüências: Existem diferentes formas de se calcular a Moda de uma Distribuição de Freqüências. Para efeito de concurso, duas destas maneiras nos interessarão! São, na verdade, dois métodos, cada um dos quais traduzido por uma fórmula. Aprenderemos a determinar a Moda da Distribuição de Freqüências pelo Método de Czuber e pelo Método de King! Teremos então que conhecer ambas as fórmulas, saber aplicá-las e, sobretudo, saber quando usar uma ou outra. A regra é a seguinte: se a questão não especificar qual das fórmulas a ser empregada, pedindo apenas que se calcule a Moda, usaremos a fórmula de Czuber. Conseqüentemente, só empregaremos a fórmula de King quando assim for solicitado expressamente pelo enunciado. # Passo Preliminar: A Classe Modal A determinação da Moda de uma Distribuição requer que se proceda a um passo preliminar, que consiste em identificar a classe modal daquele conjunto. A classe modal será, simplesmente, aquela que apresentar maior freqüência absoluta simples, ou seja, maior fi. Apenas isso! Por exemplo, vamos determinar a classe modal dos seguintes conjuntos: a) Xi fi 0 |--- 10 9 10 |--- 20 15 20 |--- 30 28 30 |--- 40 17 40 |--- 50 11 Sol.: Xi fi 0 |--- 10 9 10 |--- 20 15 28 20 |--- 30 Æ Maior fi (fi=28)! Æ Classe Modal! 17 30 |--- 40 11 40 |--- 50 b) Xi 90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
ESTATÍSTICA-Ponto dos Concursos
fi 40 60 140 160 180 120 40 30 20 10
Ponto 13 – MODA
Página 5 de 15
Sol.: Xi 90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
fi 40 60 140 160 180 120 40 30 20 10
Æ Maior fi (fi=180)! Æ Classe Modal!
Não tem segredo! Agora, que já identificamos a classe modal da nossa Distribuição, só nos resta aprender a fórmula que aplicaremos, de acordo com o método solicitado pela questão! # Moda pelo Método de Czuber: É dado pela fórmula seguinte:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠ onde: linf = limite inferior da classe modal. Δa = diferença entre a fi da classe modal e a fi da classe anterior. Entenderemos como classe anterior aquela que precede à classe modal. Δp = diferença entre a fi da classe modal e a fi da classe posterior (aquela que vem logo após a classe modal). h = amplitude da classe modal. Para não haver qualquer confusão, vamos identificar, nos exemplos abaixo, quem são a classe anterior e a classe posterior, cujas fi serão utilizadas nos cálculos dos deltas (Δa e Δp). Teremos: a) 0 10 20 30 40
Xi |--|--|--|--|---
10 20 30 40 50
fi 9 15 28 17 11
Æ Classe Anterior! Æ Classe Modal! Æ Classe Posterior!
ESTATÍSTICA-Ponto dos Concursos
b) Xi 90 !--- 95
fi 40
Ponto 13 – MODA
Página 6 de 15
95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
60 140 160 180 120 40 30 20 10
Æ Classe Anterior! Æ Classe Modal! Æ Classe Posterior!
Aprendamos o seguinte: delta (Δ) normalmente significa “diferença”. Quando falamos em Δa, estamos nos referindo a “diferença anterior” (“a” de “anterior”!). Diferença entre quem? Entre duas freqüências simples: a da classe modal e a da classe anterior. Ou seja: Δa = fi(classe modal) – fi(classe anterior) Da mesma forma, no cálculo do Δp, nos lembraremos que o Δ significa “diferença” e o “p” significa “posterior”! Logo Δp será a diferença entre duas freqüências simples: a da classe modal e a da classe posterior. Ou seja: Δp = fi(classe modal) – fi(classe posterior) Finalmente, estamos prontos para aplicar o Método de Czuber, determinar a Moda de uma Distribuição de Freqüências! Vamos aos exemplos:
e
a) Determinar, pelo Método de Czuber, o valor da Moda do seguinte conjunto: 0 10 20 30 40
Xi |--|--|--|--|---
10 20 30 40 50
fi 9 15 28 17 11
Sol.: Destacaremos os passos a serem seguidos, a fim de facilitar nossa memorização. i) Passo Preliminar: identificar a classe modal! 0 10 20 30 40
Xi |--|--|--|--|---
10 20 30 40 50
fi 9 15 28 17 11
Æ Classe Modal! (a de maior fi)
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 7 de 15
ii) Determinação de Δa e Δp. Xi
fi
0 |--- 10 10 |--- 20 20 |--- 30 30 |--- 40 40 |--- 50
9 15 28 17 11
Æ Classe Anterior: Δa=28-15 Æ Δa=13 Æ Classe Modal! Æ Classe Posterior: Δp=28-17 Æ Δp=11
iii) Substituição dos valores correspondentes na fórmula de Czuber: Teremos que:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
Observemos na fórmula que os dados linf e h dizem respeito à classe modal, portanto: Æ linf=20 (= limite inferior da classe modal) e Æ h=10 (= amplitude da classe modal) Daí, teremos:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
Æ
⎛ 13 ⎞ Mo = 20 + ⎜ ⎟ ⋅10 Æ ⎝ 13 + 11 ⎠
E: Mo=25,42 Æ Resposta!
b) Calcular a Moda do conjunto abaixo, pelo Método de Czuber: Xi 90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
fi 40 60 140 160 180 120 40 30 20 10
Sol.: É só seguir a nossa “receita de bolo” e não tem dificuldade!
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 8 de 15
i) Passo Preliminar: identificar a classe modal! Xi 90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
Fi 40 60 140 160 180 120 40 30 20 10
Æ Classe Modal! Æ (a de maior fi)
ii) Determinação de Δa e Δp. Xi 90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
fi 40 60 140 160 180 120 40 30 20 10
Æ Classe Anterior: Δa=180-160 Æ Δa=20 Æ Classe Modal! Æ Classe Posterior: Δp=180-120 Æ Δp=60
iii) Substituição dos valores correspondentes na fórmula de Czuber: Teremos que:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
Tomando os valores da classe modal, encontraremos que: Æ linf=110 (= limite inferior da classe modal) e Æ h=5 (= amplitude da classe modal) Daí, teremos:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ Δ a + Δ p ⎝ ⎠
Æ
⎛ 20 ⎞ Mo = 110 + ⎜ ⎟ ⋅5 Æ ⎝ 20 + 60 ⎠
E: Mo=111,25 Æ Resposta!
# Moda pelo Método de King: Até bem pouco tempo, as provas da ESAF costumavam apresentar enunciados solicitando o cálculo da Moda da distribuição de freqüências, sem a preocupação de especificar qual dos métodos deveria ser empregado neste cálculo. Com isso, ficava sempre implícita a exigência de utilização do Método de Czuber. De fato, todas as respostas – os gabaritos oficiais – apontavam para resultados de aplicação deste método.
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 9 de 15
Todavia, em prova bastante recente, no segundo AFRF de 2002, o enunciado solicitou, expressamente, que se calculasse a Moda do conjunto, pelo “conceito de Czuber”. Ora, como isso nunca acontecera antes, fui levado a ter o seguinte raciocínio: se nesta prova a ESAF começou a indicar o método a ser usado no cálculo da Moda, é bastante possível que resolva inovar e, quem sabe no próximo concurso, solicitar que se calcule a Moda pelo Método de King! Não é verdade? Destarte, parece-me deveras conveniente aprendermos também este Método de King, o qual se traduz pela seguinte fórmula:
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠ onde: linf = limite inferior da classe modal. fpost = fi da classe posterior à classe modal; fant = fi da classe anterior à classe modal; h = amplitude da classe modal Observemos que a fórmula de King não contempla “deltas”, ou seja, diferenças! Em vez disso, surgem entre parênteses as próprias freqüências da classe anterior (fant) e da classe posterior (fpost). Fique claro que, também neste método, entenderemos classe anterior como a que precede a classe modal; e, classe posterior a que a sucede. Igualmente aqui, realizaremos o passo preliminar de identificação da classe modal (cujo conceito permanece inalterado!). Feito este passo preliminar, só nos restará substituir os respectivos valores na fórmula de King. Vejamos os exemplos abaixo: a) Determinar, conjunto:
pelo
Método
0 10 20 30 40
de
Xi |--|--|--|--|---
Sol.: Igualmente aqui destacaremos facilitar nossa memorização.
King,
o
10 20 30 40 50
fi 9 15 28 17 11
os
passos
valor
da
da
Moda
questão,
no
do
seguinte
intuito
i) Passo Preliminar: identificar a classe modal! 0 10 20 30 40
Xi |--|--|--|--|---
10 20 30 40 50
fi 9 15 28 17 11
Æ Classe Modal! (a de maior fi)
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 10 de 15
de
ii) Identificação dos elementos da fórmula fpost e fant.
0 10 20 30 40
Xi |--|--|--|--|---
10 20 30 40 50
fi 9 15 28 17 11
Æ Classe anterior Æ fant=15 Æ Classe Modal! (a de maior fi) Æ Classe posterior Æ fpost=17
E, finalmente, no derradeiro passo, aplicaremos a fórmula de King, substituindo os valores respectivos: iii) Substituição dos valores correspondentes na fórmula de King: Teremos que:
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠
Como os valores de linf e h dizem respeito à classe modal, teremos: Æ linf=20 (= limite inferior da classe modal) e Æ h=10 (= amplitude da classe modal) Daí, teremos:
⎛ ⎞ fpost ⎛ 17 ⎞ ⎟⎟ ⋅ h Æ Mo = 20 + ⎜ Mo = l inf + ⎜⎜ ⎟ ⋅10 Æ ⎝ 17 + 15 ⎠ ⎝ fpost + fant ⎠
E: Mo=25,31 Æ Resposta!
Observação: Fizemos o cálculo da Moda para este mesmo exemplo usando o Método de Czuber (vide páginas 6 e 7), e encontramos o resultado de Mo=25,42. Conclusão: os valores da Moda, para um mesmo conjunto, determinados pelos dois métodos – Czuber e King – são ligeiramente diferentes. Mas não nos iludamos: é bastante provável (quase certo) que ambos os resultados estejam presentes entre as opções de resposta! Portanto, temos que estar cientes de qual das fórmulas devemos usar. Mais um exemplo! b) Calcular a Moda do conjunto abaixo, pelo Método de King: Xi 90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
fi 40 60 140 160 180 120 40 30 20 10
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 11 de 15
Sol.: i) Passo Preliminar: identificar a classe modal! Xi fi 90 !--- 95 40 95 !--- 100 60 100 !--- 105 140 105 !--- 110 160 180 110 !--- 115 Æ Classe Modal! Æ (a de maior fi) 120 115 !--- 120 40 120 !--- 125 30 125 !--- 130 20 130 !--- 135 10 135 !--- 140 ii) Identificação dos elementos da fórmula fpost e fant. Xi 90 !--- 95 95 !--- 100 100 !--- 105 105 !--- 110 110 !--- 115 115 !--- 120 120 !--- 125 125 !--- 130 130 !--- 135 135 !--- 140
fi 40 60 140 160 180 120 40 30 20 10
Æ Classe anterior Æ fant=160 Æ Classe Modal! (a de maior fi) Æ Classe posterior Æ fpost=120
iii) Substituição dos valores correspondentes na fórmula de King: Teremos que:
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠
Observando a classe modal, verificamos que: Æ linf=110 (= limite inferior da classe modal) e Æ h=5 (= amplitude da classe modal) Daí, teremos:
⎛ ⎞ fpost ⎛ 120 ⎞ ⎟⎟ ⋅ h Æ Mo = 110 + ⎜ Mo = l inf + ⎜⎜ ⎟ ⋅ 5 Æ E: Mo=112,14 ⎝ 120 + 160 ⎠ ⎝ fpost + fant ⎠
Æ Resposta!
Obs.: Também para este conjunto, já havíamos calculado a Moda pelo Método de Czuber (vide páginas 7 e 8), ocasião em que encontramos o valor de Mo=111,25. # Dica de Memorização: Para facilitar a memorização destas duas fórmulas – Czuber e poderemos seguir a seguinte sugestão:
King –
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 12 de 15
1º) Memorizemos o corpo de ambas as fórmulas, que é exatamente o mesmo:
⎛ Mo = l inf + ⎜⎜ ⎝
⎞ ⎟⎟ ⋅ h ⎠
2º) Agora, nossa preocupação será apenas com o “miolo” da fórmula, ou seja, aquilo que estará dentro dos parênteses! Æ Aí, lembraremos: “a fórmula de Czuber é a fórmula dos deltas” e com Δa no numerador! Percebamos que quem está no numerador também inicia a soma do denominador! Daí:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠ Æ Ora, se Czuber é a fórmula dos deltas, então King é a fórmula das freqüências, começando com fpost no numerador! Logo, fpost também iniciará a soma no denominador! E teremos:
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠ Cuidado com o numerador dos parênteses destas duas fórmulas: em Czuber surge o “delta anterior” , enquanto que em King teremos a “freqüência posterior”. É preciso toda a atenção! # Propriedades da Moda: Antes de passarmos aos exercícios de hoje, convém questionarmos o seguinte: será que aquelas propriedades da soma, subtração, produto e divisão, que aprendemos para a Média Aritmética, também se aplicarão à Moda? Ora, vejamos um exemplo: suponhamos que dispomos do seguinte conjunto abaixo: A = {1, 2, 2, 3, 4, 5, 5, 5, 8} Sem qualquer dificuldade, já identificamos que a Moda é o elemento 5. Agora, caso tomemos todos os elementos deste conjunto original A, e os somemos a uma constante, K=10, por exemplo, teremos o novo conjunto: A’ = {11, 12, 12, 13, 14, 15, 15, 15, 18} Verificamos, portanto, que se aplica também à Moda a Propriedade da Soma e da Subtração, uma vez que a nova Moda, ou seja, a Moda do novo conjunto, será igual à Moda do conjunto original (5) somada à constante k=10. Daí, a nova Moda é: Mo=15. Da mesma forma, se tomarmos cada elemento do conjunto original A e os multiplicarmos por uma constante, k=2, por exemplo, teremos o novo conjunto: A’’ = {2, 4, 4, 6, 8, 10, 10, 10, 16} Nossa nova Moda será 10, que é exatamente o resultado da multiplicação entre a Moda do conjunto original (5) e a constante K=2. Destarte, concluímos que à
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 13 de 15
Moda também se aplica a Propriedade do Produto e da Divisão, que aprendemos na Média. É isso! Acho que já estamos prontos para resolver algumas questões recentes de provas da ESAF, dentre outras! Vamos a elas!
EXERCÍCIOS DE HOJE Enunciado Único para as Questões de 1 a 5: Para cada um dos conjuntos abaixo, determine o valor da Moda, das duas maneiras distintas, utilizando o método de Czuber e o Método de King. 01. Trabalhe a Distribuição abaixo:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 3 5 8 4 2
02. Trabalhe a Distribuição abaixo:
0 15 30 45 60 75
Xi !--!--!--!--!--!---
15 30 45 60 75 90
fi 4 7 11 9 5 2
03. Trabalhe a Distribuição abaixo:
0 7 14 21 28
Xi !--!--!--!--!---
7 14 21 28 35
fi 7 11 15 9 3
04. Trabalhe a Distribuição abaixo:
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 5 3
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 14 de 15
05. Trabalhe a Distribuição abaixo:
30 40 50 60 70 80 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
Obs.: Atente para esta questão 05, pois será objeto da Regra de Ouro da Moda, que aprenderemos somente na próxima aula!
06. Extraído da prova de AFRF – 2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüência seguinte: 29,5 39,5 49,5 59,5 69,5 79,5 89,5
Xi – – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Freqüência (f) 4 8 14 20 26 18 10
Assinale a opção que corresponde ao valor modal do atributo X, no conceito de Czuber. a) 69,50
b)73,79
c)71,20
d)74,53
e)80,10
07. Extraído da prova AFRF – 1998: Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14, 15, 15, 15, 16, 16, 18, 23 Com base nestes dados, assinale a opção que corresponde ao preço modal. a) 8 b) 23 c) 7 d) 10 e) 9
ESTATÍSTICA-Ponto dos Concursos
Ponto 13 – MODA
Página 15 de 15
08. Extraído da prova do AFRF – 1996: DISTRIBUIÇÃO DE FREQÜÊNCIAS DAS IDADES DOS FUNCIONÁRIOS DA EMPRESA ALFA, EM 01/01/90 di . fi di2 . fi Freq. Ptos. Médios Xi-37 = di di3 . fi di4 . fi Classes das idades (fi) (Xi) 5 (anos) 19,5 – 24,5 2 22 -3 -6 18 -54 162 24,5 – 29,5 9 27 -2 -18 36 -72 144 29,5 – 34,5 23 32 -1 -23 23 -23 23 34,5 – 39,5 29 37 39,5 – 44,5 18 42 1 18 18 18 18 44,5 – 49,5 12 47 2 24 48 96 192 49,5 – 54,5 7 52 3 21 63 189 567 Total 100 16 206 154 1106
Marque a opção que representa a moda das idades dos funcionários em 01/01/90. a) 35,97 b) 36,26 c) 36,76 d) 37,03 e) 37,31 Ok, amigos! Ficamos por aqui! Na aula seguinte, prosseguiremos com as resoluções destes exercícios que vão ficando de hoje, como já é de praxe. Quero aproveitar o ensejo e dirigir algumas palavras de agradecimento ao meu mais novo amigo do Ponto, o Professor Sérgio Gadelha – de quem sou sincero admirador, e que tive a honra de manter contato (ainda que por e-mail) –, pelo incentivo que me transmitiu e pela gentil acolhida que me proporcionou. Fico lisonjeado em partilhar com este grande profissional a missão de tentar facilitar aos alunos o estudo e a compreensão da estatística. Um grande abraço, Professor! Amanhã, aliás hoje (já é uma e meia da manhã), completo um mês de Ponto dos Concursos! Só quero ainda agradecer, mais uma vez, ao Professor Vicente Paulo, por essa oportunidade de poder expandir, a uma proporção que nunca antes imaginei possível, essa atividade que considero entre todas a mais sublime, que é a de transmitir conhecimentos e repassar experiências. Não tenho palavras para expressar minha gratidão. Nesses últimos dias, uma velha preocupação voltou a me incomodar e, mais uma vez, vou pedir um “retorno” de vocês, meus alunos: não estarei eu correndo muito com a matéria? Mesmo sabendo que as aulas permanecem disponíveis no Site, tenho um grande desejo de que aqueles que estão me acompanhando desde o início não percam o “tempo” do curso, entendem? Quero dizer, que a matéria não se transforme em uma bola de neve, e com isso, o aluno não fique desanimado, achando que não vai aprendê-la. E também porque sou muito acostumado à sala de aula, e não quero ver ninguém “perdido” nos assuntos que estamos vendo. Então, se não for abusar muito, passem-me a impressão de vocês, ok? Mudando de assunto: peço novamente licença a todos, para anunciar que estou, (acreditem!) ainda sem êxito, tentando reunir umas dez ou doze cabeças pensantes, para iniciarmos uma turminha de Matemática Financeira e Estatística, a preço de custo (eu tô quase pagando pra dar aula!), na Terra do Sol, nesta cidade que é sinônimo de encantamento, beleza e alegria (acho que é por isso que ninguém quer fazer curso!), que é a minha Fortaleza! Pra quem aparecer, eu prometo até o gabarito da prova! É só mandar um e-mail! Dedico a aula de hoje à minha amada esposa, Sílvia, que tem suportado comigo as agruras da distância a qual somos ora forçados a enfrentar, por conta desses meus concursos... Fica com Deus, meu amor! Um abraço especial para os alunos silenciosos, aqueles que sorrateiramente acessam o Site e, sem que ninguém perceba, imprimem as aulas e estudam ali no seu cantinho, sem jamais dizer palavra! Eu fiz muito isso com as aulas do Vicente e do Marcelo... e eles nem sabiam que eu existia... Um forte abraço a todos, e até a próxima!
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 1 de 13
EXERCÍCIOS DE MODA Olá, amigos! Hoje resolveremos as questões sobre a Moda deixadas na última aula. E veremos também, conforme prometido, a Dica de Ouro da Moda. Vamos a elas!
Enunciado Único para as Questões de 1 a 5: Para cada um dos conjuntos abaixo, determine o valor da Moda, das duas maneiras distintas, utilizando o Método de Czuber e o Método de King. 01. Trabalhe a Distribuição abaixo:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 3 5 8 4 2
Sol.: Nestas questões, seguiremos a seguinte rotina: 1)Encontraremos a classe modal; 2)Determinaremos os elementos da fórmula de Czuber; 3)Calcularemos a Moda de Czuber; 4)Determinaremos os elementos da fórmula de King; 5)Calcularemos a Moda de King. Ok? Vamos lá! i) Determinação da Classe Modal:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 3 5 8 4 2
Æ Classe Modal! Æ (a de maior fi)
Observemos aqui que os elementos comuns às duas fórmulas da Moda (Czuber e King) são determinados a partir da Classe Modal, quais sejam: o limite inferior da classe modal (linf) e a sua amplitude (h). Neste caso, teremos: linf=20 e h=10 ii) Elementos da fórmula de Czuber: Δa e Δp Teremos:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 3 5 8 4 2
Æ Classe Anterior: Δa=8-5 Æ Δa=3 Æ Classe Modal! Æ Classe Posterior: Δp=8-4 Æ Δp=4
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 2 de 13
iii) Cálculo da Moda de Czuber:
Segundo Czuber, teremos que:
⎛ 3 ⎞ ⎟ ⋅10 ⎝ 3+ 4⎠
Daí: Mo = 20 + ⎜
Æ
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
E: Mo=24,28 Æ Resposta!
iv) Elementos da Fórmula de King: fpost e fant
0 10 20 30 40
Xi !--!--!--!--!---
fi 3 5 8 4 2
10 20 30 40 50
Æ Classe anterior Æ fant=5 Æ Classe Modal! Æ Classe posterior Æ fpost=4
v) Cálculo da Moda de King
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠
Segundo King, teremos que:
⎛ 4 ⎞ ⎟ ⋅10 ⎝ 4+5⎠
Daí: Mo = 20 + ⎜
Æ
E: Mo=24,44 Æ Resposta!
02. Trabalhe a Distribuição abaixo:
0 15 30 45 60 75
Xi !--!--!--!--!--!---
15 30 45 60 75 90
fi 4 7 11 9 5 2
Sol.: Seguiremos os mesmos passos, para fixá-los melhor! i) Determinação da Classe Modal:
0 15 30 45 60 75
Xi !--!--!--!--!--!---
15 30 45 60 75 90
fi 4 7 11 9 5 2
Æ Classe Modal! Æ (a de maior fi)
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 3 de 13
Para a qual teremos: linf=30 e h=15 ii) Elementos da fórmula de Czuber: Δa e Δp
0 15 30 45 60 75
Xi !--!--!--!--!--!---
fi 4 7 11 9 5 2
15 30 45 60 75 90
Æ Classe Anterior: Δa=11-7 Æ Δa=4 Æ Classe Modal! Æ Classe Posterior: Δp=11-9 Æ Δp=2
iii) Cálculo da Moda de Czuber:
Segundo Czuber, teremos que:
⎛ 4 ⎞ ⎟ ⋅15 ⎝ 4+2⎠
Daí: Mo = 30 + ⎜
Æ
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
E: Mo=40,0 Æ Resposta!
iv) Elementos da Fórmula de King: fpost e fant
0 15 30 45 60 75
Xi !--!--!--!--!--!---
fi 4 7 11 9 5 2
15 30 45 60 75 90
Æ Classe anterior Æ fant=7 Æ Classe Modal! Æ Classe posterior Æ fpost=9
v) Cálculo da Moda de King
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠
Segundo King, teremos que:
⎛ 9 ⎞ ⎟ ⋅15 ⎝9+7⎠
Daí: Mo = 30 + ⎜
Æ
E: Mo=38,43 Æ Resposta!
03. Trabalhe a Distribuição abaixo:
0 7 14 21 28
Xi !--!--!--!--!---
7 14 21 28 35
fi 7 11 15 9 3
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 4 de 13
Sol.: Novamente, seguindo a mesma seqüência.
i) Determinação da Classe Modal:
0 7 14 21 28
Xi !--!--!--!--!---
fi 7 11 15 9 3
7 14 21 28 35
Æ Classe Modal! Æ (a de maior fi)
Para a qual teremos: linf=14 e h=7 ii) Elementos da fórmula de Czuber: Δa e Δp
0 7 14 21 28
Xi !--!--!--!--!---
fi 7 11 15 9 3
7 14 21 28 35
Æ Classe Anterior: Δa=15-11 Æ Δa=4 Æ Classe Modal! Æ Classe Posterior: Δp=15-9 Æ Δp=6
iii) Cálculo da Moda de Czuber:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
Segundo Czuber, teremos que:
⎛ 4 ⎞ ⎟⋅7 ⎝ 4+6⎠
Daí: Mo = 14 + ⎜
Æ
E: Mo=16,8 Æ Resposta!
iv) Elementos da Fórmula de King: fpost e fant
0 7 14 21 28
Xi !--!--!--!--!---
fi 7 11 15 9 3
7 14 21 28 35
Æ Classe anterior Æ fant=11 Æ Classe Modal! Æ Classe posterior Æ fpost=9
v) Cálculo da Moda de King
Segundo King, teremos que:
⎛ 9 ⎞ ⎟⋅7 ⎝ 9 + 11 ⎠
Daí: Mo = 14 + ⎜
Æ
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠ E: Mo=17,15 Æ Resposta!
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 5 de 13
04. Trabalhe a Distribuição abaixo:
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 5 3
Sol.: Percebamos que a assimilação dos passos da Estatística é algo natural, que acontece na medida em que os repetimos! i) Determinação da Classe Modal:
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 5 3
Æ Classe Modal! Æ (a de maior fi)
Para a qual teremos: linf=29,5 e h=10 ii) Elementos da fórmula de Czuber: Δa e Δp
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 5 3
Æ Classe Anterior: Δa=7-6 Æ Δa=1 Æ Classe Modal! Æ Classe Posterior: Δp=7-5 Æ Δp=2
iii) Cálculo da Moda de Czuber:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
Segundo Czuber, teremos que:
⎛ 1 ⎞ ⎟ ⋅10 ⎝1+ 2 ⎠
Daí: Mo = 29,5 + ⎜
Æ
E: Mo=32,83 Æ Resposta!
iv) Elementos da Fórmula de King: fpost e fant
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 5 3
Æ Classe anterior Æ fant=6 Æ Classe Modal! Æ Classe posterior Æ fpost=5
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 6 de 13
v) Cálculo da Moda de King Segundo King, teremos que:
⎛ 5 ⎞ ⎟ ⋅10 ⎝5+6⎠
Daí: Mo = 29,5 + ⎜
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠ Æ
E: Mo=34,04 Æ Resposta!
05. Trabalhe a Distribuição abaixo: Xi 30 !--- 40 40 !--- 50 50 !--- 60 60 !--- 70 70 !--- 80 80 !--- 90 90 !--- 100 100 !--- 110 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
Sol.: Toda a atenção para esta questão! Primeiramente, a resolveremos pelas fórmulas convencionais, de Czuber e King. Depois vem a dica! i) Determinação da Classe Modal:
30 40 50 60 70 80 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
Æ Classe Modal! Æ (a de maior fi)
Para a qual teremos: linf=70 e h=10 ii) Elementos da fórmula de Czuber: Δa e Δp
30 40 50 61 70 80 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
Æ Classe Anterior: Δa=14-11 Æ Δa=3 Æ Classe Modal! Æ Classe Posterior: Δp=14-11 Æ Δp=3
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 7 de 13
iii) Cálculo da Moda de Czuber:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
Segundo Czuber, teremos que:
⎛ 3 ⎞ ⎟ ⋅10 ⎝ 3+ 3⎠
Daí: Mo = 70 + ⎜
Æ
E: Mo=75 Æ Resposta!
iv) Elementos da Fórmula de King: fpost e fant
30 40 50 62 70 80 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
Æ Classe anterior Æ fant=11 Æ Classe Modal! Æ Classe posterior Æ fpost=11
v) Cálculo da Moda de King
Segundo King, teremos que:
⎛ 11 ⎞ ⎟ ⋅10 ⎝ 11 + 11 ⎠
Daí: Mo = 70 + ⎜
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠ Æ
E: Mo=75 Æ Resposta!
Observação 01) A primeira coisa interessante que observamos nesta questão é que ela foi, das cinco que fizemos até aqui, a única em que os resultados da Moda de Czuber e da Moda de King foram exatamente iguais! O motivo é simples: esse nosso conjunto foi a primeira Distribuição de Freqüências Simétrica que trabalhamos hoje! Conclusão inicial: se a distribuição de freqüências é simétrica, estaremos livres para calcular a Moda tanto por Czuber quanto por King, pois o resultado será o mesmo. Fica a gosto do freguês! Acontece que estou certo de que o freguês vai preferir não fazer conta nenhuma! E de fato, isso não será preciso! Vejamos a razão: Dica de Ouro da Moda Se a distribuição de freqüências é simétrica, a Moda do conjunto será exatamente igual à Média! Essa dica de nada adiantará se não nos lembrarmos que a Média tem também sua dica de ouro, que foi vista no Ponto nº12, na página 17, e que reproduzirei abaixo:
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 8 de 13
Dica de Ouro da Média Aritmética Se a distribuição de freqüências é simétrica, e tem um número ímpar de classes, a Média será o Ponto Médio da classe intermediária! Dica de Ouro da Média Aritmética Se a distribuição de freqüências é simétrica, e tem um número par de classes, a Média será o limite superior da primeira classe intermediária, que é igual ao limite inferior da segunda classe intermediária! Daí, meus amigos, a facilidade de se trabalhar com uma Distribuição de Freqüências Simétrica: somos dispensados de perder um tempo precioso fazendo cálculos de Média e de Moda (por enquanto!). Ambas serão iguais (nas distribuições simétricas!) e determinadas pelo PM da classe intermediária, conforme explicado acima! Caso haja alguma dificuldade em relembrar como funciona essa dica de ouro da Média, basta retornarmos ao Ponto nº12, na página 17, para reavivarmos nossa memória! Outra coisa: espero que, doravante, redobremos nossa atenção quando estivermos diante de uma distribuição de freqüências, para que nossa primeira preocupação seja, SEMPRE, verificar se ela é ou não simétrica! (Será que já disse isso antes?...) Daí, para refazermos essa nossa questão 05 pela Dica de Ouro da Moda, teríamos apenas que enxergar que se tratava de uma distribuição simétrica. Daí:
30 40 50 60 70 80 90 100 110 Conclusão:
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
X = Mo = 75
fi 1 3 7 11 14 11 7 3 1
Æ Classe intermediária Æ PM=75
Æ Resposta! (O mesmo resultado de Czuber e King)
06. Extraído da prova de AFRF – 2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüência seguinte:
29,5 39,5 49,5 59,5 69,5 79,5 89,5
Xi – – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Freqüência (f) 4 8 14 20 26 18 10
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 9 de 13
Assinale a opção que corresponde ao valor modal do atributo X, no conceito de Czuber. a) 69,50
b)73,79
c)71,20
Sol.: Esta questão é exatamente a que eu disse que a ESAF especificou qual dos determinação da Moda! Iremos além do que o vez, determinaremos a Moda por Czuber e por
d)74,53
e)80,10
me referi na aula passada, quando métodos deveria ser utilizado na enunciado está pedindo e, mais uma King.
i) Determinação da Classe Modal:
29,5 39,5 49,5 59,5 69,5 79,5 89,5
Xi – – – – – –
fi 4 8 14 20 26 18 10
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Æ Classe Modal! Æ (a de maior fi)
Para a qual teremos: linf=69,5 e h=10 ii) Elementos da fórmula de Czuber: Δa e Δp
29,5 39,5 49,5 59,5 69,5 79,5 89,5
Xi – – – – – –
fi 4 8 14 20 26 18 10
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Æ Classe Anterior: Δa=26-20 Æ Δa=6 Æ Classe Modal! Æ Classe Posterior: Δp=26-18 Æ Δp=8
iii) Cálculo da Moda de Czuber:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
Segundo Czuber, teremos que:
⎛ 6 ⎞ ⎟ ⋅ 10 ⎝ 6 + 8⎠
Daí: Mo = 69,5 + ⎜
Æ
E: Mo=73,79 Æ Resposta da Questão!
iv) Elementos da Fórmula de King: fpost e fant
29,5 39,5 49,5 59,5 69,5 79,5 89,5
Xi – – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi 4 8 14 20 26 18 10
Æ Classe anterior Æ fant=20 Æ Classe Modal! Æ Classe posterior Æ fpost=18
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 10 de 13
v) Cálculo da Moda de King
Segundo King, teremos que:
⎛ 18 ⎞ ⎟ ⋅ 10 ⎝ 18 + 20 ⎠
Daí: Mo = 69,5 + ⎜
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠ Æ
E: Mo=74,24 Æ Resposta!
Observemos que, entre as opções de resposta, não aparece este resultado que encontramos na Moda de King, mas há um resultado próximo, que é a letra “d” (74,53). Daí, a importância de utilizar o método correto! Caso o enunciado desta questão não houvesse especificado que deveríamos usar o Método de Czuber, teríamos que utilizá-lo de qualquer forma! Já foi dito (na aula passada, página 4, terceiro parágrafo), que em caso de silêncio do enunciado quanto ao método a ser empregado no cálculo da Moda, usamos o de Czuber!
07. Extraído da prova AFRF – 1998: Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14, 15, 15, 15, 16, 16, 18, 23 Com base nestes dados, assinale a opção que corresponde ao preço modal. a) 8 b) 23 c) 7 d) 10 e) 9 Sol.: Aqui não tem Czuber nem King! Tem apenas a Técnica do Dedo, para contarmos o elemento que mais se repete! Somente isso! E a conclusão é quase imediata: o elemento 8 aparece neste rol mais vezes que os demais. Portanto: Mo = 8 Æ Resposta!
08. Extraído da prova do AFRF – 1996: DISTRIBUIÇÃO DE FREQÜÊNCIAS DAS IDADES DOS FUNCIONÁRIOS DA EMPRESA ALFA, EM 01/01/90 Classes das Freq. Ptos. Médios Xi-37 = di Di . fi di2 . fi di3 . fi di4 . fi (fi) (Xi) 5 idades (anos) 19,5 – 24,5 2 22 -3 -6 18 -54 162 24,5 – 29,5 9 27 -2 -18 36 -72 144 29,5 – 34,5 23 32 -1 -23 23 -23 23 34,5 – 39,5 29 37 39,5 – 44,5 18 42 1 18 18 18 18 44,5 – 49,5 12 47 2 24 48 96 192 49,5 – 54,5 7 52 3 21 63 189 567 Total 100 16 206 154 1106
Marque a opção que representa a moda das idades dos funcionários em 01/01/90. a) 35,97 b) 36,26 c) 36,76 d) 37,03 e) 37,31
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 11 de 13
Sol.: Percebamos que aqui o enunciado não especificou se queria a Moda de Czuber ou de King. Daí, não resta dúvida: usaremos o Método de Czuber. Podemos até reduzir essa tabela e usarmos só o que nos interessa:
19,5 24,5 29,5 34,5 39,5 44,5 49,5
Xi – – – – – – –
24,5 29,5 34,5 39,5 44,5 49,5 54,5
fi 2 9 23 29 18 12 7
i) Determinação da Classe Modal:
19,5 24,5 29,5 34,5 39,5 44,5 49,5
Xi – – – – – – –
fi 2 9 23 29 18 12 7
24,5 29,5 34,5 39,5 44,5 49,5 54,5
Æ Classe Modal! Æ (a de maior fi)
Para a qual teremos: linf=34,5 e h=5 ii) Elementos da fórmula de Czuber: Δa e Δp
19,5 24,5 29,5 34,5 39,5 44,5 49,5
Xi – – – – – – –
fi 2 9 23 29 18 12 7
24,5 29,5 34,5 39,5 44,5 49,5 54,5
Æ Classe Anterior: Δa=29-23 Æ Δa=6 Æ Classe Modal! Æ Classe Posterior: Δp=29-18 Æ Δp=11
iii) Cálculo da Moda de Czuber:
Segundo Czuber, teremos que:
⎛ 6 ⎞ ⎟⋅5 ⎝ 6 + 11 ⎠
Daí: Mo = 34,5 + ⎜
Æ
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠ E: Mo=36,26 Æ Resposta da Questão!
Já que estamos aqui, vamos adiante e determinemos a Moda de King!
ESTATÍSTICA-Ponto dos Concursos
Ponto 14 - EXERCÍCIOS DE MODA
Página 12 de 13
iv) Elementos da Fórmula de King: fpost e fant
19,5 24,5 29,5 34,5 39,5 44,5 49,5
Xi – – – – – – –
fi 2 9 23 29 18 12 7
24,5 29,5 34,5 39,5 44,5 49,5 54,5
Æ Classe anterior Æ fant=23 Æ Classe Modal! Æ Classe posterior Æ fpost=18
v) Cálculo da Moda de King
Segundo King, teremos que:
⎛ 18 ⎞ ⎟⋅5 ⎝ 18 + 23 ⎠
Daí: Mo = 34,5 + ⎜
⎛ ⎞ fpost ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ fpost + fant ⎠ Æ
E: Mo=36,69 Æ Resposta!
Observemos que esta última resposta, achada pelo método de King, já se aproxima mais da opção “c”, enquanto sabemos que a resposta correta da questão, a Moda de Czuber, é a letra “b”, ou seja: Mo=36,26.
Antes de encerrarmos esta aula, gostaria de dar mais uma pequena dica de concurseiro tarimbado. Vejamos o conjunto abaixo:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 3 5 8 4 2
Suponhamos que o enunciado esteja pedindo o valor da Moda e que as opções de resposta sejam as seguintes: a) 24,28
b)17,35
c)33,72
d)19,74
e)31,16
Suponhamos ainda que está praticamente esgotado o tempo que dispomos para entregar a prova e o examinador já está ali, no nosso pé, olhando feio para nós, de forma que não dá mais para fazermos conta nenhuma! Neste caso, faremos só o seguinte: -
Primeiro, descobriremos quem é a classe modal. Ora, para isso, basta verificar quem é a maior fi. Logo, como a maior fi é 8, a classe correspondente será a classe modal. Daí, nossa classe modal será a terceira: (20!---30).
ESTATÍSTICA-Ponto dos Concursos
-
Ponto 14 - EXERCÍCIOS DE MODA
Página 13 de 13
Ora, se a classe modal vai de 20 a 30, isso quer dizer, necessariamente, que a nossa Moda estará incluída neste intervalo. Ou seja, neste caso, a Moda jamais poderá ter um valor inferior a 20 nem superior a 30.
E aí? Quem me diz qual será a resposta desta questão? Obviamente será a opção “a”, que foi a única que está incluída no intervalo da classe modal! E aqui, sem dica de ouro nem nada, conseguimos matar a questão também sem fazer contas! Mas não nos empolguemos muito, porque isso não é comum de acontecer! Na melhor das hipóteses, teremos duas opções, possíveis de ser a Moda, incluídas no intervalo da classe modal. Pelo sim e pelo não, não custa nada dar uma olhadinha nas respostas da Moda antes de começar as contas...!
É isso! Por hoje terminamos! Próxima aula, daremos início ao estudo da Mediana, que costuma ser uma questão quase certa nas provas da ESAF! Importantíssimas, portanto, as próximas aulas! Um grande abraço a todos e até lá!
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 1 de 17
MEDIANA – PARTE 01 Olá! Como estão todos? E sobre as questões de Moda, conseguimos fazê-las todas? Sem problemas? Ótimo! Hoje, iniciaremos o estudo da Mediana, a terceira e última Medida de Posição! Quando encerrarmos este estudo, passaremos a um tópico importantíssimo, que vem a ser exatamente a relação entre Média, Moda, Mediana e o comportamento do conjunto quanto ao aspecto da simetria! # Observação Preliminar: Desde que iniciamos o estudo da Média e da Moda, estamos sempre as chamando de Medidas de Posição! E de fato, o são; da mesma forma que a Mediana! Ocorre que as Medidas de Posição não se restringem a estas três, cujo estudo estamos prestes a encerrar. Na verdade, a Média, a Moda e a Mediana fazem parte de um grupo de Medidas de Posição, o qual chamamos de Medidas de Tendência Central! Há, porém, um outro grupo de Medidas de Posição, ditas Medidas Separatrizes, as quais estudaremos de forma pormenorizada em um outro momento do curso. São as seguintes as medidas separatrizes: a Mediana, o Quartil, o Decil e o Centil (ou Percentil). Em suma, teremos o seguinte:
Medidas de Tendência Central
Média Moda Mediana
Medidas de Posição
Medidas Separatrizes
Mediana Quartil Decil Centil (ou Percentil)
Observamos, quase que imediatamente, a seguinte curiosidade: a Mediana figura, a um tempo, tanto como Medida de Tendência Central, quanto como Medida Separatriz. E isso por uma razão muito simples: como o próprio nome sugere, Medida Separatriz é aquela que “separa”, ou por outra, divide os elementos do conjunto em um número de partes iguais. À exceção da Mediana, falaremos hoje apenas superficialmente das Separatrizes. Apenas o suficiente para sabermos identificar outros sinônimos da Mediana!
# A Mediana e as Medidas Separatrizes Para termos uma primeira visão do que seja a Mediana de um conjunto, apresentaremos um conceito escrito e um conceito visual (para melhor assimilação). A Mediana – Md – será exatamente aquele elemento que separará o conjunto em duas partes iguais, ou seja, em duas metades. Por isso, será também considerado uma Medida Separatriz!
Página 1 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 2 de 17
Consideremos o conjunto abaixo: {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13} Ora, identificar a Mediana deste conjunto significa encontrar aquele elemento que está exatamente no centro (no meio do conjunto), dividindo-o em duas partes iguais, ou seja em duas metades! Neste caso, teremos o seguinte: {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13} Observemos que, tomando o elemento “7” como referência, restarão seis elementos à sua esquerda, bem como seis elementos à sua direita! Daí, concluímos que o elemento 7 está no meio do conjunto, dividindo-o em duas metades. Portanto, a Mediana deste conjunto é 7: Md=7. Ainda não estamos ensinando como calcular preparando o terreno..., portanto, muita calma!
a
Mediana.
Estamos
apenas
---x-x-x-x-x-x-x--Agora, imaginemos que o nosso conjunto é representado por uma reta, como se segue: !---------------------------------------! Percebamos que esta reta representa todo o conjunto! Se quisermos marcar a Mediana nesta reta, obviamente que ela estará precisamente no meio da reta, dividindo-a em duas partes iguais. Então, visualmente, teremos: !-------------------!-------------------! Md Até aqui, tudo bem? Então, aproveitando o ensejo, vamos definir, também visualmente, as outras Medidas Separatrizes! O Quartil, por sua vez, é aquela Medida que “separa”, ou seja, divide o conjunto em quatro partes iguais! Ora, é claro que para dividir uma reta em quatro partes, precisamos marcar três pontos, certo? Claro! Então, haverá sempre três Quartis em um conjunto, os quais designaremos por Q1 (primeiro quartil), Q2 (segundo quartil) e Q3 (terceiro quartil). Visualmente, teremos:
!---------!---------!---------!---------! Q1 Q2 Q3 Já o Decil é responsável por dividir o conjunto em dez partes iguais! Concluímos que haverá, em um conjunto, nove Decis! Visualmente:
!---!---!---!---!---!---!---!---!---!---! D1 D2 D3 D4 D5 D6 D7 D8 D9 Em se tratando do Centil (ou Percentil), é a Medida Separatriz que
Página 2 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 3 de 17
dividirá o conjunto em cem partes iguais! Teremos, assim, noventa e nove Centis! Infelizmente, torna-se inviável desenhar o conjunto com as suas cem divisões! Mas, basta imaginar a reta acima (a reta do Decil), e “enxergar” que, entre dois Decis consecutivos existem dez Centis! Dessa forma, quando chegarmos ao primeiro Decil, teremos andado dez Centis; quando chegarmos ao segundo Decil, estaremos no vigésimo Centil, e assim por diante. Vejamos:
!---!---!---!---!---!---!---!---!---!---! C10 C20 C30 C40 C50 C60 C70 C80 C90
Agora, chegamos ao ponto! Vamos observar a relação que há entre estas quatro Medidas Separatrizes, apenas pelos conceitos visuais:
!-------------------!-------------------! Md !---------!---------!---------!---------! Q1 Q2 Q3 !---!---!---!---!---!---!---!---!---!---! D1 D2 D3 D4 D5 D6 D7 D8 D9 !---!---!---!---!---!---!---!---!---!---! C10 C20 C30 C40 C50 C60 C70 C80 C90
Pronto!! Matamos a charada!! Apenas observando os conceitos visuais das Medidas Separatrizes, estamos aptos a concluir que: Md = Q2 = D5 = C50 Ou seja, se a questão da prova nos fornecer um conjunto e solicitar que calculemos o segundo quartil, ou o quinto decil ou o qüinquagésimo percentil, então, na verdade, o que a questão está pedindo é apenas a Mediana do conjunto! Isso aconteceu bem recentemente, numa das provas do AFRF de 2002, em que a questão pedia a determinação do quinto decil! E teve muita gente que sabia calcular a Mediana, mas ficou apenas olhando a questão e não a resolveu, por não conhecer estes outros “sinônimos”... É quase a mesma coisa da criança que não sabe resolver o problema com maçãs e diz: “se fosse com laranjas, eu saberia...”
# Determinação da Mediana – 1a PARTE Æ Mediana para o Rol: O cálculo da Mediana para um rol é algo realmente muito fácil. Veremos a maneira formal de encontrá-la, e depois a maneira concurseira! Procurar pela Mediana de um rol é, na verdade, tentar identificar a Posição Central do conjunto! Ou seja, identificar o elemento que ocupa aquela posição intermediária, a qual divide o conjunto em duas partes. Analisemos o conjunto abaixo: {2, 5, 6, 11, 15}
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 4 de 17 Página 3 de 17
Vemos que existem cinco elementos, o que nos leva a concluir que existem cinco posições! Cada elemento ocupa uma posição. A Posição Central deste conjunto será exatamente a terceira posição, ocupada pelo elemento 6. Tomando a terceira posição como referência, teremos duas posições à sua esquerda e duas à sua direita. Observemos que, por enquanto, não estamos falando em Mediana. Estamos apenas falando em Posição Central do conjunto! Agora, consideremos o seguinte conjunto: {0, 1, 4, 5, 7, 12, 15, 18} A pergunta é: qual será a Posição Central deste conjunto? Ora, é fácil concluirmos que, para este exemplo, teremos duas posições centrais (e não apenas uma!). E serão elas a quarta e a quinta posições, ocupadas respectivamente pelos elementos 5 e 7. Tomando estas duas posições centrais como referência, restarão três posições à sua esquerda e três à sua direita. Do exposto, extraímos nossas primeiras conclusões: - Se o rol apresenta um número ímpar de elementos (primeiro exemplo), teremos apenas uma Posição Central. - Se o rol apresenta um número par de elementos (segundo exemplo), teremos duas Posições Centrais. Destarte, nossa primeira preocupação para encontrar a Posição Central (ou Posições Centrais) do conjunto será identificar se o número de elementos do rol é par ou é ímpar! Nos exemplos usados acima, não houve grande dificuldade em identificar qual seria a Posição Central (ou Posições Centrais) do conjunto. Todavia, se a questão fornecer um rol com dezenas e dezenas de elementos, a coisa pode complicar um pouco. Daí, aprenderemos como padronizar nosso procedimento! ---x-x-x-x-x-x-x--Æ Mediana para o Rol com n ímpar: Vejamos o conjunto abaixo: {1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} O primeiro passo para identificar a Posição Central é saber se o número de elementos do rol (o nosso n) é par ou ímpar. Daí, contamos e constatamos que n=21 Æ n é ÍMPAR! Se n é impar, isso significa que teremos apenas uma Posição Central, a qual será identificada por meio da seguinte conta: Posição Central =
(n + 1) 2
Como n=21, faremos:
Página 4 de 17
ESTATÍSTICA – Ponto dos Concursos
Posição Central =
*** Ponto 15-MEDIANA PARTE 01 ***
(21 + 1) = 11 2
Página 5 de 17
Æ Posição Central = 11ª posição!
Identificada a Posição Central, restará apenas sairmos contando com o dedo, a partir da primeira posição do rol, até chegarmos na 11ª posição! Acharemos o seguinte: {1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} Conclusão: o elemento que ocupa a Posição Central é o elemento 9, que será a própria Mediana! Logo, Md=9. Ou seja: quando o rol apresentar um número ímpar de elementos (n ímpar), aquele elemento que ocupar a Posição Central será a própria Mediana! Atentemos para o seguinte fato: a conta que fizemos acima nos servirá apenas para identificar a Posição Central do conjunto. Ou seja, feita esta conta, temos que sair em busca do elemento que ocupa aquela posição! Observemos que a Mediana não é a Posição Central, e sim o elemento que a ocupa! ---x-x-x-x-x-x-x--Æ Mediana para o Rol com n Par: Vejamos o conjunto abaixo: {1, 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18}
Novamente, nossa primeira preocupação será saber se n é par ou ímpar. Contamos e concluímos que: n=22. Portanto, n é par! Se n é par, já sabemos que teremos duas Posições Centrais. A primeira delas será determinada pela seguinte conta: 1ª Posição Central =
n 2
E a segunda Posição Central será a vizinha, posterior à primeira! Ou seja: 2ª Posição Central = a que sucede a primeira!
Para nosso exemplo acima, teremos o seguinte: 1ª Posição Central =
n 22 = = 11 Æ 1ª Posição Central = 11ª posição! 2 2
2ª Posição Central = a posterior! Æ 2ª Posição Central = 12ª posição! Daí, só nos resta procurar com o dedo, partindo da primeira posição do rol, quais os elementos que ocupam a 11ª e a 12ª posições. Teremos: {1, 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18}
Página 5 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 6 de 17
Uma vez identificados os elementos que ocupam as Posições Centrais, calcularemos a Média destes dois elementos, para determinarmos enfim a Mediana do rol. Vejamos: {1, 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ Md=(8+9)/2 Æ Md=8,5
Ou seja, somaremos os dois elementos que ocupam as Posições Centrais, e dividiremos o resultado desta soma por 2. O resultado será a Mediana. Pronto! Só isso! Observemos que o valor da Mediana encontrado acima não é nenhum dos elementos do conjunto! De fato, naquele rol não consta nenhum elemento com esse valor (8,5). Não importa! Concluímos que a Mediana de um conjunto não tem, necessariamente, que ser um dos seus elementos! ---x-x-x-x-x-x-x--Para tentar simplificar, faremos um resumo dos passos: Æ Resumo dos Passos: Cálculo da Mediana para o Rol com n ímpar 1º) Determinamos o n, que é o número de elementos do rol! Constatamos que n é ímpar! 2º) Determinamos a Posição Central, fazendo: Posição Central =
(n + 1) 2
3º) Encontramos (contando com o dedo) o elemento do rol que ocupa aquela Posição Central. 4º) Conclusão: a Mediana será o próprio elemento encontrado no passo anterior!
---x-x-x-x-x-x-x--Æ Resumo dos Passos: Cálculo da Mediana para o Rol com n par 1º) Determinamos o n, que é o número de elementos do rol! Constatamos que n é par! 2º) Determinamos as duas Posições Centrais, fazendo: 1ª Posição Central =
n 2
2ª Posição Central = a que sucede a primeira! 3º) Encontramos (contando com o dedo) os elementos que ocupam as duas Posições Centrais.
Página 6 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 7 de 17
4º) A Mediana será a Média dos dois elementos encontrados no passo anterior. Ou seja, somaremos os elementos que ocupam as Posições Centrais, e dividiremos este resultado por 2. A resposta é a Mediana! ---x-x-x-x-x-x-x--# Cálculo Concurseiro da Mediana para o Rol: Na hora da prova, sobretudo se for fornecido um rol não muito extenso, poderemos usar um meio bastante simples de determinar as Posições Centrais do rol. Vejamos o exemplo seguinte: {1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} Teremos, para esta prática, que usar as duas mãos! O dedo da mão esquerda ficará sobre o primeiro elemento do rol, enquanto que o da mão direita ficará sobre o último elemento. Da forma seguinte: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ (A setinha embaixo do elemento é o nosso dedo!). Feito isso, o procedimento agora será aproximar ambos os dedos em direção ao centro do conjunto, saltando sempre de um em um elemento. Ou seja, simultaneamente, saltaremos cada dedo uma posição, na direção do centro. Teremos: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ Continuando o procedimento, teremos: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ Percebamos que nossos dedos centro! Prosseguindo, teremos:
estão,
no
mesmo
passo,
aproximando-se
do
{ 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ E agora: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ E depois: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ E mais: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑........................↑ Página 7 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 8 de 17
Calma, falta pouco: {1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ Estamos quase chegando: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ Só mais um pouquinho: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ ↑ Atenção agora! Quando dermos o último salto (que é o próximo), veremos que nossos dedos se encontrarão em um único elemento. Vejamos: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ Quando isso acontecer, concluímos que este rol apresenta apenas uma única Posição Central, e que este elemento encontrado na junção dos dedos será a nossa própria Mediana! Ou seja: { 1, 1, 1, 3, 4, 5, 5, 7, 7, 8, 9, 9, 9, 9, 11, 13, 13, 15, 17, 18, 18} ↑ Md=9 Só isso! ---x-x-x-x-x-x-x--Vejamos o próximo exemplo. Consideremos o conjunto abaixo: {0, 1, 4, 5, 15, 18, 20, 22} O procedimento será exatamente o mesmo. Partiremos com um dedo de cada mão em um dos extremos do rol, aproximando-se, de uma em uma posição, em direção ao centro do conjunto. Teremos, portanto: { 0, 1, 4, 5, 15, 18, 20, 22} ↑ ↑ (Novamente, a seta embaixo do elemento será o nosso dedo!). Em seguida, teremos: { 0, 1, 4, 5, 15, 18, 20, 22} ↑ ↑ E depois, teremos: { 0, 1, 4, 5, 15, 18, 20, 22} ↑ ↑
Página 8 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 9 de 17
Atenção aqui! No próximo salto que fizermos (que será o último), veremos que nossos dedos não se encontrarão em um mesmo elemento, porém em elementos vizinhos! Vejamos: { 0, 1, 4, 5, 15, 18, 20, 22} ↑ ↑ Quando isso acontecer, concluiremos que neste rol existem duas Posições Centrais. Logo, para determinarmos a Mediana, teremos que calcular a Média destes dois elementos em cujas posições nossos dedos se avizinharam! Ou seja: { 0, 1, 4, 5, 15, 18, 20, 22} ↑ ↑ Md=(5+15)/2 Æ Md=10
E aí? Mais fácil que isso, só dois disso! Concordam? Em frente! # determinação da Mediana – 2ª PARTE Æ Mediana para Dados Tabulados: # Determinação da Mediana – 2a PARTE Æ Mediana para Dados Tabulados: Quando os dados do conjunto vierem apresentados sob a forma de Dados Tabulados, encontraremos a Mediana seguindo os passos que explicaremos a seguir. Consideremos o exemplo abaixo: Xi 2 4 6 8 10 12
fi 5 10 15 11 5 3 n=49
O primeiro passo será descobrir o n (número de elementos do conjunto). Para isso, conforme já estudamos, basta somar a coluna da fi. Precisamos saber se o n será par ou ímpar! Caso o n seja ímpar, o conjunto terá apenas uma Posição Central. Caso seja par, teremos duas Posições Centrais! Por enquanto, tudo igual ao que aprendemos para o rol. Identificado se n é par ou ímpar, determinaremos – exatamente como o fizemos para o rol – quais são as Posições Centrais do nosso conjunto. Neste nosso exemplo, temos n=49. Logo, sabemos que nossa única Posição Central será determinada pela conta: Posição Central =
(n + 1) 2
Então, calculamos: Página 9 de 17
ESTATÍSTICA – Ponto dos Concursos
Posição Central =
*** Ponto 15-MEDIANA PARTE 01 ***
(n + 1) = (49 + 1) = 50 = 25 2
2
2
Página 10 de 17
Æ Posição Central = 25ª Posição!
Até aqui foi tudo idêntico ao trabalho para o rol! Agora vem a particularidade dos Dados Tabulados! Nesse momento, teremos que comparar esta Posição Central que acabamos de identificar com os valores de uma determinada coluna de freqüências, que ainda nem construímos: a coluna da freqüência absoluta acumulada crescente, a fac! É este, portanto, nosso próximo passo: construir a fac! Teremos: Xi fi fac ↓ 5 5 2 15 10 4 30 15 6 41 11 8 46 5 10 49 3 12 n=49 Agora vem o mais importante: de que forma vamos comparar o valor encontrado da Posição Central com os valores da coluna da fac? Da seguinte maneira: partimos para a fac, tendo em mente o valor da Posição Central (neste caso, com o valor 25, que significa 25ª posição!). Daí, iniciando com a primeira fac (a mais de cima), para cada valor desta coluna faremos a seguinte pergunta: “O valor desta fac é maior ou igual ao valor da Posição Central?” E repetiremos afirmativa.
esta
pergunta
até
o
momento
em
que
a
resposta
for
Para entendermos melhor, vejamos nosso exemplo. Encontramos acima que a Posição Central é a 25ª. Então, coloquemos na cabeça esse valor: 25 (que será nosso valor de referência!). Daí, começaremos a perguntar: Xi fi fac ↓ 5 5 2 Æ 5 é maior ou igual a 25? NÃO! 15 10 4 30 15 6 41 11 8 46 5 10 49 3 12 Se a resposta for “NÃO”, desceremos um andar e repetiremos a pergunta, usando agora a fac seguinte: Xi 2 4 6 8 10 12
fi 5 10 15 11 5 3
fac ↓ 5 15 30 41 46 49
Æ 15 é maior ou igual a 25? NÃO!
Página 10 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 11 de 17
A resposta é “NÃO”. Daí, prosseguimos para a próxima fac: Xi 2 4 6 8 10 12
fi 5 10 15 11 5 3
fac ↓ 5 15 30 41 46 49
Æ 30 é maior ou igual a 25? SIM!
Aqui a resposta é “SIM”. Então, paramos! E olhamos qual é o elemento Xi correspondente a esta fac em que estamos estacionados: Xi 2 4 6 8 10 12
Fi 5 10 15 11 5 3
fac ↓ 5 15 30 41 46 49
Será justamente o elemento Xi=6, que ocupa a nossa Posição Central, e que será, portanto, a nossa Mediana! Logo: Md=6. ---x-x-x-x-x-x-x--Vamos a mais um exemplo! Consideremos o conjunto abaixo e determinemos o valor da Mediana: Xi 1 2 3 4 5
fi 2 3 6 4 2
O primeiro passo é determinar o n (número de elementos do conjunto) para sabermos se é par ou ímpar! Para isso, somamos a coluna da fi! Teremos: Xi 1 2 3 4 5
fi 2 3 6 4 2 n=17
Achamos n=17, portanto, ímpar! Daí, sabemos que vamos ter apenas uma Posição Central no conjunto, identificada pela seguinte conta: Posição Central =
(n + 1) 2
Calculamos:
Página 11 de 17
ESTATÍSTICA – Ponto dos Concursos
Posição Central =
*** Ponto 15-MEDIANA PARTE 01 ***
(n + 1) = (17 + 1) = 18 = 9 2
2
2
Página 12 de 17
Æ Posição Central = 9ª Posição!
O próximo passo será a construção da fac. Teremos, então: fi fac ↓ 2 2 5 3 11 6 15 4 17 2 n=17 Finalmente, passamos à fase das perguntas! Lembremos que agora o valor de referência é 9 (que significa 9ª posição!). Teremos: Xi fi fac ↓ 1 2 2 Æ 2 é maior ou igual a 9? NÃO! 2 3 5 3 6 11 4 4 15 5 2 17 n=17 Xi 1 2 3 4 5
Se a resposta é negativa, prosseguimos para a fac seguinte: Xi 1 2 3 4 5
fi 2 3 6 4 2 n=17
fac ↓ 2 5 11 15 17
Æ 5 é maior ou igual a 9? NÃO!
Já sabemos que, enquanto a resposta for “NÃO”, apenas passaremos à fac que se segue: Xi 1 2 3 4 5
fi 2 3 6 4 2 n=17
fac ↓ 2 5 11 15 17
Æ 11 é maior ou igual a 9? SIM!
Como a resposta agora foi “SIM”, nós imediatamente paramos e procuramos, na coluna do Xi, qual o elemento correspondente àquela fac em que nos encontramos! E o elemento correspondente é Xi=3, que ocupa nossa Posição Central e será, portanto, a nossa própria Mediana! Logo: Md=3. ---x-x-x-x-x-x-x---
Página 12 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 13 de 17
Acabamos de fazer dois exemplos para cálculo da Mediana de Dados Tabulados, quando o número de elementos do conjunto é ímpar! Passemos aos exemplos nos quais o nosso n será um valor par! Considerando o conjunto abaixo, determinemos o valor da Mediana: Xi fi 2 5 4 10 6 15 8 11 10 6 12 3 n=50 O primeiro passo consiste apenas em determinar o número de elementos do conjunto, o n. Isso o fazemos somando a coluna do fi. Neste caso, encontramos n=50, donde concluímos que haverá duas Posições Centrais neste conjunto! Na seqüência, determinaremos – por meio daquela mesma fórmula que aprendemos para o rol – quais estas duas Posições Centrais: 1ª Posição Central =
n 2
Calculamos: 1ª Posição Central =
n 50 = = 25 2 2
Æ 1ª Posição Central = 25ª Posição!
2ª Posição Central = a que sucede a primeira! Æ 2ª Posição Central = 26a Posição!
Logo, teremos:
Como próximo passo, construiremos a coluna da fac! Teremos: Xi fi fac↓ 5 5 2 15 10 4 30 15 6 41 11 8 47 6 10 50 3 12 n=50 Finalmente, passaremos à fase das perguntas! Trabalharemos inicialmente com a primeira Posição Central, que é a 25a posição. Destarte, nosso valor de referência é o 25. Faremos: Xi 2 4 6 8 10 12
fi 5 10 15 11 6 3 n=50
Fac↓ 5 15 30 41 47 50
Æ 5 é maior ou igual a 25? NÃO!
Página 13 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 14 de 17
Enquanto nossa resposta for “NÃO”, nós prosseguimos, passando à próxima fac. Daí: Xi 2 4 6 8 10 12
fi 5 10 15 11 6 3 n=50
fac↓ 5 15 30 41 47 50
Æ 15 é maior ou igual a 25? NÃO!
Novamente, com a resposta negativa, avançamos para a fac seguinte: Xi 2 4 6 8 10 12
fi 5 10 15 11 6 3 n=50
fac↓ 5 15 30 41 47 50
Æ 30 é maior ou igual a 25? SIM!
Como a resposta agora foi afirmativa, paramos e buscamos o Xi correspondente! Neste caso, encontramos como Xi da primeira Posição Central o valor Xi=6. Este valor ficará guardado para o final da questão!
Agora, repetimos este último passo (o das perguntas), só que usando a segunda Posição Central do conjunto, a qual, conforme constatamos acima, será a 26a Posição! Logo, nosso valor de referência será aqui o 26. Teremos: Xi 2 4 6 8 10 12
fi 5 10 15 11 6 3 n=50
fac↓ 5 15 30 41 47 50
Æ 5 é maior ou igual a 26? NÃO!
Como a resposta é negativa, passamos à próxima fac: Xi 2 4 6 8 10 12
fi 5 10 15 11 6 3 n=50
fac↓ 5 15 30 41 47 50
Æ 15 é maior ou igual a 26? NÃO!
Página 14 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 15 de 17
Ainda resposta negativa! Adiante: Xi 2 4 6 8 10 12
fi 5 10 15 11 6 3 n=50
fac↓ 5 15 30 41 47 50
Æ 30 é maior ou igual a 26? SIM!
Pronto! Chegamos à resposta afirmativa. Neste momento, então, paramos e verificamos quem é o Xi correspondente! E é exatamente o Xi=6. Descobertos os dois elementos que ocupam as Posições Centrais, teremos que calcular a sua Média, para chegarmos à Mediana do conjunto! Vejamos: Æ Na 1a Posição Central, temos o elemento: Xi=6 Æ Na 2a Posição Central, temos o elemento: Xi=6 Daí: Md=(6+6)/2 Æ
E:
Md=6
---x-x-x-x-x-x-x---
Vamos a mais um exemplo! Consideremos o seguinte conjunto e calculemos o valor da Mediana: Xi 2 4 6 8
fi 5 10 8 7 n=30
Primeiro passo: determinar o número de elementos do conjunto, o nosso n. Somando a coluna do fi, chegamos a n=30. Ora, como o n é par, imediatamente sabemos que haverá duas Posições Centrais, as quais passaremos a determinar: 1ª Posição Central =
n 2
Calculamos: 1ª Posição Central =
n 30 = = 15 2 2
Æ 1ª Posição Central = 15ª Posição!
2ª Posição Central = a que sucede a primeira! Logo, teremos:
Æ 2ª Posição Central = 16a Posição!
Página 15 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 16 de 17
Como próximo passo, construiremos a coluna da fac! Teremos: Xi 2 4 6 8
fi 5 10 8 7 n=30
fac↓ 5 15 23 30
Trabalharemos as perguntas iniciando com a primeira Posição Central, que é a 15a. Portanto, nosso valor de referência para as perguntas será o 15. Xi 2 4 6 8
fi 5 10 8 7 n=30
fac↓ 5 15 23 30
Æ 5 é maior ou igual a 15? NÃO!
Resposta negativa implica passarmos à próxima fac. Teremos: Xi 2 4 6 8
fi fac↓ 5 5 15 10 Æ 15 é maior ou igual a 15? SIM! 23 8 30 7 n=30 Chegamos, enfim, à resposta afirmativa! Então, paramos e constatamos qual é o elemento correspondente! Encontramos, pois, Xi=4. Este valor ficará guardado para o final da questão. Passamos agora a trabalhar com a segunda Posição Central do conjunto, que é a 16a posição! Daí, nosso novo valor de referência para as perguntas será o 16. Daí, teremos: Xi 2 4 6 8
fi 5 10 8 7 n=30
fac↓ 5 15 23 30
Æ 5 é maior ou igual a 16? NÃO!
A resposta é negativa, daí passamos à fac seguinte: Xi 2 4 6 8
fi 5 10 8 7 n=30
fac↓ 5 15 23 30
Æ 15 é maior ou igual a 16? NÃO!
Página 16 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 15-MEDIANA PARTE 01 ***
Página 17 de 17
Novamente a resposta é negativa. Daí, prosseguimos: Xi 2 4 6 8
fi 5 10 8 7 n=30
fac↓ 5 15 23 30
Æ 23 é maior ou igual a 16? SIM!
Aqui, paramos, uma vez que a resposta foi afirmativa! Daí, procuramos o Xi correspondente e encontramos o valor: Xi=6. Encontramos, portanto, os dois Posições Centrais! Determinamos que:
elementos
do
conjunto
que
ocupam
as
Æ Na 1a Posição Central, temos o elemento: Xi=4 Æ Na 2a Posição Central, temos o elemento: Xi=6 Daí: Md=(4+6)/2 Æ
E:
Md=5
---x-x-x-x-x-x-x--Talvez muitos de vocês estejam se perguntando a razão de trabalharmos com a fac – freqüência acumulada crescente, na determinação da Mediana dos Dados Tabulados. Então, eu peço licença para adiar essa explicação para um outro momento, quando tivermos mais condição de respirar. Ok?
Por hoje é tudo! Próxima aula, continuaremos com o estudo da Mediana. Na verdade, a parte principal está por vir, que é o cálculo da Mediana para a Distribuição de Freqüências. Faremos três aulas de Mediana, sendo essa a primeira. A de amanhã será com a Distribuição de Freqüências e os exercícios, e a terceira, finalmente, com as resoluções dos exercícios. É importante, sobretudo quem está se preparando para o AFRF, que não se deixe acumular matéria. Um grande abraço a todos e até breve!
Página 17 de 17
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 1 de 15
MEDIANA – PARTE 02 Olá amigos! Dando continuidade ao estudo da Mediana, passamos hoje à análise desta medida no caso de os dados do conjunto vierem apresentados sob a forma de uma Distribuição de Freqüências. Posso assegurar que se trata do tópico mais importante de todos, tendo em vista que a Distribuição de Freqüências é a forma de apresentação dos dados mais comuns nas provas de Estatística, seja da ESAF ou de qualquer outra elaboradora! Vamos em frente!
# Determinação da Mediana – 3a PARTE Æ Mediana para Distribuição de Freqüências: Vimos que, quando íamos procurar a Mediana no rol e nos dados tabulados, tínhamos sempre a preocupação de saber se o n (número de elementos do conjunto) era par ou ímpar! Essa preocupação deixa de existir no cálculo da Mediana para a distribuição de freqüências. Aqui, teremos simplesmente que aplicar a fórmula da Mediana, cujos elementos serão extraídos de uma determinada classe da distribuição: a chamada Classe Mediana. Daí, basicamente o que precisamos fazer para determinar a Mediana de uma distribuição será: 1o) Descobrir quem é a Classe Mediana; e 2o) Aplicar a fórmula da Mediana para distribuição de freqüências!
# Determinação da Classe Mediana: Nosso primeiro passo na busca da Classe Mediana será apenas determinar o valor do n, ou seja, do número de elementos do conjunto. Isto o faremos somando a coluna da fi! Feito isso, independentemente de encontrarmos um n par ou ímpar, faremos a seguinte conta:
n 2 Repetindo: não interessa, no caso da Distribuição de Freqüências, se o n é par ou ímpar. Em qualquer caso, faremos apenas a divisão acima. Na seqüência, teremos que comparar o valor de (n/2) que acabamos de calcular, com os valores da coluna da freqüência absoluta acumulada crescente, a fac! Logo, nosso próximo passo será a construção da fac! Finalmente, a comparação do valor (n/2) com os valores da fac será feita da mesma forma que aprendemos para os Dados Tabulados. Ou seja, por meio daquela velha pergunta, que aqui adaptamos:
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 2 de 15
“O valor desta fac é maior ou igual ao valor de (n/2)?” E esta pergunta será repetida, até o momento em que a resposta for afirmativa. Ou seja, quando a resposta for “SIM”, pararemos, procuraremos a classe correspondente, e diremos que esta será a Classe Mediana. Para entendermos melhor, vejamos o exemplo abaixo. Encontremos a Classe Mediana do seguinte conjunto:
10 20 30 40 50
Xi !--!--!--!--!---
20 30 40 50 60
fi 3 5 7 4 1 n=20
O primeiro passo é determinar o n. Nesse caso, nosso n=20. Agora não importa mais se n é par ou ímpar! Faremos a seguinte conta:
n 2 E
teremos
que:
n 2
=
10
Æ
Este
será
nosso
compararmos com os valores da coluna da crescente, que vamos construir agora: Xi fi 3 10 !--- 20 5 20 !--- 30 7 30 !--- 40 4 40 !--- 50 1 50 !--- 60 n=20
valor
freqüência
de
referência,
absoluta
para
acumulada
fac↓ 3 8 15 19 20
O passo seguinte será o das perguntas! Da mesma forma como fizemos nos Dados Tabulados, iremos agora comparar os valores da fac com o valor de referência (n/2), que nesse caso será 10. Faremos: Xi fi fac↓ 3 3 10 !--- 20 Æ 3 é maior ou igual a 10? NÃO! 5 8 20 !--- 30 7 15 30 !--- 40 4 19 40 !--- 50 1 20 50 !--- 60 n=20 Enquanto a Xi 10 !--20 !--30 !--40 !--50 !---
resposta for negativa, avançamos para a próxima fac! Teremos: fi fac↓ 3 3 20 8 5 30 Æ 8 é maior ou igual a 10? NÃO! 7 15 40 4 19 50 1 20 60 n=20
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 3 de 15
Se a resposta ainda é “NÃO”, prosseguimos:
10 20 30 40 50
Xi !--!--!--!--!---
20 30 40 50 60
fi 3 5 7 4 1 n=20
fac↓ 3 8 15 19 20
Æ 15 é maior ou igual a 10? SIM!
Aqui paramos, pois nossa resposta foi afirmativa! E nesse momento, procuramos qual a classe correspondente a esta fac em que nos encontramos! Neste nosso caso, foi a terceira classe (30 !--- 40), que será a nossa Classe Mediana! ---x-x-x-x-x-x-x--Outro exemplo: Determine a Classe Mediana do conjunto abaixo.
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 8 12 7 4 2 n=33
1o Passo) Determinar o n. Neste caso, temos n=33. 2o Passo) Calcular (n/2). Teremos: (n/2)=16,5 3º Passo) Construir a coluna da fac! Teremos: Xi fi fac↓ 0!---15 8 8 15!---30 12 20 30!---45 7 27 45!---60 4 31 60!---75 2 33 N=33 4o Passo) Comparar os valores da fac com o valor de referência (n/2). Teremos:
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 8 12 7 4 2 n=33
Fac↓ 8 20 27 31 33
Æ 8 é maior ou igual a 16,5? NÃO!
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 4 de 15
Em caso de resposta negativa (como ocorreu), passamos à fac seguinte:
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 8 12 7 4 2 n=33
fac↓ 8 20 27 31 33
Æ 20 é maior ou igual a 16,5? SIM!
Como a resposta é afirmativa, paramos e verificamos qual é a classe correspondente! Neste caso, foi a segunda classe (15 !--- 30), que será justamente a nossa Classe Mediana! Observação: Alguém muito observador deve ter reparado que, nos dois exemplos acima, ocorreu de a Classe Mediana ser também a Classe Modal da Distribuição! (Estamos lembrados da Classe Modal? A que apresenta maior fi!). Daí poderia surgir a pergunta: A Classe Mediana e a Classe Modal de uma distribuição de freqüências serão sempre a mesma classe? E a resposta é NÃO! Podem até coincidir (como muitas vezes acontece), mas é perfeitamente possível que sejam classes distintas, uma vez que são determinadas por caminhos diferentes! Convém, portanto, não misturarmos as coisas! ---x-x-x-x-x-x-x--# Fórmula da Mediana: Uma vez descoberta qual a Classe Mediana da Distribuição de Freqüências, só nos resta aplicar a Fórmula da Mediana! E é a seguinte:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣ Onde:
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Æ linf é o limite inferior da Classe Mediana; Æ facANT é a fac da classe anterior à classe mediana; Æ fi é a freqüência absoluta simples da classe mediana;
Æ h é a amplitude da classe mediana. Observemos agora a nossa fórmula em sua “estrutura”, sem o “miolo” contido nos colchetes:
⎡ ⎤ Md = l inf + ⎢ ⎥ ⋅ h ⎣ ⎦ Esta “estrutura” da fórmula da Mediana nos faz lembrar de alguém? Claro! É a mesma “estrutura” das fórmulas da Moda (tanto de Czuber, quanto de King). Então, a rigor, só teremos que memorizar o “miolo” da fórmula! E de tanto a usarmos e a repetirmos, logo, logo estará memorizada!
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 5 de 15
Vamos aprender a localizar os valores da fórmula na Distribuição de Freqüências. Tomando os dois exemplos anteriores, nos quais encontramos a Classe Mediana, vamos aplicar nossa fórmula e determinar o valor da Mediana! Vamos lá: Exemplo 1) Encontramos acima que a Classe Mediana é a terceira classe.
10 20 30 40 50
Xi !--!--!--!--!---
20 30 40 50 60
fi 3 5 7 4 1 n=20
fac↓ 3 8 15 19 20
Æ Classe Mediana!
Daí, teremos que aplicar a fórmula:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Localizando o linf da Classe Mediana: linf=30
10 20 30 40 50
Xi !--!--!--!--!---
20 30 40 50 60
fi 3 5 7 4 1 n=20
fac↓ 3 8 15 19 20
Æ Classe Mediana!
Localizando a facANT (freqüência absoluta acumulada crescente da classe anterior à Classe Mediana): facANT = 8
10 20 30 40 50
Xi !--!--!--!--!---
20 30 40 50 60
fi 3 5 7 4 1 n=20
fac↓ 3 8 15 19 20
Æ Classe Anterior! Æ Classe Mediana!
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 6 de 15
Localizando a fi da Classe Mediana: fi=7
10 20 30 40 50
Xi !--!--!--!--!---
20 30 40 50 60
fi 3 5 7 4 1 n=20
fac↓ 3 8 15 19 20
Æ Classe Mediana!
Temos ainda que a amplitude da Classe Mediana é h=10 e que (n/2)=10, conforme já havíamos calculado anteriormente! Daí, jogando os dados encontrados na fórmula da Mediana, teremos:
⎡10 − 8 ⎤ Md = 30 + ⎢ ⋅ 10 ⎣ 7 ⎥⎦
Æ
E:
Md=32,8
Æ
Resposta!
---x-x-x-x-x-x-x--Exemplo 2) Havíamos encontrado que a Classe Mediana é a segunda classe.
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 8 12 7 4 2 n=33
fac↓ 8 20 27 31 33
Æ Classe Mediana!
Daí, aplicaremos a fórmula da Mediana:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Novamente, localizando o linf da Classe Mediana: linf=15
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 8 12 7 4 2 n=33
fac↓ 8 20 27 31 33
Æ Classe Mediana!
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 7 de 15
Localizando a facANT (freqüência absoluta acumulada crescente da classe anterior à Classe Mediana): facANT = 8
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 8 12 7 4 2 n=33
fac↓ 8 20 27 31 33
Æ Classe Anterior! Æ Classe Mediana!
Localizando a fi da Classe Mediana: fi=12
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 8 12 7 4 2 n=33
fac↓ 8 20 27 31 33
Æ Classe Mediana!
Sabemos ainda que a Amplitude da Classe Mediana é h=15 e que (n/2)= 16,5 (conforme já havíamos calculado). Daí, jogando todos os dados na fórmula, encontraremos:
⎡16,5 − 8 ⎤ ⋅ 15 Md = 15 + ⎢ ⎣ 12 ⎥⎦
Æ
E:
Md=25,6
---x-x-x-x-x-x-x--# Resumo dos Passos para Cálculo da Md de uma Distribuição: Estou certo que já ficou claro que, uma vez determinada a Classe Mediana, o que resta para o cálculo da Mediana é um mero “copiar-colar” dos dados da distribuição transpostos para a fórmula! Ou seja, o importante mesmo é memorizar a fórmula e coletar os dados do conjunto, com toda a atenção do mundo, para não se confundir! Com o treinamento e a prática, a coisa fica até sem graça! Façamos um resumo dos passos, desde o início, para se encontrar a Mediana de uma Distribuição de Freqüências: 1o Passo) Determinar a Classe Mediana, fazendo o seguinte: Æ Calcula-se o n (pelo somatório da coluna do fi); Æ Calcula-se (n/2), independentemente de n ser par ou ímpar. Este valor (n/2) será nosso “valor de referência”; Æ Constrói-se a coluna da fac;
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 8 de 15
Æ Compara-se os valores da fac (um a um, a começar da primeira classe) com o valor de referência (n/2), fazendo-se a pergunta: “esta fac é maior ou igual a (n/2)?” Æ Quando a resposta for afirmativa, correspondente, a qual será a nossa Classe Mediana!
procura-se
a
classe
2o Passo) Aplica-se a fórmula da Mediana, abaixo transcrita, fazendo um mero “copiar-colar” com os dados da distribuição:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
E isso é tudo! Vamos a mais um exemplo! Calculemos a Md do conjunto abaixo: Xi fi 2 10 !--- 20 7 20 !--- 30 11 30 !--- 40 20 40 !--- 50 11 50 !--- 60 7 60 !--- 70 2 70 !--- 80 n=60 1o Passo) Calculamos o n. Neste caso, temos que n=60. 2o Passo) Calculamos (n/2), que será: (n/2)=30 3o Passo) Construiremos a coluna da fac: Xi !--!--!--!--!--!--!---
fi fac↓ 2 2 10 20 9 7 20 30 20 11 30 40 40 20 40 50 51 11 50 60 58 7 60 70 60 2 70 80 n=60 4o Passo) Compararemos os valores da fac com nosso valor de referência (n/2), que neste caso é 30. Xi fi fac↓ 2 2 10 !--- 20 Æ 3 é maior ou igual a 30? NÃO! 9 7 20 !--- 30 Æ 9 é maior ou igual a 30? NÃO! 20 11 30 !--- 40 Æ 20 é maior ou igual a 30? NÃO! 40 !--- 50 40 20 Æ 40 é maior ou igual a 30? SIM! 51 11 50 !--- 60 58 7 60 !--- 70 60 2 70 !--- 80 n=60
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 9 de 15
Como a resposta foi afirmativa estávamos perguntando com a fac da quarta classe, então já descobrimos que exatamente esta (40 !---- 50) será a nossa Classe Mediana! 5ª Passo) “Copiar-colar” os dados da distribuição para a fórmula da Mediana, que se segue:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Teremos então, que: 10 20 30 40 50 60 70
Xi !--!--!--!--!--!--!---
20 30 40 50 60 70 80
Fazendo as contas, teremos:
Fi 2 7 11 20 11 7 2 n=60
fac↓ 2 9 20 40 51 58 60
Æ Classe Anterior! Æ Classe Mediana!
⎡ 30 − 20 ⎤ ⋅ 10 Md = 40 + ⎢ ⎣ 20 ⎥⎦
Æ E:
Md=45
E aí eu lhes digo: eu já sabia que a Mediana deste conjunto seria 45, mesmo antes de fazer qualquer conta!! De que maneira eu tinha esse conhecimento? Por acaso todos observaram que neste exemplo acima estamos trabalhando com uma distribuição de freqüências simétrica? É exatamente aqui que surge a primeira Dica de Ouro da Mediana! # 1a Dica de Ouro da Mediana: Quando a Distribuição de Freqüências for simétrica, teremos que a Mediana será igual à Média! Como já sabemos, nestes casos será igual à Moda. Ou seja, quando a distribuição for simétrica, teremos sempre que:
X = Mo = Md Dessa forma, as contas são dispensáveis! Só teremos que nos lembrar da Dica de Ouro da Média, que aprendemos na página 17 do Ponto 12! É só conferir! Testando se aprendemos bem a 1a Dica de Ouro da Mediana, respondamos (sem pensar muito) qual o valor da Mediana dos seguintes conjuntos abaixo: a) Xi fi 4 0 !--- 15 7 15 !--- 30 11 30 !--- 45 11 45 !--- 60 7 60 !--- 75 4 75 !--- 90
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 10 de 15
Resposta) Md=Média=Mo=45 Aqui temos uma distribuição simétrica com número par de classes! Logo: média, moda e mediana serão iguais ao limite superior da primeira classe intermediária (que por sua vez é também igual ao limite inferior da segunda classe intermediária!), que é igual a 45! b) Xi !--!--!--!--!---
0 7 14 21 28
fi 4 10 15 10 4
7 14 21 28 35
Resposta) Md=Média=Mo=17,5 Aqui temos uma distribuição simétrica com número ímpar de classes! Logo: média, moda e mediana serão iguais ao Ponto Médio da classe intermediária, que é igual a 17,5! Só isso, meus amigos! c) 9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
fi 4 6 7 6 4
19,5 29,5 39,5 49,5 59,5
Resposta) Md=Média=Mo=34,5 Aqui a mesma coisa do exemplo (b). Temos uma distribuição simétrica com número ímpar de classes, donde concluímos que média, moda e mediana serão iguais ao Ponto Médio da classe intermediária, que é igual a 34,5! Tudo isso sem precisar fazer uma só conta!! ---x-x-x-x-x-x-x--Mais um exemplo! Determinemos a Mediana do conjunto abaixo:
0 20 40 60
Xi !--!--!--!---
20 40 60 80
Fi 5 8 11 2 n=26
Sol.: É só seguir a receita: 1o Passo) Calculamos o n. Neste exemplo: n=26 2o Passo) (n/2)=13
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 11 de 15
3o Passo) Construímos a fac: fi fac↓ 5 5 13 8 24 11 26 2 n=26 os valores da fac com o valor de (n/2): fi fac↓ 5 5 Æ 5 é maior ou igual a 13? NÃO! 8 13 Æ 13 é maior ou igual a 13? NÃO! 11 24 2 26 n=26 0 20 40 60
4ª Passo) Compararmos Xi 0 !--- 20 20 !--- 40 40 !--- 60 60 !--- 80
Xi !--!--!--!---
20 40 60 80
Encontramos que nossa Classe Mediana é a segunda (20!---40). 5o Passo) Aplicamos a fórmula da Mediana:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h Æ ⎥ ⎥ ⎦
⎡13 − 5 ⎤ ⋅ 20 Md = 20 + ⎢ ⎣ 8 ⎥⎦
Æ Daí: Md=40
E lá vem de novo o “sabe tudo” aqui dizer que já sabia, antes das contas, que esta Mediana seria igual a 40! Mas, desta vez, como eu poderia adivinhar? A distribuição sequer é simétrica, para usarmos a 1a Dica de Ouro?!! É exatamente neste ponto que surge a... ... # 2a Dica de Ouro da Mediana: Quando estivermos na fase de compararmos os valores da fac com o referência (n/2) e, ao fazermos a pergunta de praxe, encontrarmos um fac exatamente igual ao (n/2), pararemos, e diremos que a Mediana será superior da classe correspondente! Vejamos o exemplo que acabamos de fazer. Quando chegamos na perguntas, observemos o que aconteceu:
0 20 40 60
Xi !--!--!--!---
20 40 60 80
fi 5 8 11 2 n=26
fac↓ 5 13 24 26
valor de valor de o limite fase das
Æ 13 é maior ou igual a 13? SIM! É o quê? É IGUAL!!
Se é IGUAL, então procuramos o limite superior desta classe, que no caso é 40 e afirmamos, sem pestanejar: Md=40.
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 12 de 15
Outro exemplo! Determinemos a Md do conjunto abaixo:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
Fi 8 12 10 20 10 n=60
1o Passo) Calculamos n=60. 2o Passo) Calculamos (n/2)=30 3o Passo) Construímos a fac:
0 10 20 30 40
Xi !--!--!--!--!---
fi 8 12 10 20 10 n=60
10 20 30 40 50
fac↓ 8 20 30 50 60
4o Passo) Comparamos os valores da fac com o valor de referência (n/2):
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 8 12 10 20 10 n=60
fac↓ 8 20 30 50 60
Æ 8 é maior ou igual a 30? NÃO! Æ 20 é maior ou igual a 30? NÃO! Æ 30 é maior ou igual a 30? SIM! É o quê? É IGUAL!
Imediatamente procuramos o limite superior da classe correspondente, e encontramos que lsup=30! Daí, não resta dúvida: Æ
Md=30
---x-x-x-x-x-x-x--# Propriedades da Mediana: Antes de passarmos aos exercícios de hoje, é conveniente analisarmos se a Mediana também estará sujeita àquelas propriedades que aprendemos para a Média e para a Moda, quais sejam: a “Propriedade da Soma e Subtração” e a “Propriedade do Produto e da Divisão”. A resposta é afirmativa em ambos os casos. Consideremos o conjunto abaixo: {1, 2, 3, 4, 5} Naturalmente que para este conjunto original, teremos que a Mediana será o elemento 3, de forma que restarão dois elementos à sua esquerda e dois à sua direita.
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Agora, se tomarmos cada elemento do conjunto acima, constante k=5 (por exemplo!). Ficaremos com o novo conjunto:
Página 13 de 15 e
os
somarmos
à
{6, 7, 8, 9, 10} ...cuja Mediana será exatamente 8. Ou seja, a Mediana do novo conjunto será a Mediana do conjunto original somada à constante k=5. Da mesma forma, se tomarmos o conjunto original, e multiplicarmos cada elemento pela constante k=3, por exemplo, ficaremos com o seguinte: {3, 6, 9, 12, 15} ...cuja Mediana será 9, ninguém menos que a antiga Mediana multiplicada pela mesma constante k=3. Destarte, concluímos que as três Medidas de Tendência Central – Média, Moda e Mediana – ficam igualmente sujeitas à Propriedade da Soma e Subtração e à Propriedade do Produto e Divisão! Para relembrar melhor estas propriedades, consultar o Ponto nº11, páginas 3 e 4! --- X-X-X-X-X-X-X-X--Eu acho que é isoo! Qualquer coisa que me lembre depois, acrescento na próxima aula, da resolução dos exercícios! Passemos, portanto, aos nossos... EXERCÍCIOS DE HOJE Enunciado único para as Questões de 1 a 5: Para cada um dos conjuntos abaixo, determine o valor da Mediana. 01. Trabalhe a Distribuição abaixo: Xi 0 !--- 10 10 !--- 20 20 !--- 30 30 !--- 40 40 !--- 50 02. Trabalhe a Distribuição abaixo:
15 30 45 60 75 90
fi 4 7 11 9 5 2
03. Trabalhe a Distribuição abaixo: Xi 0 !--- 7 7 !--- 14 14 !--- 21 21 !--- 28 28 !--- 35
fi 7 11 15 9 3
0 15 30 45 60 75
Xi !--!--!--!--!--!---
fi 3 5 8 4 2
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 14 de 15
04. Trabalhe a Distribuição abaixo:
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
fi 4 6 7 2 1
19,5 29,5 39,5 49,5 59,5
05. Trabalhe a Distribuição abaixo:
30 40 50 60 70 80 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
06. Extraída da prova de AFRF – 2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüência seguinte: Xi Freqüência (f) 29,5 – 39,5 4 39,5 - 49,5 8 49,5 – 59,5 14 59,5 – 69,5 20 69,5 – 79,5 26 79,5 – 89,5 18 89,5 – 99,5 10 Assinale a opção que corresponde à estimativa da Mediana amostral do atributo X: a) 71,04 b)65,02 c)75,03 d)68,08 e)70,02 07. Extraída da prova AFRF – 1998: Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14, 15, 15, 15, 16, 16, 18, 23 Assinale a opção decimal): a) 9,0 b)9,5
que
corresponde
c)8,5
à
d) 8,0
mediana
(com
e)10,0
aproximação
de
uma
casa
ESTATÍSTICA – Ponto dos Concursos
*** Ponto 16 – MEDIANA PARTE 02 ***
Página 15 de 15
08. Extraída da prova AFRF – 2002.1: Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes P (%) 70 – 90 5 90 – 110 15 110 – 130 40 130 – 150 70 150 – 170 85 170 – 190 95 190 – 210 100 Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X: a) 138,00 b)140,00 c)136,67 d) 139,01 e)140,66 09 e 10. Extraídas da prova do AFRF – 1996: DISTRIBUIÇÃO DE FREQÜÊNCIAS DAS IDADES DOS FUNCIONÁRIOS DA EMPRESA ALFA, EM 01/01/90 Xi-37 = di di . fi di2 . fi di3 . fi di4 . fi Classes das Freq. Ptos. Médios 5 (fi) (Xi) idades (anos) 19,5 – 24,5 2 22 -3 -6 18 -54 162 24,5 – 29,5 9 27 -2 -18 36 -72 144 29,5 – 34,5 23 32 -1 -23 23 -23 23 34,5 – 39,5 29 37 39,5 – 44,5 18 42 1 18 18 18 18 44,5 – 49,5 12 47 2 24 48 96 192 49,5 – 54,5 7 52 3 21 63 189 567 Total 100 16 206 154 1106
09. Marque a opção que representa a mediana das idades dos funcionários em 01/01/90. a) 35,49 b) 35,73 c) 35,91 d) 37,26 e) 38,01 Para efeito da questão seguinte, sabe-se que o quadro de pessoal da empresa continua o mesmo em 01/01/96. 10. Marque a opção que representa a mediana das idades dos funcionários, em 01/01/96. a) 35,49 b) 36,44 c) 41,49 d) 41,91 e) 43,26
11. Extraída da prova AFRF – 2002.1: Freqüências acumuladas de salários anuais, em milhares de reais, da Cia. Alfa. Classes de salários Freqüências acumuladas 3 ; 6 12 6 ; 9 30 9 ; 12 50 12 ; 15 60 15 ; 18 65 18 ; 21 68 Quer-se estimar o salário mediano anual da Cia. Alfa. Assinale a opção que corresponde ao valor aproximado desta estatística, com base na distribuição de freqüências. a) 12,50 b)9,60 c)9,00 d) 12,00 e)12,10 Boa sorte!
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Página 1 de 14
MEDIANA – PARTE 03 Olá pessoal! Estamos de volta! Hoje, encerramos a Mediana com a resolução dos exercícios pendentes. Todos resolvidos por vocês, espero! (Olha que houve bastante tempo para isso!). Será meramente uma confirmação dos resultados. Ou não? Deixemos de conversa mole e passemos às questões!
Enunciado Único para as Questões de 1 a 5: Para cada um dos conjuntos abaixo, determine o valor da Mediana. 01. Trabalhe a Distribuição abaixo:
0 10 20 30 40
Xi !--!--!--!--!---
fi 3 5 8 4 2
10 20 30 40 50
Sol.: Vamos tentar estabelecer logo os passos da resolução e padronizá-los, a fim de facilitar nossa memorização! 1º Passo) Determinar o “n” (número de elementos do conjunto), por meio do somatório da coluna fi, e o valor de (n/2):
0 10 20 30 40
Logo, teremos:
n=22
e
Xi !--!--!--!--!---
Fi 3 5 8 4 2 n=22
10 20 30 40 50
(n/2)=11
2o Passo) Construir a coluna da freqüência absoluta acumulada crescente, fac!
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 3 5 8 4 2 n=22
fac↓ 3 8 16 20 22
3o Passo) Comparar os valores da coluna da fac com o valor de referência (n/2), usando a pergunta de praxe: “esta fac é maior ou igual a (n/2)?” Quando a resposta for SIM, a classe correspondente será a Classe Mediana!
ESTATÍSTICA – Ponto dos concursos
Página 2 de 14
fi fac↓ 3 3 Æ 3 é ≥ 11? NÃO! 5 8 Æ 8 é ≥ 11? NÃO! 8 16 Æ 16 é ≥ 11? SIM! 4 20 2 22 n=22 Assim, achamos que nossa Classe Mediana será a terceira: (20 !—30)! Agora só nos resta aplicar a fórmula! 0 10 20 30 40
Xi !--!--!--!--!---
**** Ponto 17-MEDIANA PARTE 03 ***
10 20 30 40 50
4o Passo) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h Æ ⎥ ⎥ ⎦
⎡11 − 8 ⎤ ⋅ 10 Md = 20 + ⎢ ⎣ 8 ⎥⎦
Æ Daí: Md=23,75 Æ Resposta!
02. Trabalhe a Distribuição abaixo:
0 15 30 45 60 75
Xi !--!--!--!--!--!---
fi 4 7 11 9 5 2
15 30 45 60 75 90
Sol.: 1o Passo) Determinar o “n” e (n/2):
0 15 30 45 60 75
Logo: n=38
Xi !--!--!--!--!--!---
fi 4 7 11 9 5 2 n=38
15 30 45 60 75 90
e (n/2)=19
2o Passo) Construir a fac!
0 15 30 45 60 75
Xi !--!--!--!--!--!---
15 30 45 60 75 90
fi 4 7 11 9 5 2 n=38
fac↓ 4 11 22 31 36 38
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Página 3 de 14
3o Passo) Comparar os valores da fac com o valor de referência (n/2), usando a pergunta de praxe, e localizar a Classe Mediana! fi fac↓ 4 4 7 11 11 22 9 31 5 36 2 38 n=38 Daí, achamos a Classe Mediana, que 0 15 30 45 60 75
Xi !--!--!--!--!--!---
15 30 45 60 75 90
Æ 4 é ≥ 19? NÃO! Æ 11 é ≥ 19? NÃO! Æ 22 é ≥ 19? SIM!
é a terceira: (30 !-- 45)!
4o Passo) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h Æ ⎥ ⎥ ⎦
⎡19 − 11⎤ Md = 30 + ⎢ ⋅ 15 ⎣ 11 ⎥⎦
03. Trabalhe a Distribuição abaixo: Xi 0 !--- 7 7 !--- 14 14 !--- 21 21 !--- 28 28 !--- 35 Sol.: 1o Passo) Determinar o “n” e (n/2):
0 7 14 21 28
Xi !--!--!--!--!---
Æ Daí: Md=40,9 Æ Resposta!
fi 7 11 15 9 3
fi 7 11 15 9 3 n=45
7 14 21 28 35
Teremos: n=45 e (n/2)=22,5 2o Passo) Construir a fac!
0 7 14 21 28
Xi !--!--!--!--!---
7 14 21 28 35
fi 7 11 15 9 3 n=45
fac↓ 7 18 33 42 45
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Página 4 de 14
3o Passo) Comparar os valores da fac com o valor de referência (n/2), usando a pergunta de praxe, e localizar a Classe Mediana!
0 7 14 21 28
Xi !--!--!--!--!---
Fi 7 11 15 9 3 n=45
7 14 21 28 35
fac↓ 7 18 33 42 45
Æ 7 é ≥ 22,5? NÃO! Æ 18 é ≥ 22,5? NÃO! Æ 33 é ≥ 22,5? SIM!
Achamos, portanto, que nossa Classe Mediana é a terceira: (14!--21)! 4o Passo) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 14 + ⎡ 22,5 − 18 ⎤ ⋅ 7 ⎢⎣ 15 ⎥⎦ ⎥ ⎥ ⎦
Æ Daí: Md=16,1 Æ Resposta!
04. Trabalhe a Distribuição abaixo:
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
fi 4 6 7 2 1
19,5 29,5 39,5 49,5 59,5
Sol.: 1o Passo) Determinar o “n” e (n/2):
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 2 1 n=20
Achamos que: n=20 e (n/2)=10 2o Passo) Construir a fac!
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 2 1 n=20
fac↓ 4 10 17 19 20
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Página 5 de 14
3o Passo) Comparar os valores da fac com o valor de referência (n/2), usando a pergunta de praxe, e localizar a Classe Mediana!
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 2 1 n=20
Fac↓ 4 10 17 19 20
Æ 4 é ≥ 10? NÃO! Æ 10 é ≥ 10? SIM!
É o quê? É IGUAL!!
Ora, uma vez que encontramos um valor da fac exatamente igual ao (n/2), caímos no caso da 2a Regra de Ouro da Mediana!! Claro! Já podemos afirmar, dispensando os cálculos do próximo passo, que a Mediana será o limite superior da classe correspondente! Ou seja: Md=29,5 Æ Resposta! Todavia (para os incrédulos), para não perder mais uma oportunidade de memorizar a fórmula da Mediana, faremos o passo dos cálculos! 4o Passo) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 19,5 + ⎡ 20 − 4 ⎤ ⋅ 10 ⎢⎣ 6 ⎥⎦ ⎥ ⎥ ⎦
Æ Daí: Md=29,5 Æ Resposta!
Ou seja, quem se lembrar das Regras de Ouro deste curso certamente levará alguma vantagem em relação ao tempo!
05. Trabalhe a Distribuição abaixo:
30 40 50 60 70 80 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
Sol.: Esta é a questão de solução mais rápida de hoje! Por quê? Quem me diz? Basta olharmos a coluna da fi!! Com esta dica ficou fácil!! Trata-se de uma Distribuição Simétrica! Todos lembrados de como se identifica uma distribuição simétrica? Partindo da fi da classe intermediária, aplicamos a Técnica do Elevador (Ponto nº10), e verificamos que, a cada salto, os valores da fi são iguais. Vejamos:
ESTATÍSTICA – Ponto dos concursos
30 40 50 60 70 80 90 100 110
**** Ponto 17-MEDIANA PARTE 03 ***
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
Página 6 de 14
fi 1 3 7 11 14 11 7 3 1
Daí, como temos um número ímpar de classes e a distribuição é simétrica, concluímos que a Mediana (que será igual à Média e à Moda) será justamente o Ponto Médio da classe intermediária! Ou seja: Md=75 Æ Resposta! Encontramos esse resultado sem precisarmos fazer nenhum dos passos convencionais para determinação da Mediana!! Percebamos que vantagem sensacional! Novamente, para aproveitar o ensejo, acharemos a Mediana fazendo o serviço completo, a fim de memorizarmos ainda mais os passos e a fórmula! 1o Passo) Determinar o “n” e (n/2):
30 40 50 60 70 80 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1 n=58
Achamos, portanto: n=58 e (n/2)=29 2o Passo) Construir a fac! Xi 30 !--- 40 40 !--- 50 50 !--- 60 60 !--- 70 70 !--- 80 80 !--- 90 90 !--- 100 100 !--- 110 110 !--- 120
fi 1 3 7 11 14 11 7 3 1 n=58
fac↓ 1 4 11 22 36 47 54 57 58
ESTATÍSTICA – Ponto dos concursos
3o Passo) Comparar pergunta de praxe, Xi 30 !--40 !--50 !--60 !--70 !--80 !--90 !--100 !--110 !---
**** Ponto 17-MEDIANA PARTE 03 ***
Página 7 de 14
os valores da fac com o valor de referência (n/2), usando a e localizar a Classe Mediana! fi fac↓ 40 1 1 Æ 1 é ≥ 29? NÃO! 50 3 4 Æ 4 é ≥ 29? NÃO! 60 7 11 Æ 11 é ≥ 29? NÃO! 70 11 22 Æ 22 é ≥ 29? NÃO! 14 36 80 Æ 36 é ≥ 29? SIM! 11 47 90 7 54 100 3 57 110 1 58 120 n=58
Achamos que a Classe Mediana é a quinta classe: (70 !-- 80)! 4o Passo) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 70 + ⎡ 29 − 22 ⎤ ⋅ 10 ⎢⎣ 14 ⎥⎦ ⎥ ⎥ ⎦
Æ Daí: Md=75 Æ Resposta!
Então, queremos frisar o seguinte: na hora da prova, se conseguirmos enxergar que caímos em uma das Dicas de Ouro da Mediana, não hesitemos: marquemos a resposta e sigamos adiante! Próxima!
06. Extraída da prova de AFRF – 2002.2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüência seguinte: Xi Freqüência (f) 29,5 – 39,5 4 39,5 - 49,5 8 49,5 – 59,5 14 59,5 – 69,5 20 69,5 – 79,5 26 79,5 – 89,5 18 89,5 – 99,5 10 Assinale a opção que corresponde à estimativa da Mediana amostral do atributo X: a) 71,04 b)65,02 c)75,03 d)68,08 e)70,02 Sol.: Nesta questão, nossa primeira preocupação será descobrir que tipo de coluna de freqüência é essa que ele forneceu na tabela! Como já estamos treinados neste aspecto, logo matamos que se trata da própria fi, freqüência absoluta simples! Então, neste caso, estamos prontos para seguir nossos passos convencionais!
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Página 8 de 14
1o Passo) Determinar o “n” e (n/2): Xi – – – – – –
29,5 39,5 49,5 59,5 69,5 79,5 89,5
fi 4 8 14 20 26 18 10 n=100
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Daí, achamos que: n=100 e (n/2)=50 2o Passo) Construir a fac!
29,5 39,5 49,5 59,5 69,5 79,5 89,5
Xi – – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi 4 8 14 20 26 18 10 n=100
fac↓ 4 12 26 46 72 90 100
3o Passo) Comparar os valores da fac com o valor de referência (n/2), usando a pergunta de praxe, e localizar a Classe Mediana!
29,5 39,5 49,5 59,5 69,5 79,5 89,5
Xi – – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi 4 8 14 20 26 18 10 n=100
fac↓ 4 12 26 46 72 90 100
Æ Æ Æ Æ Æ
4 é ≥ 50? NÃO! 12 é ≥ 50? NÃO! 26 é ≥ 50? NÃO! 46 é ≥ 50? NÃO! 72 é ≥ 50? SIM!
Identificamos como sendo a Classe Mediana exatamente: (69,5 !-- 79,5)! 4o Passo) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 69,5 + ⎡ 50 − 46 ⎤ ⋅ 10 Æ E: Md=71,04 ⎢⎣ 26 ⎥⎦ ⎥ ⎥ ⎦
Æ Resposta!
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Página 9 de 14
07. Extraída da prova AFRF – 1998: Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14, 15, 15, 15, 16, 16, 18, 23 Assinale a opção decimal): a) 9,0 b)9,5
que
corresponde
c)8,5
à
d) 8,0
mediana
(com
aproximação
de
uma
casa
e)10,0
Sol.: Nesta questão dispomos de um rol, com número par de elementos: n=50. Desse modo, teremos duas posições centrais no conjunto, as quais serão determinadas da seguinte forma: (vide Ponto nº15, página 5) 1ª Posição Central =
n 2
e 2ª Posição Central = a que sucede a primeira! Daí, encontraremos que: Æ 1ª Posição Central =
n = (50/2) = 25a posição! 2
Æ 2ª Posição Central = a posterior = 26a posição! De resto, só elementos do rol seguinte: 4, 5, 5, 6, 6, 6, 9, 9, 10, 10, 10, 16, 16, 18, 23
teremos que encontrar (usando o bom e velho dedo!) quais os que ocupam respectivamente a 25a e 26a posições! Teremos o 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14, 15, 15, 15,
Uma vez identificados os elementos que ocupam as duas posições centrais restará apenas soma-los e dividir a soma por dois, ou seja, restar extrairmos a Média dos dois elementos encontrados. Teremos:
Md=(9+9)/2 Æ Md=9 Æ Resposta
08. Extraída da prova AFRF – 2002.1: Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes.
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
Página 10 de 14
P (%) 5 15 40 70 85 95 100
Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X: a) 138,00
b)140,00
c)136,67
d) 139,01
e)140,66
Sol.: Nosso primeiro trabalho nesta questão será identificar a coluna P(%) fornecida pelo enunciado e, partindo dela, construir a coluna da freqüência absoluta simples, fi! Todo este trabalho já foi feito em outras ocasiões (leia-se: em aulas anteriores), de modo que descobrimos que o P(%) é a freqüência relativa acumulada crescente (Fac), e que para chegarmos à fi, teríamos que perfazer o caminho seguinte: Fac Æ Fi Æ fi. Feito isso, chegaremos ao seguinte: Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210 Agora sim! Estamos determinação da Mediana!
aptos
Fac↓ 5% 15% 40% 70% 85% 95% 100% a
iniciar
Fi 5% 10% 25% 30% 15% 10% 5% os
1o Passo) Determinar o “n” e (n/2): Trabalharemos apenas com as colunas que interessam: Classes fi 70 – 90 10 90 – 110 20 110 – 130 50 130 – 150 60 150 – 170 30 170 – 190 20 190 – 210 10 n=200
fi 10 20 50 60 30 20 10 passos
convencionais
para
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Página 11 de 14
Teremos: n=200 e (n/2)=100 2o Passo) Construir a fac! Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
fi 10 20 50 60 30 20 10 n=200
fac↓ 10 30 80 140 170 190 200
3o Passo) Comparar os valores da fac com o valor de referência (n/2), usando a pergunta de praxe, e localizar a Classe Mediana! Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
fi 10 20 50 60 30 20 10 n=200
fac↓ 10 30 80 140 170 190 200
Æ Æ Æ Æ
10 é ≥ 100? NÃO! 30 é ≥ 100? NÃO! 80 é ≥ 100? NÃO! 140 é ≥ 100? SIM!
Logo, identificamos nossa Classe Mediana: (130 !-- 150)! 4o Passo) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 130 + ⎡100 − 80 ⎤ ⋅ 20 Æ E: Md=136,67 ⎢⎣ 60 ⎥⎦ ⎥ ⎥ ⎦
Æ Resposta!
09 e 10. Extraídas da prova do AFRF – 1996: DISTRIBUIÇÃO DE FREQÜÊNCIAS DAS IDADES DOS FUNCIONÁRIOS DA EMPRESA ALFA, EM 01/01/90 di . fi di2 . fi Freq. Ptos. Médios Xi-37 = di di3 . fi di4 . fi Classes das idades (fi) (Xi) 5 (anos) 19,5 – 24,5 2 22 -3 -6 18 -54 162 24,5 – 29,5 9 27 -2 -18 36 -72 144 29,5 – 34,5 23 32 -1 -23 23 -23 23 34,5 – 39,5 29 37 39,5 – 44,5 18 42 1 18 18 18 18 44,5 – 49,5 12 47 2 24 48 96 192 49,5 – 54,5 7 52 3 21 63 189 567 Total 100 16 206 154 1106
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Página 12 de 14
09. Marque a opção que representa a mediana das idades dos funcionários em 01/01/90. a) 35,49 b) 35,73 c) 35,91 d) 37,26 e) 38,01 Sol.: Neste enunciado, já temos calculado o valor do n (somatório da coluna do fi), então já estamos com a conclusão do 1oPasso. Vejamos: 1o Passo) Determinar o “n” e (n/2): Classes 19,5 – 24,5 24,5 – 29,5 29,5 – 34,5 34,5 – 39,5 39,5 – 44,5 44,5 – 49,5 49,5 – 54,5 Total Logo: n=100
fi 2 9 23 29 18 12 7 n=100
e (n/2)=50
2o Passo) Construir a fac! Classes 19,5 – 24,5 24,5 – 29,5 29,5 – 34,5 34,5 – 39,5 39,5 – 44,5 44,5 – 49,5 49,5 – 54,5 Total
fi 2 9 23 29 18 12 7 100
fac↓ 2 11 34 63 81 93 100
3o Passo) Comparar os valores da fac com o valor de referência (n/2), usando a pergunta de praxe, e localizar a Classe Mediana! Classes fi fac↓ 19,5 – 24,5 2 2 24,5 – 29,5 9 11 29,5 – 34,5 23 34 29 63 34,5 – 39,5 39,5 – 44,5 18 81 44,5 – 49,5 12 93 49,5 – 54,5 7 100 Total 100 Identificamos, pois, nossa Classe Mediana: 4o Passo) Aplicar a fórmula da Mediana! Teremos:
Æ Æ Æ Æ
2 é ≥ 50? NÃO! 11 é ≥ 50? NÃO! 34 é ≥ 50? NÃO! 63 é ≥ 50? SIM!
(34,5 !-- 39,5)!
ESTATÍSTICA – Ponto dos concursos
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
**** Ponto 17-MEDIANA PARTE 03 ***
⎤ ⎥ ⎥ ⋅ h Æ Md = 34,5 + ⎡ 50 − 34 ⎤ ⋅ 5 Æ E: Md=37,26 ⎢⎣ 29 ⎥⎦ ⎥ ⎥ ⎦
Página 13 de 14
Æ Resposta!
Para efeito da questão seguinte, sabe-se que o quadro de pessoal da empresa continua o mesmo em 01/01/96. 10. Marque a opção que representa a mediana das idades dos funcionários, em 01/01/96. a) 35,49 b) 36,44 c) 41,49 d) 41,91 e) 43,26 Sol.: Esta questão é de resolução imediata!! Claro! Basta nos lembrarmos que a Mediana (assim como a Média e a Moda!) está sujeita à Propriedade da Soma e da Subtração, bem como à do Produto e da Divisão! Vimos isso no Ponto nº16, página 13! É só conferir! Daí, se na questão anterior estávamos trabalhando as idades de pessoas na data de 01/01/90 e, passamos a analisar as idades daquele mesmo grupo de pessoas seis anos depois, ou seja, em 01/01/96, isso significa que, a cada elemento do conjunto adicionamos a constante 6. Conseqüentemente, pela Propriedade da Soma e Subtração, a nova Mediana será a Mediana anterior (do conjunto original) somada à mesma constante! Ou seja:
Md=(37,26+6) Æ
Md=43,26
Æ
Resposta!
11. Extraída da prova AFRF – 2002.1: Freqüências acumuladas de salários anuais, em milhares de reais, da Cia. Alfa. Classes de salários 3 6 9 12 15 18
; ; ; ; ; ;
6 9 12 15 18 21
Freqüências acumuladas 12 30 50 60 65 68
Quer-se estimar o salário mediano anual da Cia. Alfa. Assinale a opção que corresponde ao valor aproximado desta estatística, com base na distribuição de freqüências. a) 12,50 b)9,60 c)9,00 d) 12,00 e)12,10 Sol.: Este enunciado forneceu-nos a coluna da fac! Temos, como já é do nosso conhecimento, que construir a fi! Feito isso, passaremos aos passos convencionais para acharmos a Mediana. Em frente!
ESTATÍSTICA – Ponto dos concursos
**** Ponto 17-MEDIANA PARTE 03 ***
Página 14 de 14
Teremos, assim: Classes de salários 3 ; 6 6 ; 9 9 ; 12 12 ; 15 15 ; 18 18 ; 21
fac↓
Fi
12 30 50 60 65 68
12 18 20 10 5 3
Na seqüência, faremos: 1o Passo) Determinar o “n” e (n/2): Obviamente nem perderemos nosso tempo somando a coluna do fi, para encontrarmos o n! E por quê? Porque o n é sempre igual à última freqüência absoluta acumulada crescente, fac! Lembramos disso? Daí, teremos: n=68
e
(n/2)=34
2o Passo) Construir a fac! Também não necessitaremos fazer este passo, porque ele já veio feito! O próprio enunciado já nos forneceu a fac! 3o Passo) Comparar os valores da fac com o valor de referência (n/2), usando a pergunta de praxe, e localizar a Classe Mediana! e salários 3 ; 6 ; 9 ; 12 ; 15 ; 18 ;
6 9 12 15 18 21
fi 12 18 20 10 5 3
fac↓ 12 30 50 60 65 68
Æ 12 é ≥ 34? NÃO! Æ 30 é ≥ 34? NÃO! Æ 50 é ≥ 34? SIM!
Identificamos a Classe Mediana: (9 !-- 12)! 4o Passo) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 9 + ⎡ 34 − 30 ⎤ ⋅ 3 Æ E: Md=9,60 ⎢⎣ 20 ⎥⎦ ⎥ ⎥ ⎦
Æ Resposta!
Ok, amigos! Ficamos hoje por aqui! Próxima aula, aprenderemos algo da maior importância, que é a relação entre as Medidas de Tendência Central – Média, Moda e Mediana – e a situação de simetria de um conjunto. É uma teoria bastante fácil de ser compreendida e bastante útil na prova! Várias questões de concurso já versaram sobre isso! Na seqüência, creio que já estaremos prontos para um primeiro simulado! Isso tudo, antes de iniciarmos as Medidas Separatrizes e as Medidas de Dispersão! Um grande abraço a todos e até a próxima!
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 1 de 10
RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA Caros amigos, estamos de volta! Hoje, tentarei fazer uma aula sucinta sobre um assunto muito simples e também muito importante! Falaremos sobre a relação que há entre as Medidas de Tendência Central – Média, Moda e Mediana – e o comportamento da Simetria de um conjunto. # Curva de Freqüências: Já vimos, no Ponto nº10 (Distribuições Simétricas), o que é um Histograma. Estamos lembrados? É aquele gráfico que representa uma Distribuição de Freqüências! Observemos o conjunto abaixo: Classes 0 !-- 10 10 !-- 20 20 !-- 30 30 !-- 40 40 !-- 50
fi 2 5 8 5 2
Construindo o Histograma para este conjunto, teríamos o seguinte:
Façamos agora o seguinte: marquemos em cada retângulo do Histograma, em sua parte superior, o ponto correspondente ao Ponto Médio de cada classe. Ficaríamos assim:
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Neste momento, voltaremos ao nosso tempo de infância e pontinhos marcados no histograma acima. Passaremos ao seguinte:
Pág. 2 de 10
ligaremos
os
Pois bem, amigos! Estamos agora diante de um novo gráfico, originado pelo Histograma, o qual chamaremos de Polígono de Freqüências! Primeira conclusão de hoje: o Polígono de Freqüências é um gráfico, representativo da Distribuição de Freqüências, obtido quando ligamos os Pontos Médios das classes do conjunto, marcados na parte superior dos retângulos do Histograma! Já houve uma questão teórica sobre esse gráfico em uma prova da ESAF. Veremos nos exercícios do fim da aula! Agora é que vem! Se quisermos aproximar estas retas que formam o Polígono de Freqüências para uma curva, ou seja, se quisermos “suavizar” o Polígono de Freqüências, fazendo com que suas retas tomem aspecto curvilíneo, teríamos algo parecido com o seguinte:
Esta curva, que consideraremos apenas uma suavização do Polígono de Freqüências, é a chamada Curva de Freqüências, e também (como vimos) será representativa de uma Distribuição de Freqüências! Essa consideração que estamos fazendo (curva como mera suavização do Polígono) é apenas uma aproximação (que fique bem claro isso!) e que, para efeito de concurso, nos ajuda e não nos prejudica em nada! Portanto, aceitaremos dessa forma! Ou seja, percorremos este caminho até aqui, para concluir que uma Distribuição de Freqüências pode ser representada por uma Curva!
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 3 de 10
Agora uma pergunta: o que podemos dizer acerca desta Distribuição de Freqüências que estamos estudando? Nem precisa pensar muito! De cara, respondemos que se trata de uma Distribuição Simétrica! Ora, já vimos Mediana) que quando Média será igual à com número ímpar de
nas aulas precedentes (nas Dicas de Ouro da Média, Moda e uma Distribuição de Freqüências é simétrica, teremos que a Moda e à Mediana. Certo? No caso de um conjunto simétrico classes, sabemos que:
Média = Moda = Mediana= Ponto Médio da Classe Intermediária! Passando essa informação para nosso gráfico, teremos:
Média=Mo=Md Já sabíamos praticamente tudo o que foi dito até aqui! Agora consideremos as duas outras situações, quando a Distribuição de Freqüências não for simétrica, ou seja, quando o conjunto apresentar assimetria! Observemos o conjunto abaixo (emprestado do Ponto nº 10!) Classes 0 |--- 10 10|--- 20 20|--- 30 30|--- 40 40|--- 50 50|--- 60 60|--- 70 70|--- 80 80|--- 90 90|--- 100 100|--- 110
fi 2 6 11 15 8 7 6 4 3 2 1
Se traçarmos o Histograma para esse conjunto acima, como já o fizemos no Ponto nº10, teremos o seguinte:
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 4 de 10
Saltando os passos de marcar os pontinhos (os Pontos Médios!), e de ligálos (formando o Polígono de Freqüências), teremos (aproximadamente) a seguinte Curva de Freqüências:
Tomemos agora mais um conjunto, qual seja: Classes 0 |--- 10 10|--- 20 20|--- 30 30|--- 40 40|--- 50 50|--- 60 60|--- 70 70|--- 80 80|--- 90 90|--- 100 100|--- 110
fi 1 2 3 4 6 7 8 15 11 6 2
Para esta Distribuição de Freqüências, teríamos o seguinte Histograma:
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 5 de 10
Daí, se marcarmos os Pontos Médios de cada classe na parte superior dos retângulos; se traçarmos retas unindo esses pontos e construirmos o Polígono de Freqüências; se, enfim, aproximarmos as retas do Polígono de Frequencias para uma Curva de Freqüências, ficaríamos aproximadamente com o seguinte:
O que temos que aprender agora é o seguinte: as duas Curvas de Freqüências que traçamos acima, para as duas Distribuições de Freqüências assimétricas, representam exatamente as duas situações de assimetria possíveis! Para melhor distingüir essas duas situações, observaremos o seguinte: haverá, em cada caso, um lado da curva que tende mais para a direção horizontal, enquanto o outro lado tende mais para a vertical. O que faremos é simples: colocaremos uma setinha no lado que tende para a horizontal, e daí teremos o nome da nossa assimetria! Vejamos:
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 6 de 10
O raciocínio é simples: o lado que tende para a horizontal (setinha vermelha) aponta para a direita! Logo, estamos diante de uma Distribuição Assimétrica à Direita, ou de Assimetria Positiva! No outro caso, teremos:
Aqui, o lado que tende para a horizontal (setinha vermelha) aponta para a esquerda! Concluímos: estamos diante de uma Distribuição Assimétrica à Esquerda ou de Assimetria Negativa! Estamos quase chegando três frases curtas e simples Æ Æ Æ
aos “finalmentes”! Só nos resta agora memorizar (as Três Frases Mágicas), quais sejam: 1o) A seta puxa a Média! 2o) A Moda está no topo! 3o) A Mediana está no meio!
Ora, estas frases traduzem as características destas três Medidas de Posição. Claro! A Média é sempre influenciada por valores extremos, os quais são “atraídos pela seta”. A Moda é o elemento de maior freqüência, e a maior freqüência está no topo (no ponto mais alto da curva!). A Mediana está sempre no meio do conjunto, dividindo-o em duas partes iguais! Daí, transpondo as três frases mágicas para nossos gráficos, teremos que:
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 7 de 10
Moda< Mediana< Média Ou seja: sempre que a Média for maior que a Mediana, e esta for maior que a Moda, estaremos diante de uma Distribuição Assimétrica à Direita, ou de Assimetria Positiva! Teremos ainda que:
Média
<
Mediana <
Moda
Traduzindo: quando tivermos a situação em que a Moda for maior que a Mediana, e esta maior que a Média, estaremos diante de uma Distribuição Assimétrica à Esquerda, ou de Assimetria Negativa! Percebamos que, nesta aula, nosso objetivo não é o de aprendermos a calcular os índices de Assimetria! Isso será objeto de uma aula futura (se Deus quiser!). Por hora, nossa meta consiste simplesmente em conhecermos o comportamento das Medidas de Tendência Central, nos casos de Distribuições de Freqüências Assimétricas à Direita e à Esquerda! Finalmente, quando a distribuição for simétrica, conforme já vimos no início desta aula, teremos que Média, Moda e Mediana serão coincidentes, conforme a Curva de Freqüências abaixo:
Média=Mediana=Moda
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 8 de 10
Que outras observações podemos fazer acerca destes três gráficos conclusivos?
Æ 1o) Quando a distribuição for assimétrica, a Mediana estará sempre entre a Média e a Moda; Æ 2o) Só será necessário conhecermos os valores de duas medidas de tendência central para sabermos se a distribuição é assimétrica positiva ou negativa. Particularmente, eu prefiro encontrar Média e Moda. Daí: Æ Se a Média for maior que a Moda, a seta apontará para a direita (lembremos que “a seta puxa a Média” e que o valor maior fica sempre na direita!), logo o conjunto é de assimetria positiva (assimétrico à direita!); Æ Se a Média for menor que a Moda, a seta estará apontando para a esquerda, logo teremos uma assimetria negativa (ou à esquerda!). Confesso, com toda honestidade, que em todas as provas que fiz de Estatística (sobretudo as de AFRF!) sempre desenhei os três gráficos que aprendemos hoje! São rápidos de se fazer, e nos garantem uma questão! E que questão é essa? É a do tipo que assimetria, mas apenas se a distribuição esquerda ou se é assimétrica á direita! Daí, de tendência central, compará-las lembrando a questão! Facílimo!
pergunta não o valor do índice de é simétrica, se é assimétrica à só temos que calcular duas medidas das três frases mágicas, e acertar
# Relação Empírica de Pearson: Aprenderemos agora uma nova fórmula, na verdade uma relação entre Média, Moda e Mediana, desenvolvida pelo matemático Karl Pearson. Esta relação tem algumas particularidades! A rigor, para efeito de prova, não a utilizaremos para calcular as Medidas de Posição, a não ser, naturalmente, que o enunciado da questão o exija!! Até hoje isso não aconteceu! É a seguinte a Relação Empírica de Pearson:
X - Mo = 3( X - Md) Por meio desta relação, se conhecermos duas das medidas (Média e Moda, ou Média e Mediana, ou Moda e Mediana) teremos condições de calcular a terceira! Ocorre que, como já foi dito, tal relação não será utilizada por nós na prova, exceto se esta determinação estiver explícita no enunciado da questão! Quais seriam as particularidades e condições para aplicação desta relação empírica? São os seguintes: Æ 1o) Só se aplicaria a distribuições de freqüência quase simétricas, ou seja, de fraca assimetria; Æ 2o) Só se aplicaria a conjuntos unimodais, ou seja, que apresentam apenas uma Moda; Æ 3o) Só se aplicaria se o conjunto tivesse um número de elementos n bastante elevado.
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 9 de 10
E o mais importante: todas essas condições acima elencadas para a aplicação da relação empírica de Pearson ainda não lhe conferem uma característica de exatidão dos resultados. Em outras palavras: mesmo que as condições sejam atendidas, a relação de Pearson nos fornecerá apenas uma mera aproximação do resultado real!
Talvez por isso nunca tenha sido objeto de prova até hoje! Por conta deste “até hoje”, não podemos deixar de mencionar esta relação! Além do mais, quando formos aprender como calcular o índice de Assimetria de um conjunto, voltaremos a recordar esta relação empírica de Pearson!
De teoria é só isso! Passemos aos exercícios propostos para hoje, cujas resoluções iniciarão nossa próxima aula! EXERCÍCIOS DE HOJE Enunciado Único para as Questões de 1 a 5: Para cada um dos conjuntos abaixo, diga se a distribuição de freqüências é simétrica, ou assimétrica à direita (de assimetria positiva), ou assimétrica à esquerda (de assimetria negativa). 01. Trabalhe a Distribuição abaixo:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 3 5 8 4 2
15 30 45 60 75 90
fi 4 7 11 9 5 2
7 14 21 28 35
fi 7 11 15 9 3
02. Trabalhe a Distribuição abaixo: Xi 0 !--15 !--30 !--45 !--60 !--75 !--03. Trabalhe a Distribuição abaixo:
0 7 14 21 28
Xi !--!--!--!--!---
ESTATÍSTICA-Ponto dos concursos *** Ponto 18 - RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
04. Trabalhe a Distribuição abaixo:
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 2 1
Pág. 10 de 10
05. Trabalhe a Distribuição abaixo:
30 40 50 60 70 80 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
O importante nestes exercícios será a memorização das três Curvas de Freqüências, características das três situações possíveis de simetria de um conjunto. Essa simples teoria pode nos garantir uma questão a mais na prova! Vou abrir aqui um novo parênteses, pedindo a licença de todos, para dizer que AGORA É PRA VALER!! Próximo sábado, dia 05 de julho, estaremos iniciando em Fortaleza nossa turma de Matemática Financeira, cumprindo o programa de Fiscal da Receita, que por sinal é o mesmo do Fiscal de Fortaleza, cujo edital acabou de sair!! As aulas acontecerão sempre aos sábados pela manhã, e o local é uma sala que eu próprio organizei. Infelizmente a sala não é muito grande, de modo que as vagas são, realmente, limitadas. Começaremos às 8:15h com um mínimo de cinco alunos, ou às 8:30h com qualquer número de presentes! (Tá igual reunião de condomínio!). Contatos para pré-inscrição, pelo número (85)91.11.92.21. Quem tiver interesse, por favor ligue com antecedência para garantir sua vaga. O preço é inacreditavelmente promocional!! Só vendo!
Nossos planos para as aulas vindouras são os seguintes: simulado estilo ESAF (elaborado por este que vos escreve), para efeitos de uma revisão sistemática de tudo o que vimos até aqui. Na seqüência, passaremos às Medidas Separatrizes e daí às tão ansiosamente esperadas “Medidas de Dispersão”. Devagar e sempre, a gente chega lá! Tenho pra mim que antes do próximo AFRF a gente terá condição de cumprir todo o programa e ainda de fazer outros simulados. Se Deus quiser! Fico por aqui! Um forte abraço a todos e até a próxima!
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 1 de 14
EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA Olá, amigos! Hoje nos deteremos com as resoluções dos exercícios que ficaram da última aula. E por falar em última aula, recebi um e-mail de uma aluna dizendo-me que não conseguiu baixá-la, não conseguiu acessá-la! Como eu sei que a proporção de “alunos que escrevem” para “alunos silenciosos” é de um para dez mil (isso nas minhas contas!), então fiquei imediatamente preocupado! Será que outros alunos também tiveram o mesmo problema e não puderam acessar o nosso Ponto 18? Peço, encarecidamente, que me informem a respeito disto, para que possamos tomar alguma providência! Obrigado! E vamos às resoluções!
Enunciado Único para as Questões de 1 a 5: Para cada um dos conjuntos abaixo, diga se a distribuição de freqüências é simétrica, ou assimétrica à direita (de assimetria positiva), ou assimétrica à esquerda (de assimetria negativa). 01. Trabalhe a Distribuição abaixo: Xi 0 !--10 !--20 !--30 !--40 !---
fi 3 5 8 4 2
10 20 30 40 50
Sol.: Vimos na última aula que nos bastará conhecer o valor de duas Medidas de Tendência Central para responder a esta questão! Fica, portanto, à escolha do candidato! Normalmente, eu prefiro calcular Média e Moda, mas já que estamos aqui é para treinar e para fixar os passos todos, iremos determinar, em cada um desses exercícios, os valores da Média, Moda e Mediana! Æ Cálculo da Média: Vamos trabalhar com a Variável Transformada!! Passo 01) Construir a coluna dos Pontos Médios e a Coluna de Transformação:
Xi 0 10 20 30 40
!--!--!--!--!---
10 20 30 40 50
fi
PM
3 5 8 4 2
5 15 25 35 45
Passo 02) Construir a coluna Yi.fi Xi fi PM 0 10 20 30 40
!--!--!--!--!---
10 20 30 40 50
3 5 8 4 2 n=22
5 15 25 35 45
(PM – 5) = Yi 10 0 1 2 3 4
(PM – 5) = Yi 10 0 1 2 3 4
Yi.fi 0 5 16 12 8 41
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 2 de 14
Passo 03) Aplicar a fórmula da Média para a Variável Transformada Yi:
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Æ Daí: Y = (41 / 22) Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
E: Y = 1,86
Passo 04) Desenhar os Caminhos de Ida e de Volta e encontrar o X Caminho de Ida 1º)(-5)
X =?
e
2º)(÷10)
Xi
Yi 2º)(+5)
e
Y = 1,86
1º)(x10)
Caminho de Volta Fazendo as contas do Caminho de Volta, teremos: 1o)(x10)Æ 1,86x10=18,6
e 2º)(+5)Æ 18,6+5=23,6 Æ Daí: X = 23,6
Obs.: Este valor da Média ficará guardado para o final da questão!! Æ Cálculo da Moda: Passo 01) Encontrar a Classe Modal (a de maior fi!):
0 10 20 30 40
Xi !--!--!--!--!---
fi 3 5 8 4 2
10 20 30 40 50
Æ Classe Modal! Æ (a de maior fi)
Passo 02) Identificar os elementos da fórmula de Czuber: Δa e Δp 0 10 20 30 40
Xi !--!--!--!--!---
fi 3 5 8 4 2
10 20 30 40 50
Æ Classe Anterior: Δa=8-5 Æ Δa=3 Æ Classe Modal! Æ Classe Posterior: Δp=8-4 Æ Δp=4
Passo 03) Aplicar a fórmula da Moda de Czuber:
Segundo Czuber, teremos que:
⎛ 3 ⎞ ⎟ ⋅10 ⎝ 3+ 4⎠
Daí: Mo = 20 + ⎜
ESTATÍSTICA
Æ
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
E: Mo=24,28
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 3 de 14
Obs.: Também guardaremos este valor para a análise final! Æ Cálculo da Mediana: Passo 01) Achar a Classe Mediana:
0 10 20 30 40
Logo, teremos:
n=22
e
Xi !--!--!--!--!---
fi 3 5 8 4 2 n=22
10 20 30 40 50
(n/2)=11
Daí: 0 10 20 30 40
Xi !--!--!--!--!---
fi 3 5 8 4 2 n=22
10 20 30 40 50
fac↓ 3 8 16 20 22
Daí: 0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 3 5 8 4 2 n=22
fac↓ 3 8 16 20 22
Æ 3 é ≥ 11? NÃO! Æ 8 é ≥ 11? NÃO! Æ 16 é ≥ 11? SIM!
E determinamos que nossa Classe Mediana é a terceira classe! Passo 02) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 20 + ⎡11 − 8 ⎤ ⋅ 10 ⎢⎣ 8 ⎥⎦ ⎥ ⎥ ⎦
Æ Daí: Md=23,75
Æ Análise da Relação Média-Moda-Mediana: Pois bem! Agora dispomos dos três valores: Média, Moda e Mediana! Só teremos que compará-los! Encontramos que:
X = 23,6
Æ
Md=23,75 Æ
Mo=24,28
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 4 de 14
O procedimento é muito simples: colocamos os três valores na ordem crescente, como fizemos acima. Depois raciocinaremos assim: quem vai nos dizer a resposta é a Média ( X ), que estará ou à esquerda ou à direita dos valores! Da seguinte forma: Æ Se a Média estiver à esquerda, a Distribuição é Assimétrica à Esquerda, ou de Assimetria Negativa! Æ Se a Média estiver à direita, a Distribuição é Assimétrica à Direita, ou de Assimetria Positiva! Neste caso, temos Média à esquerda, logo concluímos: a Distribuição é de Assimetria Negativa (Curva Assimétrica à Esquerda!). Observemos que se houvéssemos determinado apenas Média e Moda, o raciocínio seria o mesmo: colocaríamos ambos os valores em ordem crescente e a resposta seria determinada pela posição da Média – à esquerda ou à direita! Só isso!
02. Trabalhe a Distribuição abaixo:
0 15 30 45 60 75
Xi !--!--!--!--!--!---
fi 4 7 11 9 5 2
15 30 45 60 75 90
Sol.: Æ Cálculo da Média: Passo 01) Construir a coluna dos PM e a Coluna de Transformação: Xi 0 15 30 45 60 75
!--!--!--!--!--!---
15 30 45 60 75 90
fi
PM
4 7 11 9 5 2
7,5 22,5 37,5 52,5 67,5 82,5
(PM-7,5)= Yi 15 0 1 2 3 4 5
Passo 02) Construir a coluna Yi.fi Xi 0 15 30 45 60 75
!--!--!--!--!--!---
15 30 45 60 75 90
fi
PM
4 7 11 9 5 2 n=38
7,5 22,5 37,5 52,5 67,5 82,5
(PM-7,5)= Yi 15 0 1 2 3 4 5
Yi.fi 0 7 22 27 20 10 86
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 5 de 14
Passo 03) Aplicar a fórmula da Média para a Variável Transformada Yi:
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Æ Ficaremos com: Y = (86/38) Æ Y =⎜ ⎜ ⎟ n ⎝ ⎠
E: Y =2,26
Passo 04) Desenhar os Caminhos de Ida e de Volta e encontrar o X Caminho de Ida 1º)(-7,5)
X =?
e
2º)(÷15)
Xi
Yi 2º)(+7,5)
e
Y = 2,26
1º)(x15)
Caminho de Volta Daí, teremos: 1º)(x15)Æ 2,26x15=33,9
e 2º)(+7,5)Æ 33,9+7,5=41,4 Æ Daí: X = 41,4
Æ Cálculo da Moda: Passo 01) Encontrar a Classe Modal (a de maior fi!):
0 15 30 45 60 75
Xi !--!--!--!--!--!---
15 30 45 60 75 90
fi 4 7 11 9 5 2
Æ Classe Modal! Æ (a de maior fi)
Passo 02) Identificar os elementos da fórmula de Czuber: Δa e Δp
0 15 30 45 60 75
Xi !--!--!--!--!--!---
15 30 45 60 75 90
fi 4 7 11 9 5 2
Æ Classe Anterior: Δa=11-7 Æ Δa=4 Æ Classe Modal! Æ Classe Posterior: Δp=11-9 Æ Δp=2
Passo 03) Aplicar a fórmula da Moda de Czuber:
Segundo Czuber, teremos que:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
⎛ 4 ⎞ ⎟ ⋅15 ⎝ 4+2⎠
Daí: Mo = 30 + ⎜
Æ
Pág. 6 de 14
E: Mo=40,0 Æ Resposta!
Obs.: Somente até aqui, pela determinação da Média e da Moda, já somos capazes de “matar a questão!”. Ou seja, já temos elementos suficientes para dizer se a distribuição é assimétrica à esquerda ou à direita. Todavia, para não perder a oportunidade, calculemos também o valor da Mediana! Æ Cálculo da Mediana: Passo 01) Achar a Classe Mediana:
0 15 30 45 60 75
Logo: n=38
Xi !--!--!--!--!--!---
fi 4 7 11 9 5 2 n=38
15 30 45 60 75 90
e (n/2)=19
Daí: 0 15 30 45 60 75
Xi !--!--!--!--!--!---
15 30 45 60 75 90
fi 4 7 11 9 5 2 n=38
fac↓ 4 11 22 31 36 38
Daí: fi fac↓ 4 4 Æ 4 é ≥ 19? NÃO! 7 11 Æ 11 é ≥ 19? NÃO! 11 22 Æ 22 é ≥ 19? SIM! 9 31 5 36 2 38 n=38 Portanto, achamos a Classe Mediana, que é a terceira: (30 !-- 45)! 0 15 30 45 60 75
Xi !--!--!--!--!--!---
15 30 45 60 75 90
Passo 02) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 30 + ⎡19 − 11⎤ ⋅ 15 ⎢⎣ 11 ⎥⎦ ⎥ ⎥ ⎦
Æ Daí: Md=40,9
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 7 de 14
Æ Análise da Relação Média-Moda-Mediana: Colocando os valores encontrados em ordem crescente, teremos: Æ
Mo=40,0
Md=40,9
Æ
X = 41,4
Então perguntamos: A Média X está à esquerda ou à direita dos valores? Como a resposta é “à direita”, concluímos: estamos diante de uma Distribuição de Freqüências Assimétrica à Direita, ou de Assimetria Positiva! 03. Trabalhe a Distribuição abaixo:
0 7 14 21 28
Xi !--!--!--!--!---
fi 7 11 15 9 3
7 14 21 28 35
Sol.: Æ Cálculo da Média: Passo 01) Construir a coluna dos PM e a Coluna de Transformação: Xi 0 7 14 21 28
!--!--!--!--!---
7 14 21 28 35
fi
PM
7 11 15 9 3
3,5 10,5 17,5 24,5 31,5
(PM-3,5)= Yi 7 0 1 2 3 4
Passo 02) Construir a coluna Yi.fi Xi 0 7 14 21 28
!--!--!--!--!---
7 14 21 28 35
fi
PM
7 11 15 9 3 n=45
3,5 10,5 17,5 24,5 31,5
(PM-3,5)= Yi 7 0 1 2 3 4
Yi.fi 0 11 30 27 12 80
Passo 03) Aplicar a fórmula da Média para a Variável Transformada Yi:
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(80/45)
Æ
Y =1,77
Passo 04) Desenhar os Caminhos de Ida e de Volta e encontrar o X
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Caminho de Ida 1º)(-3,5)
X =?
e
2º)(÷7)
Xi
Yi 2º)(+3,5)
e
Y = 1,77
1º)(x7)
Caminho de Volta Percorrendo o caminho de volta, partindo do Y = 1,77, teremos: 1º)(x7)Æ 1,77x7=12,4
e 2º)(+3,5)Æ 12,4+3,5=15,9 Æ X = 15,9
Æ Cálculo da Moda: Passo 01) Encontrar a Classe Modal (a de maior fi!):
0 7 14 21 28
Xi !--!--!--!--!---
fi 7 11 15 9 3
7 14 21 28 35
Æ Classe Modal! Æ (a de maior fi)
Para a qual teremos: linf=14 e h=7 Passo 02) Identificar os elementos da fórmula de Czuber: Δa e Δp
0 7 14 21 28
Xi !--!--!--!--!---
fi 7 11 15 9 3
7 14 21 28 35
Æ Classe Anterior: Δa=15-11 Æ Δa=4 Æ Classe Modal! Æ Classe Posterior: Δp=15-9 Æ Δp=6
Passo 03) Aplicar a fórmula da Moda de Czuber:
Segundo Czuber, teremos que:
⎛ 4 ⎞ ⎟⋅7 ⎝ 4+6⎠
Daí: Mo = 14 + ⎜
Æ
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
E: Mo=16,8
Pág. 8 de 14
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Æ Cálculo da Mediana: Passo 01) Achar a Classe Mediana: 0 7 14 21 28
Xi !--!--!--!--!---
fi 7 11 15 9 3 n=45
7 14 21 28 35
Teremos: n=45 e (n/2)=22,5 Daí: 0 7 14 21 28
Xi !--!--!--!--!---
7 14 21 28 35
fi 7 11 15 9 3 n=45
fac↓ 7 18 33 42 45
Daí: 0 7 14 21 28
Xi !--!--!--!--!---
7 14 21 28 35
fi 7 11 15 9 3 n=45
fac↓ 7 18 33 42 45
Æ 7 é ≥ 22,5? NÃO! Æ 18 é ≥ 22,5? NÃO! Æ 33 é ≥ 22,5? SIM!
Achamos, portanto, que nossa Classe Mediana é a terceira: (14!--21)! Passo 02) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 14 + ⎡ 22,5 − 18 ⎤ ⋅ 7 ⎢⎣ 15 ⎥⎦ ⎥ ⎥ ⎦
Æ Daí: Md=16,1
Æ Análise da Relação Média-Moda-Mediana: Colocando os valores encontrados em ordem crescente, teremos:
X = 15,9 Æ
Md=16,1
Æ
Mo=16,8
Pág. 9 de 14
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 10 de 14
Novamente perguntamos: A Média X está à esquerda ou à direita dos valores? Como a resposta é “à esquerda”, não nos restará nenhuma dúvida: estamos diante de uma Distribuição de Freqüências Assimétrica à Esquerda, ou de Assimetria Negativa! Quero novamente frisar o seguinte: na hora da prova, só teremos que conhecer duas medidas de tendência central (Média e Moda, ou Média e Mediana, ou Moda e Mediana) para chegarmos a esta resposta!! No caso em que conheçamos a Média e uma outra medida (Moda ou Mediana), apenas lembraremos que a posição da Média é quem define a resposta: Média à esquerda, Assimetria à esquerda; Média à direita, Assimetria à Direita! No caso em que conheçamos os valores da Moda e da Mediana, lembraremos apenas que a Mediana estará sempre entre a Moda e a Média. Daí, já saberemos localizar a Média e definir a resposta da questão. Por exemplo, se a Moda for maior que a Mediana, colocando-as na ordem crescente, teremos: Md Æ Mo. Ora, se “a Mediana está no meio” (frase mágica da última aula!) então a posição da Média não poderia ser outra: Média Æ Md Æ Mo. Daí, concluiríamos: o conjunto seria assimétrico à esquerda! Se a Mediana, por outro lado, for maior que a Moda, colocando-as em ordem crescente, teríamos: Mo Æ Md. Uma vez que “a Mediana está no meio”, entre Média e Moda, a posição da Média só poderia ser a seguinte: Mo Æ Md Æ Média. Daí, concluímos: é uma distribuição assimétrica à direita (ou de assimetria positiva)! Ficou claro?
04. Trabalhe a Distribuição abaixo:
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
fi 4 6 7 2 1
19,5 29,5 39,5 49,5 59,5
Sol.: Æ Cálculo da Média: Passo 01) Construir a coluna dos PM e a Coluna de Transformação: Xi 9,5 19,5 29,5 39,5 49,5
!--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi
PM
4 6 7 2 1
14,5 24,5 34,5 44,5 54,5
(PM-14,5)= Yi 10 0 1 2 3 4
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Passo 02) Construir a coluna Yi.fi Xi 9,5 19,5 29,5 39,5 49,5
!--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi
PM
4 6 7 2 1 n=20
14,5 24,5 34,5 44,5 54,5
(PM-14,5)= Yi 10 0 1 2 3 4
Yi.fi 0 6 14 6 4 30
Passo 03) Aplicar a fórmula da Média para a Variável Transformada Yi:
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠
Æ
Y =(30/20)
Æ
Y =1,5
Passo 04) Desenhar os Caminhos de Ida e de Volta e encontrar o X Caminho de Ida 1º)(-14,5)
X =?
e
2º)(÷10)
Xi
Yi 2º)(+14,5)
e
Y = 1,5
1º)(x10)
Caminho de Volta Daí, percorrendo o Caminho de Volta, teremos: 1º)(x10)Æ 1,5x10=15,0
e 2º)(+14,5)Æ 15,0+14,5=29,5 Æ X = 29,5
Æ Cálculo da Moda: Passo 01) Encontrar a Classe Modal (a de maior fi!): Xi 9,5 !--19,5 !--29,5 !--39,5 !--49,5 !--Para a qual teremos:
fi 19,5 4 29,5 6 7 39,5 Æ Classe Modal! Æ (a de maior fi) 2 49,5 1 59,5 linf=29,5 e h=10
Passo 02) Identificar os elementos da fórmula de Czuber: Δa e Δp
9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 2 1
Æ Classe Anterior: Δa=7-6 Æ Δa=1 Æ Classe Modal! Æ Classe Posterior: Δp=7-2 Æ Δp=5
Pág. 11 de 14
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 12 de 14
Passo 03) Aplicar a fórmula da Moda de Czuber:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ a p Δ + Δ ⎠ ⎝
Segundo Czuber, teremos que:
⎛ 1 ⎞ ⎟ ⋅ 10 ⎝1+ 5 ⎠
Daí: Mo = 29,5 + ⎜
Æ
E: Mo=31,17
Æ Cálculo da Mediana: Passo 01) Achar a Classe Mediana: 9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 2 1 n=20
Achamos que: n=20 e (n/2)=10 Daí: 9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
fi 4 6 7 2 1 n=20
fac↓ 4 10 17 19 20
Daí: fi Fac↓ 4 4 Æ 4 é ≥ 10? NÃO! 6 10 Æ 10 é ≥ 10? SIM! 7 17 É o quê? É IGUAL!! 2 19 1 20 n=20 De acordo com a 2a Regra de Ouro da Mediana que aprendemos, quando a resposta às perguntas acima for “SIM” e o valor da fac for exatamente IGUAL ao valor de (n/2), já afirmaremos que a Mediana será o limite superior da classe correspondente! Estamos todos lembrados disso? Daí: Md=29,5 9,5 19,5 29,5 39,5 49,5
Xi !--!--!--!--!---
19,5 29,5 39,5 49,5 59,5
Caso não nos lembremos desta Dica de Ouro (o que será uma lástima!), só nos restará aplicar a fórmula da Mediana! E teremos: Passo 02) Aplicar a fórmula da Mediana!
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 13 de 14
Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ Md = 19,5 + ⎡ 20 − 4 ⎤ ⋅ 10 Æ Daí: Md=29,5 ⎢⎣ 6 ⎥⎦ ⎥ ⎥ ⎦
Æ Análise da Relação Média-Moda-Mediana: Colocando os valores encontrados em ordem crescente, teremos:
X = 29,5 Æ
Md=29,5
Æ
Mo=31,17
Aqui surgiu um caso interessante! Vemos que a Média e a Mediana têm o mesmo valor! Este é um caso extremo (e pouco comum!) e quando acontecer, no momento desta análise, apenas colocaremos a Mediana no meio, entre a Média e a Moda, exatamente como já vínhamos fazendo! Daí, só nos restará fazer a pergunta de praxe: A Média X está à esquerda ou à direita dos valores? Como a resposta é “à esquerda”, novamente concluímos: estamos diante de uma Distribuição de Freqüências Assimétrica à Esquerda, ou de Assimetria Negativa!
05. Trabalhe a Distribuição abaixo:
30 40 50 60 70 80 90 100 110
Xi !--- 40 !--- 50 !--- 60 !--- 70 !--- 80 !--- 90 !--- 100 !--- 110 !--- 120
fi 1 3 7 11 14 11 7 3 1
Sol.: Na realidade esta questão está aqui apenas como “figurante”! É claro que antes de começarmos a encontrar os valores das Medidas de Tendência Central, nossa primeira preocupação será verificar – pela análise da coluna da fi – se a distribuição é simétrica ou não! E aí já matamos a charada! Estamos diante de uma distribuição de freqüências simétrica! Concluímos, pois, que Média, Moda e Mediana terão o mesmo valor. Como neste caso temos um número ímpar de classes, as três medidas serão iguais ao Ponto Médio da classe intermediária. Ou seja:
X = Md = Mo = 75 Por hoje é só! Na próxima aula (espero que amanhã!), faremos nosso primeiro simulado, envolvendo questões que abrangem tudo o que foi visto até aqui!
ESTATÍSTICA
*** Ponto 19 - EXERCÍCIOS DA RELAÇÃO ENTRE MÉDIA, MODA E MEDIANA***
Pág. 14 de 14
Quero dizer a todos da imensa satisfação que senti ontem, ao abrir a página do Site e encontrar a foto do novo colaborador do Ponto, o meu velho e grande amigo Prof. João Antônio. (Já havia feito referência a ele, no final do Ponto 11, quando mandei uma série de abraços!). Quando eu ainda morava no Recife, o bom Deus me concedeu a alegria de conhecer o João e de nos tornarmos próximos, como se fôssemos irmãos! Amizades à parte, vocês todos terão a oportunidade de desfrutar do profundo conhecimento de Informática que ele possui e, sobretudo, irão usufruir do seu magnífico dom de transmitir a matéria, de forma a torná-la descomplicada e agradável! Joãozinho, meu irmão, um abraço imenso deste que sempre torceu e continua torcendo pelo seu sucesso, mais que merecido! Que Deus o ilumine sempre mais! Estamos todos de parabéns com sua chegada! Essa minha aula de hoje eu a dedico a você. Seja bem-vindo! Agora aos alunos silenciosos: por favor, não esqueçam de me escrever avisando se houve problemas para acessar a aula passada (Ponto 18). É importante que todos os que vêm acompanhando nosso curso não percam nenhuma aula! Estou aguardando a resposta de vocês. Quero ainda agradecer ao Prof. Vicente, pela referência que fez em seu último Ponto, sobre a boa aceitação que têm tido minhas aulas por todo o País. Fico sinceramente muito feliz e muito grato pelo retorno carinhoso que tenho recebido de todos. Espero continuar ajudando da melhor forma possível! Fico hoje por aqui! Um forte abraço a todos e até a próxima!
ESTATÍSTICA
*** Ponto 20 – SIMULADO 01 ***
Pág. 1 de 9
SIMULADO Nº01 IMPORTANTE: LEIA A PÁGINA 2 ANTES DE COMEÇAR A RESOLVER O SIMULADO!!
O enunciado abaixo aplica-se às questões 01 a 05: Realizou-se uma pesquisa com os funcionários de uma determinada fábrica, questionando-se acerca do peso dos operários, no intuito de se implementar um certo “programa de orientação alimentar” naquela empresa. Os resultados obtidos foram dispostos na tabela abaixo. Considere-se que a coluna S se refere a uma freqüência acumulada. Peso dos operários (Kg) 35,5 !--- 50,5 50,5 !--- 65,5 65,5 !--- 80,5 80,5 !--- 95,5 95,5 !--- 110,5 110,5 !--- 125,5
S 200 185 125 53 10 2
01. Determine o valor correspondente ao peso médio deste conjunto: a) 68,42 d) 71,13 b) 73,25 e) 69,05 c) 78,42
02. Determine o percentual de operários com peso acima de 60 e abaixo de 100 quilogramas: a) 69,7% d) 72,4% b) 75,8% e) 71,3% c) 63,8%
03. Determine o valor correspondente à Moda do conjunto: a) 64,32 b) 69,89 c) 84,25 d) 82,11
e) 63,69
04. Determine para o conjunto o peso que corresponde ao valor do segundo quartil: a) 67,38 b) 72,45 c) 70,71 d) 68,62 e) 73,24 05. Assinale a assertiva correta: a) O conjunto apresenta assimetria negativa, ou curva assimétrica à direita; b) O conjunto apresenta assimetria positiva, ou curva assimétrica à esquerda; c) O conjunto é perfeitamente simétrico; d) O conjunto apresenta curva assimétrica à esquerda, ou assimetria negativa; e) O conjunto apresenta curva assimétrica à direita, ou assimetria positiva.
ESTATÍSTICA
*** Ponto 20 – SIMULADO 01 ***
Pág. 2 de 9
Obs.: LEIA AGORA, ANTES DE RESOLVER AS QUESTÕES!! Olá, meus amigos! Desculpem a ausência nesses últimos dias! Também me entristeço muito quando não consigo colocar as aulas aqui no Site com a freqüência que desejaria! Mas, “devagar e sempre” a gente chega lá... Conforme prometido na última aula, prosseguiremos hoje fazendo um pequeno simulado – algumas questões que eu criei – e que abrangem os assuntos vistos até aqui. Acredito na eficácia dos bons simulados, pois eles têm o condão de dar confiança ao aluno. O ideal é que cada um tire um tempinho para resolver essas questões, como se estivesse mesmo fazendo a prova. Convém marcar o tempo de resolução, somente para efeito de saber como anda nossa velocidade!! Não haverá limite de tempo para esse primeiro simulado. Entenda-se: você irá marcar o tempo gasto para resolver tudo, porém esse tempo é livre! Ao final das questões, direi algo sobre o tempo ideal para a resolução desse teste. Propositadamente, eu deixei as questões do simulado na página 01, para que vocês possam imprimi-la e resolvê-la, sem ter a tentação de ficar olhando as resoluções das questões, que seguirão abaixo! Isso não é cinema, mas não esqueçam de desligar seus celulares antes de começar a resolver o simulado! Podem começar a prova e boa sorte a todos!
Obs.: LEIA DEPOIS, QUANDO TERMINAR DE RESOLVER AS QUESTÕES!! Pronto! Só isso. Muitos de vocês podem até pensar assim: “essa demora toda para colocar o simulado, e quando coloca é só isso?” E eu respondo: se vocês tiverem acertado as cinco questões acima, sem dificuldades, e sem maiores problemas, então meu objetivo está sendo alcançado! E eu explico a razão: normalmente, dentre as questões de uma prova de Estatística da ESAF, pelo menos três das primeiras são extremamente parecidas com estas apresentadas acima! Ora, concluímos pois que já conseguimos “matar” algo em torno de 40% da prova!! E ainda estamos na aula 20! Quando virmos, nas próximas aulas, as medidas separatrizes e as medidas de dispersão, este percentual subirá para 80%! Talvez muitos não estejam se dando conta, mas aos pouquinhos vamos “fechar” toda a prova. Seguem agora o gabarito do simulado e as resoluções detalhadas das questões! GABARITO) 01)D
02)A
03)B
04)C
05)E
RESOLUÇÃO DO SIMULADO Peso dos operários (Kg) 35,5 !--- 50,5 50,5 !--- 65,5 65,5 !--- 80,5 80,5 !--- 95,5 95,5 !--- 110,5 110,5 !--- 125,5
S 200 185 125 53 10 2
ESTATÍSTICA
*** Ponto 20 – SIMULADO 01 ***
Pág. 3 de 9
Questão 01) Sol.: A questão pede que se determine a Média do conjunto! Sabemos, porém, que a Média (bem como as outras medidas de posição) só poderá ser encontrada após construirmos a coluna da freqüência absoluta simples, fi! O primeiro passo, portanto, seria descobrir qual foi esta coluna S fornecida pelo enunciado e, a partir desta, chegarmos à fi! E o enunciado foi explícito, ao afirmar que “a coluna S se refere a uma freqüência acumulada”. Primeira pergunta: será uma freqüência absoluta ou relativa? Uma vez que inexiste qualquer “sinal” que nos indique se tratar de uma freqüência relativa, concluímos que estamos diante de uma coluna de freqüência absoluta! Para saber se a freqüência é acumulada crescente ou decrescente, basta olhar para os valores da coluna, e verificar se estão aumentando ou diminuindo. Uma vez que os valores estão se reduzindo, concluímos: a coluna S é uma coluna de freqüência absoluta acumulada decrescente – fad! Com esta descoberta, já podemos tratar a coluna pela nomenclatura que conhecemos. Teremos, então: Peso dos operários (Kg) 35,5 !--- 50,5 50,5 !--- 65,5 65,5 !--- 80,5 80,5 !--- 95,5 95,5 !--- 110,5 110,5 !--- 125,5
fad↑ 200 185 125 53 10 2
Partindo da fad e seguindo o caminho das pedras pelo sentido de volta, encontraremos a coluna da fi, lembrando que ambas as colunas terão o mesmo valor na última classe. Na seqüência, faremos sempre: “próxima fad menos fad anterior”, e assim construiremos a nossa fi. Teremos, portanto: Peso dos operários (Kg) 35,5 !--- 50,5 50,5 !--- 65,5 65,5 !--- 80,5 80,5 !--- 95,5 95,5 !--- 110,5 110,5 !--- 125,5
fad↑
fi
200 185 125 53 10 2
15 60 72 43 8 2
Feito isso, usaremos o processo da Variável Transformada para determinar a Média! Para tanto, encontraremos a coluna dos Pontos Médios dessa distribuição de freqüências. Teremos: Peso dos operários (Kg) 35,5 !--- 50,5 50,5 !--- 65,5 65,5 !--- 80,5 80,5 !--- 95,5 95,5 !--- 110,5 110,5 !--- 125,5
fad↑
fi
PM
200 185 125 53 10 2
15 60 72 43 8 2
43 58 73 88 103 118
Observemos que para construir essa coluna dos Pontos Médios, só tivemos que calcular o primeiro PM, fazendo: PM=(linf+lsup)/2. Daí, encontramos que: PM=(35,5+50,5)/2 Æ E: PM=86/2 Æ E: PM=43.
ESTATÍSTICA
*** Ponto 20 – SIMULADO 01 ***
Pág. 4 de 9
Na seqüência, saímos apenas somando o PM com o valor do h (Amplitude da Classe!). Neste caso, temos que h=15. Foi só sair somando! Continuando a resolução, o próximo passo seria construir a Coluna de Transformação! Todos lembrados? A sugestão para construir essa coluna é sempre a mesma: 1o) Fazer (PM-1oPM) 2o)Dividir por h. Daí, teremos: Peso dos operários (Kg) 35,5 !--- 50,5 50,5 !--- 65,5 65,5 !--- 80,5 80,5 !--- 95,5 95,5 !--- 110,5 110,5 !--- 125,5
fad↑
fi
PM
200 185 125 53 10 2
15 60 72 43 8 2
43 58 73 88 103 118
(PM-43)=Yi 15 0 1 2 3 4 5
Prosseguindo, construiremos a coluna do (Yi.fi), para fim de determinarmos a Média da Variável Transformada Yi. Teremos: Peso dos operários (Kg) 35,5 !--- 50,5 50,5 !--- 65,5 65,5 !--- 80,5 80,5 !--- 95,5 95,5 !--- 110,5 110,5 !--- 125,5
fad↑
fi
PM
200 185 125 53 10 2
15 60 72 43 8 2 n=200
43 58 73 88 103 118
(PM-43)=Yi 15 0 1 2 3 4 5
Yi.fi 0 60 144 129 32 10 375
Agora restava aplicar a fórmula da Média para a Variável Transformada, para encontrarmos que:
⎡ ∑ Yi. fi ⎤ Y =⎢ ⎥ ⎣⎢ n ⎦⎥
Æ
⎡ 375 ⎤ Æ Y =⎢ ⎣ 200 ⎥⎦
E: Y = 1,88
Neste momento, precisaríamos nos lembrar dos Caminhos de Ida e de Volta que utilizamos para sair da variável original e chegar à variável transformada, e desta retornar à primeira! Teremos que: Caminho de Ida 1º)(-43)
X =?
e
2º)(÷15)
Xi
Yi 2º)(+43)
e
Y = 1,88
1º)(x15)
Caminho de Volta Daí, percorrendo o Caminho de Volta, sempre nos recordando das propriedades da Média, que é influenciada pelas quatro operações matemáticas, teremos: 1º)(x15)Æ 1,88x15=28,13
e 2º)(+43)Æ 28,13+43=71,13 que é nosso X !
Daí: X = 71,13 Æ Resposta da Questão! Æ Opção D
ESTATÍSTICA
*** Ponto 20 – SIMULADO 01 ***
Pág. 5 de 9
Questão 02) Sol.: A questão pede que se determine o percentual de operários com peso acima de 60 e abaixo de 100kg! Como se deseja um valor percentual, imediatamente raciocinamos que teremos que trabalhar com a freqüência relativa, Fi! Daí, nosso primeiro passo será esse: construir a coluna da freqüência relativa simples! Teremos: Peso dos operários (Kg) 35,5 !--- 50,5 50,5 !--- 65,5 65,5 !--- 80,5 80,5 !--- 95,5 95,5 !--- 110,5 110,5 !--- 125,5
fi
Fi
15 60 72 43 8 2
7,5% 30% 36% 21,5% 4% 1%
Observemos que para construir a coluna da Fi, usamos apenas a relação que há entre as duas freqüências simples: a absoluta fi e a relativa Fi. E a relação é a seguinte: Fi=fi/n Ora, ao começarmos a fazer nossas contas, verificamos que o resultado seria sempre a divisão do fi por 2, acrescido do sinal de porcentagem! Senão, vejamos: Para a 1a Classe Æ Fi = 15 / 200 = 0,075 = 7,5% Para a 2a Classe Æ Fi = 60 / 200 = 0,30 = 30% ... e assim por diante! Feito isso, vamos descobrir quais as classes que resposta, seja integralmente, seja parcialmente! Teremos: Peso dos operários (Kg) 35,5 !--- 50,5 50,5 !--- 65,5 65,5 !--- 80,5 80,5 !--- 95,5 95,5 !--- 110,5 110,5 !--- 125,5
fi
Fi
15 60 72 43 8 2
7,5% 30% 36% 21,5% 4% 1%
Æ Æ Æ Æ
participa participa participa participa
participarão
desta
parcialmente da resposta! integralmente da resposta! integralmente da resposta! parcialmente da resposta!
Teremos que nos preocupar com as duas classes que participarão apenas parcialmente do resultado final! Como são duas, teremos que fazer duas regras-detrês, para descobrir o percentual de participação de cada uma dessas classes! Æ Trabalho com a 2a Classe (50,5 !-- 65,5): O raciocínio é o seguinte: a classe toda tem amplitude h=15 e Fi=30%. A amplitude desejada nesse caso envolverá apenas os valores maiores que 60. Ora, maiores que 60, teremos os valores de 60 a 65,5. Ou seja, para a questão nos interessará trabalhar nesta classe com uma amplitude “quebrada”, de 5,5. (Uma vez que 65,5-60=5,5). Daí, nossa regra de três será a seguinte: h 15 --5,5 ---
Fi 30% X%
ESTATÍSTICA
*** Ponto 20 – SIMULADO 01 ***
Pág. 6
de
9
Assim, encontraremos que: X = (5,5.30)/15 Æ E: X=11% Ou seja: a segunda classe participará da resposta com apenas 11% dos elementos do conjunto! Æ Trabalhando com a 5ª Classe (95,5 !— 110,5): O raciocínio é semelhante. Na primeira linha da regra de três, trabalhamos com a classe inteira, ou seja, a amplitude “integral” e a freqüência relativa “integral” da classe! Assim, nossa primeira linha sera: 15 --- 4% A segunda linha da regra de três levará em conta a classe “quebrada”, de acordo com o que pede o enunciado. E a questão pede percentual abaixo de 100 kg. Abaixp de 100kg na quinta classe, teremos os valores de 95,5 a 100. Logo, a amplitude desejada pela questão para esta classe neste momento será a diferença (100 menos 95,5), ou seja: 4,5! Daí, nossa segunda linha será a seguinte: 4,5 --- Y% Agora a regra de três completa: 15 --- 4% 4,5 --- Y% Daí:
Y=(4,5.4)/15
Æ
E: Y=1,2%
Ou seja: desta quinta classe, apenas 1,2% participará da resposta! Finalmente, juntando pretendido, teremos que:
as
participações
das
quatro
classes
no
resultado
Æ Æ Æ Æ
Segunda classe: (50,5|--- 65,5) Æ 11% elementos (X=11%) Terceira classe:(65,5|--- 80,5) Æ 36% dos elementos (Fi=36%) Quarta classe: (80,5|--- 95,5) Æ 21,5% dos elementos (Fi=21,5%) Quinta classe: (95,5|--- 110,5)Æ 1,2% dos elementos (Y=1,2%) ----------------------Total do percentual de elementos: 69,7% elementos Daí: Æ Resposta da questão = 69,7% Æ Opção A
Questão 03) Sol.: A questão pede o cálculo da Moda! Como não foi especificada qual das duas fórmulas deve ser empregada – Czuber ou King – utilizaremos o método de Czuber! Isso o faremos sempre que o enunciado silenciar acerca da fórmula a ser utilizada! Ou seja: a regra é Czuber; a exceção é King, quando vier explicitado no enunciado! Só tínhamos aqui que seguir aqueles passos já nossos conhecidos!
ESTATÍSTICA
*** Ponto 20 – SIMULADO 01 ***
Pág. 7 de 9
i) Determinação da Classe Modal:
35,5 50,5 65,5 80,5 95,5 110,5
Xi !--!--!--!--!--!---
fi 15 60 72 43 8 2
50,5 65,5 80,5 95,5 110,5 125,5
Æ Classe Modal! Æ (a de maior fi)
Para a qual teremos: linf=65,5 e h=15 ii) Elementos da fórmula de Czuber: Δa e Δp
35,5 50,5 65,5 80,5 95,5 110,5
Xi !--!--!--!--!--!---
50,5 65,5 80,5 95,5 110,5 125,5
fi 15 60 72 43 8 2
Æ Classe Anterior: Δa=72-60 Æ Δa=12 Æ Classe Modal! Æ Classe Posterior: Δp=72-43 Æ Δp=29
iii) Cálculo da Moda de Czuber:
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
Segundo Czuber, teremos que:
⎛ 12 ⎞ ⎟ ⋅ 15 ⎝ 12 + 29 ⎠
Daí: Mo = 65,5 + ⎜
Æ
E: Mo=69,89 Æ Resposta! Æ Opção B.
Acontece, porém, que nada deste trabalho seria necessário!! Bastava colocar o olho na coluna da fi, descobrir que a Classe Modal era a terceira (uma vez que apresentava a maior fi) e observar o seguinte: a Classe Modal vai de 65,5 a 80,5, logo a Moda tem, necessariamente, que estar incluída neste intervalo!! Olhando rapidamente as opções de resposta, concluiríamos que a única resposta possível seria a opção B (69,89), por ser o único valor inserido no intervalo da Classe Modal! Traduzindo: essa questão se faz em 20 segundos! (Ou menos!).
Questão 04) Sol.: A questão pede o cálculo do Segundo Quartil! Já aprendemos que a Mediana tem “outros nomes”, e que será coincidente com algumas outras Medidas Separatrizes. Só teríamos que recordar que: Mediana = 2o Quartil = 5o Decil = 50o Percentil
Em suma: o enunciado está pedindo o valor da Mediana! Daí, não tem segredo! Basta seguirmos os passos já aprendidos! Teremos:
ESTATÍSTICA
*** Ponto 20 – SIMULADO 01 ***
Pág. 8 de 9
1o Passo) Determinar o “n” e (n/2):
35,5 50,5 65,5 80,5 95,5 110,5
Logo: n=200
Xi !--!--!--!--!--!---
50,5 65,5 80,5 95,5 110,5 125,5
fi 15 60 72 43 8 2 n=200
e (n/2)=100
2o Passo) Construir a fac!
35,5 50,5 65,5 80,5 95,5 110,5
Xi !--!--!--!--!--!---
50,5 65,5 80,5 95,5 110,5 125,5
fi 15 60 72 43 8 2 n=200
fac↓ 15 75 147 190 198 200
3o Passo) Comparar os valores da fac com o valor de referência (n/2), usando a pergunta de praxe, e localizar a Classe Mediana!
35,5 50,5 65,5 80,5 95,5 110,5
Xi !--!--!--!--!--!---
50,5 65,5 80,5 95,5 110,5 125,5
fi 15 60 72 43 8 2 n=200
fac↓ 15 75 147 190 198 200
Æ 15 é ≥ 100? NÃO! Æ 75 é ≥ 100? NÃO! Æ 147 é ≥ 100? SIM!
Daí, achamos a Classe Mediana, que é a terceira: (60,5 !-- 80,5)! 4o Passo) Aplicar a fórmula da Mediana! Teremos:
⎡⎛ n ⎞ ⎤ ⎢ ⎜ 2 ⎟ − fac ANT ⎥ ⎥⋅h Æ Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎥ ⎢⎣ ⎥⎦
⎡100 − 75 ⎤ ⋅ 15 Md = 65,5 + ⎢ ⎣ 72 ⎥⎦
Æ Daí: Md=70,71 Æ Resposta! Æ Opção C.
Ocorre que, também nesta questão, se formos atentos, não precisaremos fazer conta nenhuma!! Claro que não! Aprendemos, há bem pouco tempo, que existe uma relação entre os valores das Medidas de Posição e o comportamento da assimetria do conjunto! Estamos lembrados disso?
ESTATÍSTICA
*** Ponto 20 – SIMULADO 01 ***
Pág. 9 de 9
E vimos que existem três situações quanto à assimetria de uma distribuição: 1ª) Distribuição Simétrica: Média = Moda = Mediana 2ª) Distribuição Assimétrica Positiva: Moda < Mediana < Média 3ª) Distribuição Assimétrica Negativa: Média < Mediana < Moda. Ora, aprendemos já há várias aulas (Ponto 10) que é muito fácil identificar quando a distribuição é simétrica! Basta analisar a coluna da fi, usando a Técnica do Elevador (subindo e descendo um andar e coisa e tal). Imediatamente verificamos que nossa distribuição não é simétrica, restando pois as duas situações de assimetria – positiva ou negativa. Conforme acabamos de ver, nestas duas situações de assimetria, teremos que o valor da Mediana é sempre intermediário, ou seja, estará entre os valores da Média e da Moda! Ora, nas questões 01 e 03 deste simulado, já encontramos os valores da Média e da Moda! São eles: Média = 71,13 e Moda=69,89. Conclusão: o valor da Mediana só poderá estar entre estes limites, ou seja, entre 69,89 e 71,13 (Moda e Média, respectivamente!). Analisando as opções de resposta, matamos a charada: a única resposta com valor no intervalo acima será a opção C, que é exatamente 70,71. Todas as demais respostas ou estavam abaixo de 69,89 ou acima de 71,13! Em suma: levaríamos algo em torno de 40 segundos para acertar essa questão!
Questão 05) Sol.: Esta questão já está praticamente resolvida, pela explicação que fizemos acima (para a questão 04)! Para identificarmos a situação de assimetria do conjunto, só teremos que comparar os valores de duas medidas de posição! Neste caso, já dispomos das três medidas, então as utilizaremos, colocando-as em ordem crescente. Ficamos assim: Moda=69,89
Æ
Mediana=70,71
Æ
Média = 71,13
Daí, recordaremos que a Média é quem dita a resposta: Média na direita implica curva assimétrica à direita; Média na esquerda implica curva assimétrica à esquerda. Concluímos, portanto, que nosso conjunto apresenta Assimetria Positiva, ou Curva Assimétrica à Direita! Æ Resposta! Æ Opção E.
Ficamos hoje por aqui! Cada um fará sua análise, de como se saiu no simulado, questionando-se se conseguiu se lembrar dos detalhes todos, das fórmulas, dos passos, enfim, se os procedimentos das resoluções já estão viajando pela corrente sangüínea. Caso isso ainda não tenha acontecido, minha recomendação é de uma nova revisão! E das boas! Principalmente porque estaremos ingressando nas Medidas de Dispersão, e o volume de informações que vamos receber aumentará consideravelmente! Desejo a todos, portanto, uma boa revisão! Um forte abraço e até a próxima!
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 1 de 15
MEDIDAS SEPARATRIZES Olá, meus amigos! Todos bem? Como nos saímos no simulado? Até o momento não tive nenhum retorno sobre isso...! Hoje, veremos com mais detalhes as Medidas Separatrizes - último passo antes de adentrarmos no estudo das Medidas de Dispersão. Em uma aula passada (Ponto 15), quando iniciamos o estudo da Mediana, já havíamos feito as primeiras considerações acerca das Medidas Separatrizes, afirmando que são também Medidas de Posição (assim como as Medidas de Tendência Central - Média, Moda e Mediana!). Vimos também que a Mediana classifica-se tanto como medida de tendência central, quanto como medida separatriz, e que as separatrizes - como o próprio nome sugere - são aquelas medidas que "separam" ou que dividem o conjunto em um certo número de partes iguais. No caso da Mediana, vimos que ela divide o conjunto em duas metades. Já o Quartil, separa o conjunto em quatro partes iguais; o Decil, em dez partes e, finalmente, o Centil (ou Percentil), em cem partes iguais! Recordando disso, lembraremos também que aprendemos uma relação importantíssima entre as quatro Medidas Separatrizes. Na verdade é uma relação até visual, que não precisamos fazer esforço para "decorar", bastando traçar uma reta (que representará o conjunto), e depois fazer as divisões, exatamente como mostramos no Ponto 15 e transcrevemos abaixo:
!-------------------!-------------------! Md !---------!---------!---------!---------! Q1 Q2 Q3 !---!---!---!---!---!---!---!---!---!---! D1 D2 D3 D4 D5 D6 D7 D8 D9 !---!---!---!---!---!---!---!---!---!---! C10 C20 C30 C40 C50 C60 C70 C80 C90
Daí, concluímos sem maiores dificuldades que: Md = Q2 = D5 = C50
A Mediana já sabemos como calcular! E as outras medidas separatrizes? Aprenderemos agora! # Determinação do Quartil Já sabemos que para dividir um conjunto em quatro partes iguais, precisamos marcar três pontos apenas (como vimos no desenho acima!). Portanto, já sabemos que existem três quartis, os quais designaremos por Q1 (primeiro quartil), Q2 (segundo quartil) e Q3 (terceiro quartil).
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 2 de 15
Quando estudamos a Mediana, vimos que as questões que exigiam o cálculo desta medida costumavam dizer apenas algo como "determine o valor da Mediana deste conjunto" (e só!). Isso porque existe somente uma Mediana! Porém, em se tratando do Quartil, o enunciado jamais poderia dizer apenas "determine o valor do Quartil". Se assim o fizesse, ficaria no ar a pergunta: "Qual deles?". Se existem três quartis, uma questão de prova teria, logicamente, que explicitar qual deles está exigindo. Ocorre que, normalmente, as provas da ESAF não contemplam as Medidas Separatrizes como uma questão exclusiva. Explicando melhor: não costuma cair uma questão exigindo que se calcule este ou aquele quartil, este ou aquele decil... O que se pede é que se determine, por exemplo, o coeficiente percentílico de Assimetria, ou o coeficiente percentílico de Curtose. Ainda nem estudamos esses assuntos - Assimetria e Curtose -, mas já posso adiantar que na determinação desses referidos coeficientes, se fará necessário o conhecimento das Medidas Separatrizes! Em suma: os quartis, decis e percentis serão, normalmente, calculados como um meio para se chegar ao fim desejado pelo enunciado. Este fim será, provavelmente, um coeficiente de Assimetria ou de Curtose (assuntos que veremos em breve!). Outra coisa importante: quem sabe calcular a Mediana, fatalmente não terá dificuldades em aprender a determinar as outras medidas separatrizes! Daremos ênfase à determinação do Quartil, Decil e Percentil no âmbito das Distribuições de Freqüências, que é a forma comumente exigida em prova. Lembremos de como se acha a Mediana para uma Distribuição de Freqüências! Por primeiro, temos que encontrar a Classe Mediana. Para isso, fazemos a conta (n/2) - independentemente de n ser um valor par ou ímpar - e depois comparamos este valor (n/2) com os valores da coluna de freqüência absoluta acumulada crescente (fac), fazendo a pergunta de praxe que aprendemos: "esta fac é maior ou igual a (n/2)?". Repetiremos a pergunta até que a resposta seja afirmativa. Daí, a classe correspondente será a classe Mediana. # Calculando o Primeiro Quartil - Q1: Pois bem! Para calcular o primeiro quartil, temos antes que determinar qual será a Classe do Primeiro Quartil! Lembremos que no caso da Mediana, a primeira conta que fazíamos era (n/2)! Dividíamos o n por 2, exatamente porque a Mediana divide o conjunto em duas partes! Agora, sabemos que o Quartil divide o conjunto em quatro partes! Portanto, a conta que faremos (para o primeiro quartil) é a seguinte: (n/4) Para fazer esta conta, também não nos preocuparemos se n é um valor par ou ímpar (da mesma forma da Mediana!). Feita esta continha, passaremos a comparar seu resultado com os valores da fac, exatamente da mesma forma que fizemos para achar a Classe Mediana! A pergunta, agora adaptada ao Quartil, será a seguinte: Esta fac é maior ou igual a (n/4)? Enquanto a resposta for negativa, passaremos para a classe seguinte, e repetiremos a pergunta, até o momento em que a resposta for SIM! Ao chegarmos à
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 3 de 15
resposta afirmativa, pararemos e procuraremos a classe correspondente. Esta será a Classe do Primeiro Quartil! Ou seja, será desta classe que iremos extrair os dados para usar na fórmula do Q1! Vejamos que, até aqui, a única diferença observada nos passos para achar o Quartil e a Mediana, foi que agora fazemos (n/4) - em vez de (n/2) - e comparamos este (n/4) com a coluna da fac! Uma vez constatada qual é a Classe do Primeiro Quartil, só nos restará aplicar a fórmula! A facilidade em se memorizar a fórmula do Q1 é absoluta! Vamos recordar a fórmula da Mediana:
⎡⎛ n ⎞ ⎤ ⎢ ⎜ 2 ⎟ − fac ANT ⎥ ⎥⋅h Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎥ ⎢⎣ ⎥⎦ Agora é só pensar o seguinte: o que mudou até aqui para o Quartil foi que (n/2) passou a ser (n/4). Então também será apenas isso que irá mudar na fórmula. Daí, o primeiro quartil será determinado por:
⎡⎛ n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q1 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Ora, esta fórmula nos fala em limite inferior (linf), nos fala em amplitude da classe (h), além de duas freqüências - fi e facANT. A única coisa que teremos que lembrar é que todos esses dados serão retirados, tomando como referência a Classe do Primeiro Quartil. Em suma, os passos para determinação do Q1 de um conjunto serão os seguintes: Æ Determinamos o n (somando a coluna da fi); Æ Calculamos o valor de (n/4) (independentemente de n ser par ou ímpar!); Æ Construímos a coluna da fac; Æ Comparamos o valor do (n/4) com os valores da fac, iniciando da fac da primeira classe (a mais de cima!) e fazendo a seguinte pergunta: "esta fac é maior ou igual a (n/4)?". Se a resposta for NÃO, passamos à fac da classe seguinte. Quando a resposta for SIM, pararemos e procuraremos a classe correspondente! Esta será a nossa Classe do Primeiro Quartil. Æ Finalmente, aplicaremos a fórmula do Q1, extraindo os dados desta classe do Q1, que acabamos de encontrar! Novamente a fórmula:
⎡⎛ n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q1 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Só isso! Vamos a um exemplo! Exemplo: Para o conjunto abaixo, determine o valor do primeiro quartil!
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
Pág. 4 de 15
fi 2 5 8 6 3
Sol.: 1º Passo) Encontraremos n e calcularemos (n/4):
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3 n=24
Daí, achamos que n=24 e, portanto, (n/4)=6 2º Passo) Construímos a fac:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3 n=24
fac 2 7 15 21 24
3º Passo) Comparamos os valores da fac com o valor de (n/4), fazendo a pergunta de praxe, adaptada ao primeiro quartil:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3 n=24
fac 2 7 15 21 24
Æ 2 é maior ou igual a 6? NÃO! Æ 7 é maior ou igual a 6? SIM!
Como a resposta foi afirmativa na segunda fac, procuramos a classe correspondente (10 !--- 20) e dizemos que esta será nossa Classe do Primeiro Quartil! 4º Passo) Só nos resta agora aplicar a fórmula do Primeiro Quartil, tomando como referência a Classe do Q1, que acabamos de encontrar! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q1 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ 6 − 2⎤ ⎥ ⋅ h Æ Q1 = 10 + ⎡ ⋅ 10 Æ E: Q1=18 ⎢ ⎥ ⎣ 5 ⎥⎦ ⎥ ⎦
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 5 de 15
Somente isso! # Calculando o Segundo Quartil e o Terceiro Quartil: A determinação do Q2 e do Q3 é semelhante à do Q1, com uma pequena diferença! É preciso sabermos do seguinte: O que irá ser alterado na determinação do cálculo destas medidas separatrizes é exatamente aquela fração que aparece no numerador da fórmula! No caso da Mediana, a fração é (n/2); No caso do primeiro quartil, é (n/4). E nos demais quartis, como será? Para o segundo quartil, repete-se o (n/4) do primeiro quartil e põe-se um algarismo 2 (de Q2) no numerador, junto ao n! Assim, teremos: Æ Fração do Segundo Quartil: Q2 Æ (2n/4) = (n/2) Daí, a fórmula do Segundo Quartil - Q2 - é a seguinte:
⎡ ⎛ 2n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q 2 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Æ
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT ⎝ ⎠ Ou seja: Q 2 = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h = Mediana! ⎥ ⎥ ⎦
E disso já sabíamos: o Segundo Quartil é a própria Mediana! Portanto, não vacilaremos na prova! Se o enunciado da questão fornecer um conjunto, e solicitar que determinemos o Q2, não nos restará qualquer dúvida: calcularemos a Mediana! Já no caso do terceiro quartil, repete-se o (n/4) do primeiro quartil e põe-se um algarismo 3 (de Q3) no numerador, ao lado do n! Teremos, pois: Æ Fração do Terceiro Quartil: Q3 Æ (3n/4) Daí, a fórmula que empregaremos para determinar o Terceiro Quartil será a seguinte:
⎡ ⎛ 3n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q3 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Ora, conhecer a fração que consta na fórmula da Medida Separatriz implica conhecer também o primeiro passo para encontrá-la! Senão vejamos: no cálculo da Mediana, calculávamos o valor de (n/2); no cálculo do Primeiro Quartil, calculávamos o valor de (n/4). Por mera dedução, o primeiro passo para encontrarmos o valor do Terceiro Quartil será exatamente calcularmos o valor de (3n/4)!
STATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 6 de 15
Os passos para determinação do Q3 serão, portanto, os seguintes: Æ Determinamos o n (somando a coluna da fi); Æ Calculamos o valor de (3n/4) (independentemente de n ser par ou ímpar!); Æ Construímos a coluna da fac; Æ Comparamos o valor do (3n/4) com os valores da fac, iniciando da fac da primeira classe (a mais de cima!) e fazendo a seguinte pergunta: "esta fac é maior ou igual a (3n/4)?". Se a resposta for NÃO, passamos à fac da classe seguinte. Quando a resposta for SIM, pararemos e procuraremos a classe correspondente! Esta será a nossa Classe do Terceiro Quartil. Æ Finalmente, aplicaremos a fórmula do Q3, extraindo os dados desta classe do Q1, que acabamos de encontrar! Novamente a fórmula:
⎡ ⎛ 3n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q3 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Neste momento, vocês todos que são bons observadores já perceberam que a única diferença verificada nos passos descritos para calcularmos o Primeiro e o Terceiro Quartil consiste naquela fração presente no numerador da fórmula de cada Medida Separatriz! Já perceberam também que esta fração é quem define tudo! Claro! Ela será o valor de referência, que utilizaremos para realizar a comparação com a coluna da freqüência absoluta acumulada crescente (fac), para efeitos de encontrarmos a Classe da Medida Separatriz, ou seja, a classe que usaremos para lançar os dados na fórmula!! Façamos um exemplo para cálculo do Q3! Exemplo: Para o conjunto abaixo, determine o valor do terceiro quartil!
0 10 20 30 40
Xi !--!--!--!--!---
fi 2 5 8 6 3
10 20 30 40 50
Sol.: 1º Passo) Encontraremos n e calcularemos (3n/4):
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
Daí, achamos que n=24 e, portanto, (3n/4)=18
fi 2 5 8 6 3 n=24
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 7 de 15
2º Passo) Construímos a fac:
0 10 20 30 40
Xi !--!--!--!--!---
fi 2 5 8 6 3 n=24
10 20 30 40 50
fac 2 7 15 21 24
3º Passo) Comparamos os valores da fac com o pergunta de praxe, adaptada ao terceiro quartil:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3 n=24
fac 2 7 15 21 24
Æ Æ Æ Æ
valor
de
(3n/4),
fazendo
a
2 é maior ou igual a 18? NÃO! 7 é maior ou igual a 18? NÃO! 15 é maior ou igual a 18? NÃO! 21 é maior ou igual a 18? SIM!
Como a resposta SIM surgiu na fac da quarta classe (30 !--- 40), diremos que esta será nossa Classe do Terceiro Quartil! 4º Passo) Aplicaremos a fórmula do Q3, usando os dados da Classe do Q3, que acabamos de identificar!
⎡ ⎛ 3n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q3 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ 18 − 15 ⎤ ⎥ ⋅ h Æ Q3 = 30 + ⎡ ⎢ ⎥ ⋅ 10 Æ E: Q3=35 ⎥ ⎣ 6 ⎦ ⎥ ⎦
Simplesmente isso! # Calculando o Primeiro Decil - D1: Vamos lá! Como já aprendemos aqui, o Decil dividirá o conjunto em dez partes iguais! Daí, a fração que constará no numerador da fórmula do Primeiro Decil será justamente (n/10)! Daí, faremos o seguinte: independentemente de n ser um valor par ou ímpar, calcularemos o valor de (n/10) e compararemos este valor com a coluna da fac! A nossa pergunta de praxe, agora adaptada ao Primeiro Decil será: "esta fac é maior ou igual a (n/10)?". E por que faremos isso? Porque precisamos encontrar a Classe do Primeiro Decil! Ou seja, precisamos identificar a classe da qual extrairemos os dados para utilizarmos na fórmula do D1!
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 8 de 15
Quando encontrarmos a Classe do D1, só teremos que aplicar a fórmula do D1. Creio que já estamos matando a charada! A fórmula do D1 será igual à da Mediana, com uma única diferença! Qual? Em lugar de (n/2), aparecerá a fração (n/10), uma vez que o Decil divide o conjunto em dez partes iguais! Estamos percebendo que os passos todos se identificam, quando se trata de determinarmos as Medidas Separatrizes! Serão, portanto, os seguintes passos adotados para cálculo do Primeiro Decil: Æ Determinamos o n (somando a coluna da fi); Æ Calculamos o valor de (n/10) (independentemente de n ser par ou ímpar!); Æ Construímos a coluna da fac; Æ Comparamos o valor do (n/10) com os valores da fac, iniciando da fac da primeira classe (a mais de cima!) e fazendo a seguinte pergunta: "esta fac é maior ou igual a (n/10)?". Se a resposta for NÃO, passamos à fac da classe seguinte. Quando a resposta for SIM, pararemos e procuraremos a classe correspondente! Esta será a nossa Classe do Terceiro Quartil. Æ Finalmente, aplicaremos a fórmula do Q3, extraindo os dados desta classe do Q1, que acabamos de encontrar! Eis a fórmula:
⎡⎛ n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D1 = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Vamos a um exemplo! Exemplo: Para o conjunto abaixo, determine o valor do primeiro decil!
0 10 20 30 40
Xi !--!--!--!--!---
fi 2 5 8 6 3
10 20 30 40 50
Sol.: 1º Passo) Encontraremos n e calcularemos (n/10):
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3 n=24
Daí, achamos que n=24 e, portanto, (n/10)=2,4
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 9 de 15
2º Passo) Construímos a fac:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3 n=24
3º Passo) Comparamos os valores da fac com pergunta de praxe, adaptada ao primeiro decil:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3 n=24
fac 2 7 15 21 24
fac 2 7 15 21 24
o
valor
de
(n/10),
fazendo
a
Æ 2 é maior ou igual a 2,4? NÃO! Æ 7 é maior ou igual a 2,4? SIM!
Achamos, portanto, que a classe correspondente (10 !--- 20) será nossa Classe do Primeiro Decil! 4º Passo) Aplicamos a fórmula do Primeiro Decil:
⎡⎛ n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D1 = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ 2,4 − 2 ⎤ ⎥ ⋅ h Æ D1 = 10 + ⎡ ⎢ 5 ⎥ ⋅ 10 Æ E: D1=10,8 ⎥ ⎣ ⎦ ⎥ ⎦
Somente isso! # Calculando os Outros Decis - D2 a D9: Creio que já estamos quase prontos para generalizar o nosso entendimento sobre as Medidas Separatrizes! Vejamos apenas o que haverá de novo na determinação dos demais Decis! Já sabemos que o que diferencia uma Medida Separatriz de outra, para fins de cáldulo, é aquela fração que aparece no numerador da fórmula! Para o Primeiro Decil (D1), essa fração é (n/10), conforme vimos acima! E para os demais Decis, qual será a fração de cada um deles? Para o segundo Decil, repete-se o (n/10) do primeiro decil e põe-se um algarismo 2 (de D2) no numerador, junto ao n! Assim, teremos: Æ Fração do Segundo Decil: D2 Æ (2n/10) Logo, para sabermos a fórmula do D2, basta repetir a fórmula da Mediana e, em lugar do (n/2), usarmos o (2n/10)! Teremos:
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
⎡ ⎛ 2n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D 2 = l inf + ⎢ fi ⎢ ⎢ ⎣
Pág. 10 de 15
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Para o terceiro Decil, repete-se o (n/10) do primeiro decil e põe-se um algarismo 3 (de D3) no numerador, junto ao n! Assim, teremos: Æ Fração do Terceiro Decil: D3 Æ (3n/10)
Daí, concluímos que a fórmula do D3 será a fórmula da Mediana com a seguinte alteração: em lugar do (n/2), usarmos o (3n/10)! Teremos:
⎡ ⎛ 3n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D3 = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
E assim por diante! Ou seja, o que irá mudar nas fórmulas dos nove Decis será apenas a fração do numerador! Seguindo o mesmo raciocínio, teremos que as frações próprias dos próximos Decis serão as seguintes: Æ Æ Æ Æ Æ Æ
Fração Fração Fração Fração Fração Fração
do do do do do do
Quarto Quinto Sexto Sétimo Oitavo Nono
Decil: Decil: Decil: Decil: Decil: Decil:
D4 D5 D6 D7 D8 D9
à à à à à à
(4n/10) (5n/10) (6n/10) (7n/10) (8n/10) (9n/10)
Então, traçaremos os passos para determinação de qualquer um dos Decis! Usaremos o artifício de substituir o número do Decil por X, de forma que encontraremos o X-ésimo Decil, ok? Os passos são os seguintes: Æ Determinamos o n (somando a coluna da fi); Æ Calculamos o valor de (Xn/10) (independentemente de n ser par ou ímpar!); Æ Construímos a coluna da fac; Æ Comparamos o valor do (Xn/10) com os valores da fac, iniciando da fac da primeira classe (a mais de cima!) e fazendo a seguinte pergunta: "esta fac é maior ou igual a (Xn/10)?". Se a resposta for NÃO, passamos à fac da classe seguinte. Quando a resposta for SIM, pararemos e procuraremos a classe correspondente! Esta será a nossa Classe do X-ésimo Decil, ou seja, a Classe do DX. Æ Finalmente, aplicaremos a fórmula do DX, extraindo os dados desta classe do DX, que acabamos de encontrar! Eis a fórmula:
⎡ ⎛ Xn ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ DX = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 11 de 15
Aproveitemos o ensejo para mais um exemplo! Exemplo: Para o conjunto abaixo, determine o valor do nono decil!
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3
Sol.: 1º Passo) Encontraremos n e calcularemos (9n/10):
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3 n=24
Daí, achamos que n=24 e, portanto, (n/10)=21,6 2º Passo) Construímos a fac:
0 10 20 30 40
Xi !--!--!--!--!---
fi 2 5 8 6 3 n=24
10 20 30 40 50
fac 2 7 15 21 24
3º Passo) Comparamos os valores da fac com o valor de (9n/10), fazendo a pergunta de praxe, adaptada ao nono decil:
0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 2 5 8 6 3
fac 2 7 15 21 24
Æ Æ Æ Æ Æ
2 é maior ou igual a 21,6? NÃO! 7 é maior ou igual a 21,6? NÃO! 15 é maior ou igual a 21,6? NÃO! 21 é maior ou igual a 21,6? NÃO! 24 é maior ou igual a 21,6? SIM!
n=24 Achamos, portanto, que a classe correspondente (40 !--- 50) será nossa Classe do Nono Decil! 4º Passo) Aplicamos a fórmula do Nono Decil:
ESTATÍSTICA
⎡ ⎛ 9n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D9 = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
⎡ 21,6 − 21⎤ ⎥ ⋅ 10 3 ⎣ ⎦
Æ D9 = 40 + ⎢
Æ
Pág. 12 de 15
E: D9=42,0
E é só! # Calculando os Percentis: Restaram agora os Percentis! Lembraremos que o Percentil (ou Centil) dividirá o conjunto em cem partes iguais! Por analogia, já podemos concluir que a fração do numerador da fórmula para o Primeiro Centil será (n/100)! E para os demais Percentis, teremos que: Æ Fração do Segundo Percentil: P2 Æ (2n/100) Æ Fração do Terceiro Percentil: P3 Æ (3n/100) Æ Fração do Quarto Percentil: P4 Æ (4n/100) . Æ Fração do Nonagésimo Percentil: P90 Æ (90n/100) . Æ Fração do Nonagésimo Oitavo Percentil: P98 Æ (98n/100) Æ Fração do Nonagésimo Nono Percentil: P99 Æ (99n/100) Daí, a seqüência de passos que usaremos para determinar os Percentis, usando o mesmo artifício para encontrarmos o X-ésimo Percentil - o PX, será a seguinte: Æ Determinamos o n (somando a coluna da fi); Æ Calculamos o valor de (Xn/100) (independentemente de n ser par ou ímpar!); Æ Construímos a coluna da fac; Æ Comparamos o valor do (Xn/100) com os valores da fac, iniciando da fac da primeira classe (a mais de cima!) e fazendo a seguinte pergunta: "esta fac é maior ou igual a (Xn/100)?". Se a resposta for NÃO, passamos à fac da classe seguinte. Quando a resposta for SIM, pararemos e procuraremos a classe correspondente! Esta será a nossa Classe do X-ésimo Centil, ou seja, a Classe do PX. Æ Finalmente, aplicaremos a fórmula do PX, extraindo os dados desta classe do PX, que acabamos de encontrar! Eis a fórmula:
⎡ ⎛ Xn ⎞ ⎢ ⎜ 100 ⎟ − fac ANT ⎝ ⎠ PX = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
É isso! Reparem que fizemos quatro exemplos nesta aula, nos quais determinamos os valores do Q1 (Primeiro Quartil), Q3 (Terceiro Quartil), D1 (Primeiro Decil) e
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 13 de 15
D9 (Nono Decil)! Isso não foi feito por acaso! Quando chegarmos mais adiante na matéria, e formos estudar os Coeficientes Percentílicos de Assimetria e de Curtose, ou mesmo antes disso, já nas Medidas de Dispersão (quando veremos a "Amplitude Semi-interquartílica"), constataremos que essas quatro Medidas Separatrizes - Q1 e Q3, D1 e D9 - nos serão necessárias! Para encerrar esta aula e tornar o entendimento mais fácil, repetiremos nas páginas seguintes o resumo dos passos para determinação das Medidas Separatrizes e, na seqüência, o "dever de casa" (aposto que estavam com saudades, hein?). RESUMO - MEDIDAS SEPARATRIZES # Mediana: Æ Determinamos o n (somando a coluna da fi); Æ Calculamos o valor de (n/2) (independentemente de n ser par ou ímpar!); Æ Construímos a coluna da fac; Æ Comparamos o valor do (n/2) com os valores da fac, iniciando da fac da primeira classe (a mais de cima!) e fazendo a seguinte pergunta: "esta fac é maior ou igual a (n/2)?". Se a resposta for NÃO, passamos à fac da classe seguinte. Quando a resposta for SIM, pararemos e procuraremos a classe correspondente! Esta será a nossa Classe Mediana. Æ Finalmente, aplicaremos a fórmula da Md, extraindo os dados desta classe da Mediana, que acabamos de encontrar! Eis a fórmula:
⎡⎛ n ⎞ ⎤ ⎢ ⎜ 2 ⎟ − fac ANT ⎥ ⎥⋅h Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎥ ⎢⎣ ⎥⎦ # Quartis: (Para Determinação do X-ésimo Quartil - QX) Æ Determinamos o n (somando a coluna da fi); Æ Calculamos o valor de (Xn/4) (independentemente de n ser par ou ímpar!); Æ Construímos a coluna da fac; Æ Comparamos o valor do (Xn/4) com os valores da fac, iniciando da fac da primeira classe (a mais de cima!) e fazendo a seguinte pergunta: "esta fac é maior ou igual a (Xn/4)?". Se a resposta for NÃO, passamos à fac da classe seguinte. Quando a resposta for SIM, pararemos e procuraremos a classe correspondente! Esta será a nossa Classe do X-ésimo Quartil, ou seja, a Classe do QX. Æ Finalmente, aplicaremos a fórmula do QX, extraindo os dados desta classe do QX, que acabamos de encontrar! Eis a fórmula:
⎡ ⎛ Xn ⎞ ⎢ ⎜ 4 ⎟ − fac ANT ⎝ ⎠ QX = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
# Decis: (Para Determinação do X-ésimo Decil - DX) Æ Determinamos o n (somando a coluna da fi);
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
Pág. 14 de 15
Æ Calculamos o valor de (Xn/10) (independentemente de n ser par ou ímpar!); Æ Construímos a coluna da fac; Æ Comparamos o valor do (Xn/10) com os valores da fac, iniciando da fac da primeira classe (a mais de cima!) e fazendo a seguinte pergunta: "esta fac é maior ou igual a (Xn/10)?". Se a resposta for NÃO, passamos à fac da classe seguinte. Quando a resposta for SIM, pararemos e procuraremos a classe correspondente! Esta será a nossa Classe do X-ésimo Decil, ou seja, a Classe do DX. Æ Finalmente, aplicaremos a fórmula do DX, extraindo os dados desta classe do DX, que acabamos de encontrar! Eis a fórmula:
⎡ ⎛ Xn ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎠ ⎝ DX = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
# Percentis: (Para Determinação do X-ésimo Percentil - PX) Æ Determinamos o n (somando a coluna da fi); Æ Calculamos o valor de (Xn/100) (independentemente de n ser par ou ímpar!); Æ Construímos a coluna da fac; Æ Comparamos o valor do (Xn/100) com os valores da fac, iniciando da fac da primeira classe (a mais de cima!) e fazendo a seguinte pergunta: "esta fac é maior ou igual a (Xn/100)?". Se a resposta for NÃO, passamos à fac da classe seguinte. Quando a resposta for SIM, pararemos e procuraremos a classe correspondente! Esta será a nossa Classe do X-ésimo Centil, ou seja, a Classe do PX. Æ Finalmente, aplicaremos a fórmula do PX, extraindo os dados desta classe do PX, que acabamos de encontrar! Eis a fórmula:
⎡ ⎛ Xn ⎞ ⎢ ⎜ 100 ⎟ − fac ANT ⎝ ⎠ PX = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Ok! De teoria por hoje é só! Fiquemos agora com os...
...EXERCÍCIOS DE HOJE
01. Determine para o conjunto abaixo os valores do Primeiro Quartil, Terceiro Quartil, Primeiro Decil e Nono Decil:
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6
ESTATÍSTICA
*** Ponto 21 – MEDIDAS SEPARATRIZES ***
02. Utilizando-se do enunciado abaixo, determine os Quartil, Terceiro Quartil, Primeiro Decil e Nono Decil:
Pág. 15 de 15
valores
do
Primeiro
Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
P (%) 5 15 40 70 85 95 100
Ok, meus amigos! Hoje ficaremos mesmo por aqui! Vocês me dão licença para duas palavrinhas? Como vocês puderam ver, estive ausente por uns dias... Recebi vários e vários e-mails, de alunos de todos os cantos, perguntando pelas aulas e se eu os havia abandonado... Mas é lógico que isso sequer se passou pela minha cabeça! Ocorre que nesses dias eu estava de mudança! Mudança de cidade, mudança de vida! E quem já mudou sabe o trabalho que é isso... Estive, realmente, sem condições de colocar as aulas como de praxe. E isso me deixou aperreado (como se diz aqui no Nordeste!). Infelizmente, as coisas não saem sempre como a gente planeja... Sábado passado, eu iniciei a elaboração desta aula de hoje; já estava na última página, quando ocorreu um desses “erros fatais” e eu simplesmente perdi tudo! Passei mais de hora tentando recuperar o arquivo, mas em vão! O jeito foi recomeçar e refazer tudinho! Espero que valha a pena esta mão-de-obra, e que vocês aproveitem bem esta teoria! Um abraço forte a todos! E até a próxima!
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 1 de 18
MEDIDAS DE DIPERSÃO – PARTE 01 Olá, amigos! Como estão todos? Parece que, finalmente, é chegado o momento de iniciarmos o estudo das tão esperadas Medidas de Dispersão! Antes disso, como é de praxe, começaremos resolvendo as questões que ficaram da aula passada! Vamos a elas! 01. Determine para o conjunto abaixo os valores do Primeiro Quartil, Terceiro Quartil, Primeiro Decil e Nono Decil: 0 15 30 45 60
Xi !--!--!--!--!---
fi 4 13 15 10 6
15 30 45 60 75
Sol.: Começando pelo Primeiro passos que já conhecemos!
Quartil,
teremos
apenas
que
seguir
aqueles
1º Passo) Encontraremos n e calcularemos (n/4): 0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6 n=48
Daí, achamos que n=48, portanto, (n/4)=12 2º Passo) Construímos a fac: 0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6 n=48
fac 4 17 32 42 48
3º Passo) Comparamos os valores da fac com o valor de (n/4), fazendo a pergunta de praxe, adaptada ao primeiro quartil: 0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6 n=48
fac 4 17 32 42 48
Æ 4 é maior ou igual a 12? NÃO! Æ 17 é maior ou igual a 12? SIM!
Página 1 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 2 de 18
Como a resposta foi afirmativa na segunda fac, procuramos a classe correspondente (15 !--- 30) e dizemos que esta será nossa Classe do Primeiro Quartil! 4º Passo) Aplicamos a fórmula do Primeiro Quartil, tomando como referência a Classe do Q1! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q1 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ 12 − 4 ⎤ ⎥ ⋅ h Æ Q1 = 15 + ⎡ ⋅15 Æ E: Q1=24,2 ⎢ ⎥ ⎣ 13 ⎥⎦ ⎥ ⎦
Cálculo do Terceiro Quartil: Q3! Sol.: 1º Passo) Encontraremos n e calcularemos (3n/4): 0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6 n=48
Daí, achamos que n=48 e, portanto, (3n/4)=36 2º Passo) Construímos a fac: 0 15 30 45 60
Xi !--!--!--!--!---
fi 4 13 15 10 6 n=48
15 30 45 60 75
fac 4 17 32 42 48
3º Passo) Comparamos os valores da fac com o valor de (3n/4), fazendo a pergunta de praxe, adaptada ao terceiro quartil:
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6
fac 4 17 32 42 48
Æ Æ Æ Æ
4 é maior ou igual a 36? NÃO! 17 é maior ou igual a 36? NÃO! 32 é maior ou igual a 36? NÃO! 42 é maior ou igual a 36? SIM!
n=24 Como a resposta SIM surgiu na fac da quarta classe (45 !--- 60), diremos que esta será nossa Classe do Terceiro Quartil!
Página 2 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 3 de 18
4º Passo) Aplicaremos a fórmula do Q3, usando os dados da Classe do Q3, que acabamos de identificar!
⎡ ⎛ 3n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q3 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ 36 − 32 ⎤ ⎥ ⋅ h Æ Q3 = 45 + ⎡ ⎢⎣ 10 ⎥⎦ ⋅ 15 Æ E: Q3=51 ⎥ ⎥ ⎦
Cálculo do Primeiro Decil: D1! Sol.: 1º Passo) Encontraremos n e calcularemos (n/10):
0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6 n=48
Daí, achamos que n=48 e, portanto, (n/10)=4,8 2º Passo) Construímos a fac: 0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6 n=48
fac 4 17 32 42 48
3º Passo) Comparamos os valores da fac com o valor de (n/10), fazendo a pergunta de praxe, adaptada ao primeiro decil: 0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6 n=48
fac 4 17 32 42 48
Æ 4 é maior ou igual a 4,8? NÃO! Æ 17 é maior ou igual a 4,8? SIM!
Achamos, portanto, que a classe correspondente (15 !--- 30) será nossa Classe do Primeiro Decil! 4º Passo) Aplicamos a fórmula do Primeiro Decil:
Página 3 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
⎡⎛ n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D1 = l inf + ⎢ fi ⎢ ⎢ ⎣
Pág. 4 de 18
⎤ ⎥ ⎥ ⋅ h Æ D1 = 15 + ⎡ 4,8 − 4 ⎤ ⋅15 Æ E: D1=15,9 ⎢⎣ 13 ⎥⎦ ⎥ ⎥ ⎦
Finalmente, encontraremos o Nono Decil – D9: Sol.: 1º Passo) Encontraremos n e calcularemos (9n/10):
0 15 30 45 60
Xi !--!--!--!--!---
fi 4 13 15 10 6 n=48
15 30 45 60 75
Daí, achamos que n=48 e, portanto, (9n/10)=43,2 2º Passo) Construímos a fac: 0 15 30 45 60
Xi !--!--!--!--!---
fi 4 13 15 10 6 n=48
15 30 45 60 75
fac 4 17 32 42 48
3º Passo) Comparamos os valores da fac com o valor de (9n/10), fazendo a pergunta de praxe, adaptada ao nono decil: 0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6
fac 4 17 32 42 48
Æ Æ Æ Æ Æ
4 17 32 42 48
é é é é é
maior maior maior maior maior
ou ou ou ou ou
igual igual igual igual igual
a a a a a
43,2? 43,2? 43,2? 43,2? 43,2?
NÃO! NÃO! NÃO! NÃO! SIM!
n=48 Achamos, portanto, que a classe correspondente (60 !--- 75) será nossa Classe do Nono Decil! 4º Passo) Aplicamos a fórmula do Nono Decil:
Página 4 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
⎡ ⎛ 9n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D9 = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
⎡ 43,2 − 42 ⎤ ⎥⎦ ⋅15 6 ⎣
Æ D9 = 60 + ⎢
Æ
Pág. 5 de 18
E: D9=63,0
Segunda Questão) Utilizando-se do enunciado abaixo, determine os valores do Primeiro Quartil, Terceiro Quartil, Primeiro Decil e Nono Decil: Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
P (%) 5 15 40 70 85 95 100
Sol.: Em relação a este enunciado, já estamos até cansados de saber que teremos de fazer todo um trabalho preliminar, a fim de chegarmos à classe da freqüência absoluta simples – a fi! Estes passos preliminares já foram exaustivamente estudados em nossas aulas iniciais (fizemos essa questão, inclusive!), de forma que já colocarei aqui as colunas de freqüência as quais chegaremos, ok? Qualquer dúvida (ou para refrescar a memória, basta dar uma olhada no Ponto xx)! Ficaremos com: Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
Fac 5% 15% 40% 70% 85% 95% 100%
Fi 5% 10% 25% 30% 15% 10% 5%
fi 10 20 50 60 30 20 10
Agora, mãos à obra! Cálculo do Primeiro Quartil – Q1:
Página 5 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 6 de 18
1º Passo) Encontraremos n e calcularemos (n/4): 70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
Daí, achamos que n=200, portanto, (n/4)=50 2º Passo) Construímos a fac: 70 90 110 130 150 170 190
Xi !--- 90 !--- 110 !--- 130 !--- 150 !--- 170 !--- 190 !--- 210
fi 10 20 50 60 30 20 10 n=200
fac 10 30 80 140 170 190 200
3º Passo) Comparamos os valores da fac com o valor de (n/4), fazendo a pergunta de praxe, adaptada ao primeiro quartil: 70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
fac 10 30 80 140 170 190 200
Æ 10 é maior ou igual a 50? NÃO! Æ 30 é maior ou igual a 50? NÃO! Æ 80 é maior ou igual a 50? SIM!
Como a resposta foi afirmativa na terceira fac, procuramos a classe correspondente (110 !--- 130) e dizemos que esta será nossa Classe do Primeiro Quartil! 4º Passo) Aplicamos a fórmula do Primeiro Quartil, tomando como referência a Classe do Q1! Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q1 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ 50 − 30 ⎤ ⎥ ⋅ h Æ Q1 = 110 + ⎡ ⋅ 20 Æ E: Q1=118,0 ⎢ ⎥ ⎣ 50 ⎥⎦ ⎥ ⎦
Página 6 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 7 de 18
Cálculo do Terceiro Quartil: Q3! Sol.: 1º Passo) Encontraremos n e calcularemos (3n/4): 70 90 110 130 150 170 190
Xi !--- 90 !--- 110 !--- 130 !--- 150 !--- 170 !--- 190 !--- 210
fi 10 20 50 60 30 20 10 n=200
Daí, achamos que n=200 e, portanto, (3n/4)=150 2º Passo) Construímos a fac: 70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
fac 10 30 80 140 170 190 200
3º Passo) Comparamos os valores da fac com o valor de (3n/4), fazendo a pergunta de praxe, adaptada ao terceiro quartil: 70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
fac 10 30 80 140 170 190 200
Æ Æ Æ Æ Æ
10 é maior ou igual a 150? NÃO! 30 é maior ou igual a 150? NÃO! 80 é maior ou igual a 150? NÃO! 140 é maior ou igual a 150? NÃO! 170 é maior ou igual a 150? SIM!
Como a resposta SIM surgiu na fac da quinta classe (150 !--- 170), diremos que esta será nossa Classe do Terceiro Quartil! 4º Passo) Aplicaremos a fórmula do Q3, usando os dados da Classe do Q3, que acabamos de identificar!
⎡ ⎛ 3n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q3 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ 150 − 140 ⎤ ⎥ ⋅ h Æ Q3 = 150 + ⎡ ⋅ 20 Æ E: Q3=156,6 ⎢ ⎥ ⎣ 30 ⎥⎦ ⎥ ⎦
Página 7 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 8 de 18
Cálculo do Primeiro Decil: D1! Sol.: 1º Passo) Encontraremos n e calcularemos (n/10):
70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
Daí, achamos que n=200 e, portanto, (n/10)=20 2º Passo) Construímos a fac: 70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
fac 10 30 80 140 170 190 200
3º Passo) Comparamos os valores da fac com o valor de (n/10), fazendo a pergunta de praxe, adaptada ao primeiro decil: 70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
Achamos, portanto, que a Classe do Primeiro Decil!
fac 10 Æ 10 é maior ou igual a 20? NÃO! 30 Æ 30 é maior ou igual a 20? SIM! 80 140 170 190 200
classe
correspondente
(90
!---
110)
será
nossa
4º Passo) Aplicamos a fórmula do Primeiro Decil:
⎡⎛ n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D1 = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ D1 = 90 + ⎡ 20 − 10 ⎤ ⋅ 20 Æ E: D1=100,0 ⎢⎣ 20 ⎥⎦ ⎥ ⎥ ⎦
Finalmente, encontraremos o Nono Decil – D9:
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 9 de 18 Página 8 de 18
Sol.: 1º Passo) Encontraremos n e calcularemos (9n/10):
70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
Daí, achamos que n=200 e, portanto, (9n/10)=180 2º Passo) Construímos a fac: 70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
fi 10 20 50 60 30 20 10 n=200
90 110 130 150 170 190 210
fac 10 30 80 140 170 190 200
3º Passo) Comparamos os valores da fac com o valor de (9n/10), fazendo a pergunta de praxe, adaptada ao nono decil: 70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
fac 10 30 80 140 170 190 200
Æ 10 é maior Æ 30 é maior Æ 80 é maior Æ 140 é maior Æ 170 é maior Æ 190 é maior
ou ou ou ou ou ou
igual igual igual igual igual igual
a a a a a a
180? 180? 180? 180? 180? 180?
NÃO! NÃO! NÃO! NÃO! NÃO! SIM!
Achamos, portanto, que a classe correspondente (170 !--- 190) será nossa Classe do Nono Decil! 4º Passo) Aplicamos a fórmula do Nono Decil:
⎡ ⎛ 9n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D9 = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
⎡180 − 170 ⎤ ⋅ 20 ⎣ 20 ⎥⎦
Æ D9 = 170 + ⎢
Æ
E: D9=180
Obs.: Esta segunda questão foi extraída do AFRF-2002.1. Quando chegarmos ao estudo da Medida de Curtose, verificaremos que todo este trabalho foi exigido por um enunciado desta referida prova! Veremos isso a seu tempo!
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 10 de 18
Página 9 de 18
Agora, daremos início de fato ao estudo das Medidas de Dispersão. Por ser um assunto um tanto extenso, teremos que, à semelhança do que fizemos com as Medidas de Posição, dividi-lo em várias aulas! # Medidas de Dispersão: Como professor de Estatística para concursos, constantemente tenho observado que um dos maiores entraves sofridos por boa parte dos alunos diz respeito a uma necessidade (normalmente não suprida) da compreensão do significado das medidas estudadas. Nosso cérebro assimila melhor aquilo que compreende. Inúmeras vezes me fizeram perguntas do tipo: “Para que servem essas medidas de dispersão?” Ora: ”Para ganhar alguns pontinhos a mais na prova” seria uma resposta possível..., mas creio que muito pouco convincente! Melhor mesmo é criar alguns exemplos elucidativos! Vamos a eles. O cálculo das Medidas de Dispersão serve, a rigor, para nos dar uma informação mais completa acerca do conjunto que estamos estudando. Para início de compreensão, “dispersão” pode ser entendida (a grosso modo) como “afastamento” ou “distanciamento”! Quando estudamos a dispersão de um conjunto, na verdade estamos querendo saber se seus elementos estão se distribuindo de uma forma mais “próxima” ou mais “distante”! Ora, esses parâmetros – proximidade e afastamento – obviamente só podem ser analisados se tomarmos por base um ponto de referência. Este referencial, conforme veremos adiante, será (quase sempre)a própria Média do conjunto! Vamos a um exemplo prático! Suponhamos que uma determinada empresa contratou dois estagiários engenharia mecânica (a minha área!), pré-concludentes, para avaliar desempenho de ambos, com vistas a uma futura efetivação no cargo engenheiro de projetos. O critério de avaliação é baseado no número projetos de novas peças apresentados por mês, por cada um deles, em período de seis meses. O resultado observado foi o seguinte:
de o de de um
FIRMINO = {3, 8, 12, 15, 3, 1} RIVELINO = {6, 7, 8, 8, 7, 6} Ora, se formos calcular a Média da produção dos dois estagiários, observaremos que ambos tiveram o mesmo resultado. Senão, vejamos: Média (Firmino) Æ
(3 + 8 + 12 + 15 + 3 + 1) = 42 = 7
Média (Rivelino)Æ
(6 + 7 + 8 + 8 + 7 + 6) = 42 = 7
6
6
6
6
Ou seja, de acordo com a Medida de Posição que analisamos, ambos tiveram um desempenho semelhante, alcançando a Média de 7 projetos/mês! Todavia, se lançarmos um olhar mais apurado sobre a produção de cada estagiário, facilmente observaremos que o colega Firmino teve um desempenho mais inconstante, de forma que seus resultados mensais sofreram uma variação de 1 (um) projeto até 15 (quinze). Em outras palavras, seus resultados estão mais “dispersos”, mais afastados em relação à Média!
Página 10 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 11 de 18
Já no caso do colega Rivelino, este manteve um desempenho quase que constante, de modo que sua produção mensal variou apenas entre 6 (seis) e 8 (oito) projetos! A dispersão verificada nos resultados deste último estagiário foi bem menor, o que confere a esse funcionário, neste exemplo, uma característica de maior constância, bastante desejável pela diretoria da empresa! Esta conclusão a que chegamos acima não nos seria possível pelo mero cálculo das Medidas de Posição! Somente a análise das Medidas de Dispersão nos poderia tê-la fornecido! Destarte, conforme já dissemos, as Medidas de Dispersão complementam as informações a respeito do conjunto analisado, nos dando uma visão mais completa deste! Passemos às primeiras Medidas de Dispersão! # Amplitude Total: (AT) A Amplitude Total, considerada uma Medida de Dispersão (a mais simples de todas), já é nossa velha conhecida! Foi objeto de estudo em uma de nossas primeiras aulas, quando vimos com detalhes os elementos de uma Distribuição de Freqüências! Se puxarmos pela memória, recordaremos que adotamos a palavra “amplitude” como sinônimo de “tamanho”! (Lembram-se?). Daí, a Amplitude Total representaria o tamanho do conjunto inteiro! Somente isso! Em suma: a Amplitude Total será a diferença entre o maior e o menor elemento do nosso conjunto! Æ Amplitude Total para um Rol: Facílimo! (Dispensa até maiores comentários!). Exemplo: Consideremos o conjunto seguinte: {2, 3, 3, 5, 7, 11, 12, 12, 15, 18, 22} Maior elemento = 22 Menor elemento = 2 Daí: AT = (22 – 2) Æ AT=20 Æ Amplitude Total para Dados Tabulados: Também sem nenhum segredo! Exemplo: Determine a Amplitude Total do conjunto abaixo: Xi 1 3 5 6 8
fi 2 5 7 4 1
Maior elemento = 8 Menor elemento = 1 Daí: AT = (8 – 1) Æ AT=7
Página 11 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 12 de 18
Æ Amplitude Total para Distribuição de Freqüências: Igualmente fácil! Vejamos o conjunto abaixo:
10 20 30 40 50 60
Xi !--!--!--!--!--!---
fi 3 5 8 4 2 1
20 30 40 50 60 70
Maior elemento = 70 Menor elemento = 10 Daí: AT = (70 – 10) Æ AT=60 A Amplitude Total não é uma boa forma para analisarmos a dispersão de um conjunto, tendo em vista que só leva em consideração os seus valores extremos, nada informando acerca dos demais elementos. Tem, portanto, este forte inconveniente! De fato, não me recordo de nenhuma questão de prova solicitando que se determine a Amplitude Total de um conjunto... Quem sabe não será no próximo concurso que você irá prestar? É torcer para cair e partir para o abraço!
# Desvio Quartílico (ou Amplitude Semi-interquartílica): Dq Calma, amigos! Não nos deixemos assustar pelo nome! O cálculo desta Medida de Dispersão será muito fácil para nós, que acabamos de estudar (no Ponto 21) as Medidas Separatrizes! Só teremos que nos lembrar da fórmula que define este Desvio. E é a seguinte:
Dq =
(Q3 − Q1) 2
Onde: Q3 é o Terceiro Quartil; e Q1 é o Primeiro Quartil. Para tentarmos memorizar com mais facilidade, traduziremos Amplitude Interquartílica como “Amplitude entre os Quartis” e será calculada apenas como (Q3-Q1). Uma vez que o prefixo “semi” indica “metade”, concluímos que a “Amplitude Semi-Interquartílica” será determinada (como vimos acima) por [(Q3-Q1)/2]. A forma de determinação dos Quartis – Q3 e Q1 – já foi bastante explicitada na aula anterior (e no início desta aula, com a resolução dos exercícios!). A propriedade marcante desta Medida de Dispersão é o fato de que o intervalo compreendido entre os dois valores seguintes – a Mediana subtraída do Desvio Quartílico e a Mediana somada ao Desvio Quartílico – abrange aproximadamente 50% (cinqüenta por cento) dos elementos do conjunto! Vamos visualizar esta propriedade:
Página 12 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 13 de 18
(Md-Dq) Md (Md+Dq) 50% Ou seja, a área sob a curva e limitada por esses valores (Md-Dq) e (Md+Dq) abrange, aproximadamente, 50% do total dos elementos do conjunto! Observemos que esta se trata, em regra, de uma propriedade de aproximação, e não de exatidão! Tanto mais se aproximará da precisão quanto mais próximo da simetria for o nosso conjunto. Se o conjunto for perfeitamente simétrico, então a propriedade deixará de ser aproximativa e passará a ser exata! Temos, portanto, que o Desvio Quartílico é uma Medida de Dispersão que toma como elemento de referência a Mediana do conjunto (e não a Média!). Observamos ainda que a análise da Dispersão por meio deste Desvio não reflete o comportamento dos elementos do conjunto que estejam aquém do primeiro quartil (Q1) ou além do terceiro quartil (Q3). Em outras palavras, o valor do Desvio Quartílico não é influenciado pelos valores extremos do conjunto!
# Desvio Médio Absoluto: DM Também chamado apenas de Desvio Médio, ou Desvio Absoluto! É uma Medida de Dispersão que toma como referência para determinação dos desvios (“afastamentos”) o valor da Média do conjunto! E a característica marcante desta Medida é que serão considerados os valores absolutos destes desvios! Daí o nome “Desvio Absoluto”. Vejamos como se calcula o DM! Æ Desvio Absoluto para o Rol: Será determinado da seguinte maneira:
DM =
∑ Xi − X n
Exemplo: Determinemos o Desvio Absoluto do conjunto: {1, 3, 5, 7, 9} 1º Passo) Calculamos a Média do conjunto:
X=
(1 + 3 + 5 + 7 + 9) = 25 = 5 5
5
2º Passo) Construímos o conjunto dos Desvios dos elementos Xi em relação à Média:
Xi − X = {− 4,−2,0,2,4}
Página 13 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 14 de 18
3º Passo) Tomando os valores do conjunto acima, consideraremos agora apenas os seus valores absolutos, ou seja, quem estiver negativo passará a ser positivo:
Xi − X = {4,2,0,2,4} 4º Passo) Agora, somaremos os valores do conjunto acima para chegarmos ao numerador da nossa fórmula! Teremos que:
∑ Xi − X
= 12
5º Passo) Finalmente, considerando que nosso conjunto apresenta 5 elementos, ou seja, n=5, aplicaremos a fórmula do Desvio Médio Absoluto, e encontraremos que:
DM =
∑ Xi − X n
Æ
DM =
12 = 2,4 Æ Resposta da Questão! 5
Æ Desvio Absoluto para Dados Tabulados: Será determinado por:
DM =
∑ Xi − X . fi n
Observemos que, a transição que se verifica nas fórmulas do Desvio Absoluto para as três formas de apresentação dos dados (rol, dados tabulados e distribuição de freqüências) será exatamente a mesma transição que aprendemos para as fórmulas da Média de um conjunto! Desse modo, para chegarmos a esta fórmula do DM para Dados Tabulados só precisamos repetir a fórmula do rol e multiplicarmos por fi o numerador! Façamos um exemplo. Exemplo: Calcular o Desvio Absoluto do conjunto abaixo: Xi 1 2 3 4 5
fi 1 2 3 2 1
1º Passo) Determinaremos o valor da construiremos a coluna (Xi.fi). Teremos: Xi 1 2 3 4 5
Ainda dentro do 1º passo, Tabulados, e encontraremos:
fi 1 2 3 2 1 n=9
aplicaremos
Média
do
conjunto.
Para
tanto,
Xi.fi 1 4 9 8 5 27 a
fórmula
da
Média
para
Dados
Página 14 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
X =
∑ Xi. fi n
Æ
Daí: X =
27 9
Æ
E:
Pág. 15 de 18
X =3
2º Passo) Construiremos a coluna Xi- X : Xi
fi
Xi.fi
1 2 3 4 5
1 2 3 2 1 n=9
1 4 9 8 5 27
Xi- X -2 -1 0 1 2
3º Passo) Construiremos a coluna do módulo |Xi- X |. Quem era negativo ficará positivo! Ficaremos com: Xi
fi
1 2 3 4 5
Xi.fi
1 2 3 2 1 n=9
Xi- X -2 -1 0 1 2
1 4 9 8 5 27
|Xi- X | 2 1 0 1 2
4º Passo) Construiremos a coluna |Xi- X |.fi Teremos: Xi
fi
Xi.fi
1 2 3 4 5
1 2 3 2 1 n=9
1 4 9 8 5 27
Xi- X -2 -1 0 1 2
|Xi- X | 2 1 0 1 2
|Xi- X |.fi 2 2 0 2 2 8
5º Passo) Aplicaremos, finalmente, a fórmula do Desvio Absoluto! Teremos:
DM =
∑ Xi − X . fi n
Æ
DM =
8 9
Æ E: DM = 0,89
Æ Resposta da Questão!
Æ Desvio Absoluto para Distribuição de Freqüências: Será determinado por:
DM =
∑ PM − X . fi n
Mais uma vez se repetiu a mesma transição observada nas fórmulas da Média! Ao passarmos à fórmula do DM para a Distribuição de Freqüências,
Página 15 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 16 de 18
deixamos de trabalhar com valores individualizados (Xi) e passamos a trabalhar com Classes, de modo que não há mais que se falar em Xi, mas em Ponto Médio (PM), que é o legítimo representante de cada classe! Exemplo: Determinemos o DM para o conjunto abaixo: Xi !--!--!--!--!---
0 10 20 30 40
fi 2 3 5 3 2
10 20 30 40 50
1ºPasso) Determinaremos a Média do conjunto! Ora, propositadamente eu já forneci um conjunto que não tomasse muito o nosso tempo. Todos enxergaram? Estamos diante de uma Distribuição Simétrica! (Lembram-se da Técnica do Elevador? Vide Ponto 10!). Dessa forma, pela Dica de Ouro da Média e sem necessitar de nenhum cálculo, sabemos que a Média será o Ponto Médio da Classe Intermediária! Neste caso, teremos:
X = 25 2º Passo) Construiremos a coluna dos Pontos Médios: 0 10 20 30 40
Xi !--!--!--!--!---
fi 2 3 5 3 2
10 20 30 40 50
PM 5 15 25 35 45
3º Passo) Construiremos a coluna PM- X : Xi 0 10 20 30 40
!--!--!--!--!---
10 20 30 40 50
fi
PM
2 3 5 3 2
5 15 25 35 45
PM- X -20 -10 0 10 20
4º Passo) Agora, construiremos a coluna do módulo |PM- X |. O efeito, já sabemos: valores antes negativos ficarão positivos! Teremos: Xi 0 10 20 30 40
!--!--!--!--!---
10 20 30 40 50
fi
PM
2 3 5 3 2
5 15 25 35 45
PM- X -20 -10 0 10 20
|PM- X | 20 10 0 10 20
Página 16 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 17 de 18
5º Passo) Construiremos a coluna |PM- X |.fi : Xi 0 10 20 30 40
!--!--!--!--!---
10 20 30 40 50
fi
PM
2 3 5 3 2 n=15
5 15 25 35 45
PM- X -20 -10 0 10 20
|PM- X | 20 10 0 10 20
|PM- X |.fi 40 30 0 30 40 140
6º Passo) Aplicaremos a fórmula do Desvio Absoluto. Teremos:
DM =
∑ PM − X . fi n
Æ
Daí: DM =
140 15
Æ
E: DM = 9,33 Æ Resposta!
De teoria por hoje já é o suficiente! Mesmo porque já são três e quinze da “madruga”... Além do que, como já disse antes, esse assunto Medidas de Dispersão não será estudado de uma só vez. Posso dizer-lhes que as Medidas mais “interessantes” ainda estão por vir, e são justamente o Desvio-Padrão e a Variância – ambas campeãs de audiência nas provas de concurso! Só para não perdermos o costume, seguem para vocês se divertirem um pouco em casa, os nossos... ...EXERCÍCIOS DE HOJE 01. Para o conjunto abaixo, determine o valor do Desvio Quartílico e do Desvio Médio Absoluto: Xi fi 0 !--- 15 4 15 !--- 30 13 30 !--- 45 15 45 !--- 60 10 60 !--- 75 6 02. Questão O atributo tamanho 100 freqüências
extraída do AFRF-2002.2 (A prova mais recente de AFRF!!). do tipo contínuo X, observado como um inteiro, numa amostra de obtida de uma população de 1000 indivíduos, produziu a tabela de seguinte: Classes 29,5 !--- 39,5 39,5 !--- 49,5 49,5 !--- 59,5 59,5 !--- 69,5 69,5 !--- 79,5 79,5 !--- 89,5 89,5 !--- 99,5
Freqüência (f) 4 8 14 20 26 18 10
Página 17 de 18
ESTATÍSTICA
*** Ponto 22 – MEDIDAS DE DIPERSÃO – PARTE 01 ***
Pág. 18 de 18
Assinale a opção que corresponde ao Desvio Absoluto Médio do atributo X: a) 16,0 b) 17,0 c) 16,6 d) 18,1 e) 13,0
Vocês viram que na página 10 (dez) da aula de hoje, quando estava explicando com um exemplo prático a idéia do que seriam as Medidas de Dispersão, eu utilizei aqueles dois nomes: Firmino e Rivelino! E não foi mero acaso! Firmino e Rivelino são dois dos meus melhores amigos! Engenheiros Mecânicos como eu, e que durante alguns anos batalharam comigo na boa e velha UFC (Universidade Federal do Ceará) com os Cálculos e Físicas da vida... Velhos tempos aqueles! Apesar dos nossos oito anos de formados, a amizade e o companheirismo permaneceram! Um abraço fortíssimo a esses dois guerreiros e irmãos! Ao Firmino, Alessandra e ao pequeno Felipe e ao Rivelino, Sandra e à pequena Cecília é dedicada esta aula de hoje! Fiquem com Deus e até a próxima!
Página 18 de 18
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 1 de 20
MEDIDAS DE DISPERSÃO – PARTE 02 Olá, amigos! Todos bem? Espero que sim! Hoje, continuaremos nosso estudo acerca das Medidas de Dispersão. Como é nosso costume, iniciaremos esta aula com a resolução dos exercícios que ficaram da última. Espero que tenham conseguido fazê-los sem maiores dificuldades! Vamos a eles... 01. Para o conjunto abaixo, determine o valor do Desvio Quartílico e do Desvio Médio Absoluto: Xi fi 0 !--- 15 4 15 !--- 30 13 30 !--- 45 15 45 !--- 60 10 60 !--- 75 6 Sol.: a)Desvio Quartílico: Coloquei este conjunto propositadamente, porque já o havíamos trabalhado na aula de Medidas Separatrizes, e encontramos para ele os valores do Primeiro Quartil (Q1), Terceiro Quartil (Q3), Primeiro Decil (D1) e Nono Decil (D9). Estes valores foram encontrados logo no início da última aula (Ponto 22)! Quem quiser, é só dar uma conferida! Destarte, determinamos que, para o conjunto acima: Q1=24,2 e Q3=51,0. Daí, para calcularmos o valor do Desvio Quartílico, só teremos então que aplicar a fórmula seguinte:
Dq =
(Q3 − Q1) 2
E teremos que:
Dq =
(Q3 − Q1) 2
Æ Dq =
(51− 24,2) 2
Æ
Dq =
(26,5) 2
Æ E: Dq=13,25
b)Desvio Médio Absoluto: Para acharmos o DM, teremos apenas que aprendemos na aula passada. São os seguintes:
percorrer
aqueles
passos
que
1º Passo) Determinaremos a Média do conjunto! Para isso, só para não perdermos a oportunidade, vamos utiliz o Método da Variável Transformada, cujo primeiro passo é construir a coluna dos Pontos Médios. Teremos: 0 15 30 45 60
Xi !--!--!--!--!---
15 30 45 60 75
fi 4 13 15 10 6
PM 7,5 22,5 37,5 52,5 67,5
Página 1 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 2 de 20
Daí, na seqüência, construiremos a Coluna de Transformação! Teremos: Xi fi PM (PM-7,5)=Yi 15 0 !--- 15 4 0 7,5 15 !--- 30 13 1 22,5 30 !--- 45 15 2 37,5 45 !--- 60 10 3 52,5 60 !--- 75 6 4 67,5 Agora, construiremos a coluna do (Yi.fi). Ficaremos com: Xi 0 15 30 45 60
!--!--!--!--!---
Daí, aplicaremos Transformada. Teremos:
Y=
∑ Yi. fi n
Æ Daí:
Y=
fi
PM
15 30 45 60 75
4 13 15 10 6 n=48
a
fórmula
97 48
Yi.fi
7,5 22,5 37,5 52,5 67,5
(PM-7,5)=Yi 15 0 1 2 3 4
para
determinarmos
a
0 13 30 30 24 97 Média
da
Variável
Æ E: Y = 2,02
Agora, descreveremos os Caminhos de Ida e de Volta, que utilizamos para sair da variável original Xi e chegarmos à variável transformada Yi. Teremos o seguinte: Caminho de Ida 1º)(-7,5) e 2º)(÷15)
X =?
Xi
Yi
Y = 2,02
2º)(+7,5) e 1º)(x15) Caminho de Volta Finalmente, percorrendo o Caminho de Volta, a partir do valor da Variável Transformada, recordando sempre a Média é influenciada pelas quatro operações, chegaremos ao valor da Média da Variável Original. Teremos: 1º)(x15)Æ 2,02x15=30,30
e 2º)(+7,5)Æ 30,30+7,5=37,8
Daí: X = 37,8 2º Passo) Construiremos a coluna (PM- X ): Xi
PM
PM- X 4 7,5 -30,3 13 22,5 -15,3 15 37,5 -0,3 10 52,5 14,7 6 67,5 29,7 n=48 *** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 *** 0 15 30 45 60
ESTATÍSTICA
fi
!--!--!--!--!---
15 30 45 60 75
Pág. 3 de 20
Página 2 de 20
3º Passo) Construiremos a coluna |PM- X |: Xi fi PM 0 15 30 45 60
!--!--!--!--!---
15 30 45 60 75
4 13 15 10 6 n=48
7,5 22,5 37,5 52,5 67,5
PM- X -30,3 -15,3 -0,3 14,7 29,7
|PM- X | 30,3 15,3 0,3 14,7 29,7
4º Passo) Construímos a coluna {|PM- X |.fi}: Xi 0 15 30 45 60
!--!--!--!--!---
fi 15 30 45 60 75
4 13 15 10 6 n=48
PM 7,5 22,5 37,5 52,5 67,5
PM- X -30,3 -15,3 -0,3 14,7 29,7
|PM- X | 30,3 15,3 0,3 14,7 29,7 90,3
|PM- X |.fi 121,20 198,90 4,50 147,0 178,20 649,80
5º Passo) Aplicamos a fórmula do DM para a Distribuição de Freqüências:
DM =
∑ PM − X . fi n
Æ
Daí: DM =
649,80 48
Æ
E: DM = 13,54 Æ Resposta!
02. Questão extraída do AFRF-2002.2 (A prova mais recente de AFRF!!). O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência (f) 29,5 !--- 39,5 4 39,5 !--- 49,5 8 49,5 !--- 59,5 14 59,5 !--- 69,5 20 69,5 !--- 79,5 26 79,5 !--- 89,5 18 89,5 !--- 99,5 10 Assinale a opção que corresponde ao Desvio Absoluto Médio do atributo X: a)16,0 b)17,0 c)16,6 d)18,1 e)13,0 Sol.: Não tem nem o que pensar: Basta seguirmos os passos já conhecidos! 1º Passo) Determinaremos a Média do conjunto! Novamente, iremos aplicar o Método da Variável Transformada! Esclareço que o valor da Média já havia sido solicitado em outra questão desta prova, de forma que esta nossa resolução irá implicar, na verdade, na solução de duas questões da prova! Por primeiro, construiremos a coluna dos Pontos Médios. Teremos, então:
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 *** Classes 29,5 !--- 39,5 39,5 !--- 49,5
fi 4 8
Pág. 4 de 20
PM 34,5 44,5 Página 3 de 20
49,5 59,5 69,5 79,5 89,5
!--!--!--!--!---
59,5 69,5 79,5 89,5 99,5
14 20 26 18 10
54,5 64,5 74,5 84,5 94,5
Na seqüência, construiremos a Coluna de Transformação! Ficaremos com: Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
!--!--!--!--!--!--!---
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi
PM
4 8 14 20 26 18 10
34,5 44,5 54,5 64,5 74,5 84,5 94,5
(PM-34,5)=Yi 10 0 1 2 3 4 5 6
Feito isto, construiremos a coluna do (Yi.fi). Teremos: Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
!--!--!--!--!--!--!---
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi 4 8 14 20 26 18 10 n=100
PM 34,5 44,5 54,5 64,5 74,5 84,5 94,5
Yi.fi
(PM-34,5)=Yi 10 0 1 2 3 4 5 6
0 8 28 60 104 90 60 350
Dando continuidade, aplicaremos a fórmula para determinação da Média da Variável Transformada. Ficaremos com:
Y=
∑ Yi. fi n
Æ Daí:
Y=
350 100
Feito isto, descreveremos os Caminhos de Original para a Variável Transformada.Teremos:
Æ E: Y = 3,50 Ida
e
de
Volta,
da
Variável
Caminho de Ida 1º)(-34,5) e 2º)(÷10)
X =?
Xi
Yi
Y = 3,50
2º)(+34,5) e 1º)(x10) Caminho de Volta
Página 4 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 5 de 20
Daí, percorrendo o Caminho de Volta, a partir do valor Transformada, e lembrando-nos das propriedades da Média, teremos: 1º)(x10)Æ 3,50x10=35,0
da
Variável
e 2º)(+34,5)Æ 35+34,5=69,5
Daí: X = 69,5 2º Passo) Construiremos a coluna (PM- X ): Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
!--!--!--!--!--!--!---
39,5 49,5 59,5 69,5 79,5 89,5 99,5
fi
PM
4 8 14 20 26 18 10 n=100
34,5 44,5 54,5 64,5 74,5 84,5 94,5
PM- X -35 -25 -15 -5 5 15 25
3º Passo) Construiremos a coluna |PM- X |: Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
!--!--!--!--!--!--!---
fi
39,5 49,5 59,5 69,5 79,5 89,5 99,5
4 8 14 20 26 18 10 n=100
PM 34,5 44,5 54,5 64,5 74,5 84,5 94,5
PM- X -35 -25 -15 -5 5 15 25
|PM- X | 35 25 15 5 5 15 25
4º Passo) Construímos a coluna {|PM- X |.fi}: Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
!--!--!--!--!--!--!---
fi
39,5 49,5 59,5 69,5 79,5 89,5 99,5
PM
4 8 14 20 26 18 10 n=100
34,5 44,5 54,5 64,5 74,5 84,5 94,5
PM- X -35 -25 -15 -5 5 15 25
|PM- X | |PM- X 35 25 15 5 5 15 25
|.fi 140 200 210 100 130 270 250 1300
5º Passo) Aplicamos a fórmula do DM para a Distribuição de Freqüências:
DM =
∑ PM − X . fi n
Æ
Daí: DM =
1300 100
Æ
E: DM = 13,00 Æ Resposta!
Página 5 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 6 de 20
E aí, meus amigos? Conseguiram fazer as questões acima, sem problemas? Fáceis, não é verdade? Ok! Agora, avançaremos no conhecimento das Medidas de Dispersão, com o estudo de uma das mais importantes e mais exigidas em provas de concursos: o Desvio-Padrão. Vamos a ele! # DESVIO-PADRÃO: S O Desvio Padrão será designado pela letra S (maiúscula). É uma Medida de Dispersão que, da mesma forma que o Desvio Médio Absoluto, também toma como valor de referência a Média Aritmética do conjunto. Lembrar-nos-emos que, enquanto o Desvio Médio Absoluto (DM) é a “medida do módulo”, o Desvio Padrão será a “medida da raiz quadrada”: a única fórmula do nosso curso em que aparecerá a raiz quadrada! Vejamos como calcularemos o S para as diferentes formas de apresentação de um conjunto. Æ Desvio Padrão para o Rol: No caso do rol, aplicaremos a seguinte fórmula:
∑ (Xi − X )
2
S=
n
Percebamos que nesta fórmula do Desvio Padrão – do mesmo modo que ocorre para o Desvio Absoluto – surge a necessidade de conhecermos a Média do conjunto, para calcularmos os desvios em torno desta. Este referido desvio é representado por (Xi- X ). Vamos a um exemplo: Exemplo) Determinar o Desvio Padrão para o seguinte conjunto: A = {1, 2, 2, 4, 6, 9} Preliminarmente, observamos que nosso conjunto A dispõe de 6 elementos, ou seja, teremos nesse caso que n=6. 1º Passo) Determinaremos a Média do conjunto:
X =
(1 + 2 + 2 + 4 + 6 + 9) = 24 = 4 6
6
2º Passo) Construiremos o Conjunto dos Desvios em torno da Média calculada: Xi- X ={(1-4), (2-4), (2-4), (4-4), (6-4), (9-4)} Daí: Xi- X ={-3, -2, -2, 0, 2, 5} 3º Passo) Construiremos o conjunto do quadrado dos desvios em torno da Média, e determinamos seu somatório: (Xi- X )2={(-3)2, (-2)2, (-2)2, (0)2, (2)2, (5)2}
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 7 de 20
Página 6 de 20
∑(
Xi − X Logo: (Xi- X )2={9, 4, 4, 0, 4, 25} Æ Daí: 4º Passo) Aplicamos a fórmula do Desvio Padrão:
∑ (Xi − X )
)
2
= 46
2
S=
n
Æ
S=
46 = 7,67 6
Æ
Daí: S=2,77 Æ Resposta!
# Fator de Correção de Bessel: Faremos aqui uma ressalva importantíssima: esta fórmula acima apresentada para o Desvio Padrão de um rol somente será empregada no caso de estarmos trabalhando, em nossa questão, com a população do conjunto. Estamos todos recordados (espero!) que, em uma pesquisa estatística, podemos trabalhar com dois tipos de estudo distintos: o estudo por censo e o por amostragem. Vimos isso no Ponto 02 (Primeiros Conceitos). De forma que, no censo trabalhamos considerando toda a população do conjunto; enquanto isso, na amostragem, apenas um subconjunto do todo (com característica de representatividade) será analisada. Destarte, quando o enunciado solicitar que determinemos o Desvio Padrão de um conjunto, teremos essa primeira preocupação: verificar se nele estará representada toda a população ou apenas uma amostra! A regra é simples: se a questão não falar em amostra, entenderemos que estamos diante da população! Vimos algumas questões cujo enunciado revela, às vezes até mesmo sem usar a palavra amostra, que estamos diante de uma parte apenas do todo. Vejamos um exemplo extraído de uma questão que foi trabalhada por nós no início desta aula: “Questão extraída do AFRF-2002.2 O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte:...” Este enunciado explicitou a palavra amostra, mas devemos estar atentos (e muito!) às entrelinhas da questão, quando as informações relevantes não nos forem fornecidas de forma expressa! Bem, para uma questão como esta acima, se o enunciado determinar o cálculo do Desvio Padrão, a nossa fórmula convencional (para uso da população) sofrerá uma ligeira modificação – o fator de correção de Bessel -, de modo que passaremos a utilizar a seguinte fórmula:
∑ (Xi − X )
2
S=
n −1
Observemos que o denominador da fórmula convencional (para população) ganhou um “menos 1” no denominador! Então, para não deixar nenhum resquício de dúvida, resumimos novamente: Æ Desvio Padrão de um rol, considerando toda a população:
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 8 de 20
Página 7 de 20
∑ (Xi − X )
2
S=
n
Æ Desvio Padrão de um rol, considerando apenas uma amostra:
∑ (Xi − X )
2
S=
n −1
Vejamos agora uma questão muito simples, de um concurso passado, para sentirmos a importância deste “fator de correção de Bessel” na determinação do resultado: (AFC-94) Entre os funcionários de um órgão do governo, foi retirada uma amostra de dez indivíduos. Os números que representam as ausências ao trabalho registradas para cada um deles, no último ano, são: 0, 0, 0, 2, 2, 2, 4, 4, 6 e 10. Sendo assim, o valor do desvio padrão desta amostra é: a)
3
b) 9
c) 10
d 30
Sol.: Observemos que o enunciado falou, expressamente, que os dados apresentados fazem parte de uma amostra. Daí, foi solicitado que determinemos o valor do Desvio Padrão! Nesse caso, não nos resta qualquer dúvida! Aplicaremos a fórmula corrigida pelo fator de Bessel (com “menos 1” no denominador!). Ou seja, usaremos o seguinte:
∑ (Xi − X )
2
S=
n −1
1º Passo) Determinamos a Média do conjunto:
X =
(0 + 0 + 0 + 2 + 2 + 2 + 4 + 4 + 6 + 10 ) = 30 = 3,0 10
10
2º Passo) Construímos o conjunto dos desvios (Xi- X ): (Xi- X )={(0-3),(0-3),(0-3),(2-3),(2-3),(2-3),(4-3),(4-3),(6-3),(10-3)} (Xi- X )={(-3),(-3),(-3),(-1),(-1),(-1),(1),(1),(3),(7)} 3º Passo) Construímos o conjunto do quadrado dos desvios (Xi- X )2 e determinamos seu somatório: (Xi- X )2={(-3)2,(-3)2,(-3)2,(-1)2,(-1)2,(-1)2,(1)2,(1)2,(3)2,(7)2} (Xi- X )2={9, 9, 9, 1, 1, 1, 1, 1, 9, 49} Daí:
∑
(Xi- X )2= 90
Página 8 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
4ºPasso) Verificando que este conjunto tem 10 aplicaremos a fórmula corrigida do Desvio Padrão:
∑ (Xi − X )
Pág. 9 de 20
elementos,
ou
seja,
n=10,
2
S=
n −1
Æ S=
90 90 Æ S= Æ S = 10 Æ Resposta da Questão! (10 − 1) 9
Nossa resposta – correta - corresponde ao gabarito “C” das opções! Agora observemos o seguinte: se, por acaso, não nos ativéssemos ao fato de estarmos trabalhando com uma amostra, e não nos lembrássemos de que deveríamos trabalhar, na fórmula, com o fator de correção de Bessel, encontraríamos a seguinte solução:
∑ (Xi − X )
2
S=
n
Æ S=
90 Æ S = 9 Æ Resposta Errada! (gabarito “B”) 10
Fico pensando com meus botões, quanta gente errou essa questão pensando ter acertado...! Conosco não há mais qualquer risco de isso vir a ocorrer! Æ Desvio Padrão para Dados Tabulados: Neste caso, a fórmula adotada obedecerá àquela mesma transição observada para as fórmulas da Média! Estamos lembrados? Repetiremos a fórmula do rol, e multiplicaremos o numerador por fi. Apenas isso! Ficaremos com:
∑ (Xi − X ) . fi 2
S=
n
Vamos a um exemplo prático. Exemplo) Determine o Desvio Padrão do conjunto abaixo: Xi 1 2 3 4 5
fi 2 3 3 2 1 n=10
Como passo preliminar, já verificamos que o conjunto tem 10 elementos, ou seja, n=10. Naturalmente, recordamos que para descobrir este n só precisamos somar a coluna da freqüência absoluta simples – fi! 1º Passo) Calcularemos a Média do conjunto: Para tanto, construiremos a coluna do (Xi.fi)!
Página 9 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 *** Xi 1 2 3 4 5
fi 2 3 3 2 1 n=10
Pág. 10 de 20
Xi.fi 2 6 9 8 5 30
Daí, aplicaremos a fórmula da Média para Dados Tabulados. Teremos:
X=
∑ ( Xi. fi ) n
Æ
Daí: X =
30 10
Æ E: X = 3,0
2ºPasso) Construiremos a coluna dos desvios (Xi- X ): Xi
fi
1 2 3 4 5
2 3 3 2 1 n=10
(Xi- X ) -2 (=1-3) 0 (=3-3) 0 (=3-3) 1 (=4-3) 2 (=5-3)
3ºPasso) Construiremos a coluna do quadrado dos desvios (Xi- X )2: Xi
fi
1 2 3 4 5
2 3 3 2 1 n=10
(Xi- X ) -2 0 0 1 2
(Xi- X )2 4 0 0 1 4
4ºPasso) Construímos a coluna {(Xi- X )2.fi} e determinaremos seu somatório: Xi
fi
1 2 3 4 5
2 3 3 2 1 n=10
(Xi- X ) -2 0 0 1 2
(Xi- X )2 4 0 0 1 4
(Xi- X )2.fi 8 0 0 2 4 14
5ºPasso) Aplicamos a fórmula convencional do Desvio Padrão para Dados Tabulados:
∑ (Xi − X ) . fi 2
S=
n
Æ S=
14 Æ S = 1,4 Æ S = 1,4 Æ S = 1,18 Æ Resposta! 10
Página 10 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 11 de 20
# Fator de Correção de Bessel para Dados Tabulados: Tudo o que foi dito acerca do fator de correção aplicará – analogamente – para os Dados Tabulados! Ou seja, se o enunciado informar – expressa ou conjunto apresentado consiste em uma amostra, o convencional sofrerá a correção do fator de Bessel, “menos 1” no denominador! Em suma:
de Bessel para o rol se implicitamente – que o denominador da fórmula qual seja, aparecerá um
Æ Desvio Padrão para Dados Tabulados, considerando toda a população:
∑ (Xi − X ) . fi 2
S=
n
Æ Desvio Padrão para Dados Tabulados, considerando apenas uma amostra:
∑ (Xi − X ) . fi 2
S=
n −1
Façamos um exemplo: Exemplo) Determine o Desvio Padrão amostral do conjunto abaixo: Xi 1 2 3 4 5
fi 2 3 3 2 1 n=10
Sol.: Eis aí uma outra maneira de o enunciado “revelar” que o conjunto apresentado consiste um uma amostra! Claro: a palavra “amostral” refere-se à “amostra”. Se a questão está pedindo o “Desvio Padrão Amostral” não nos resta qualquer dúvida: utilizaremos a fórmula do Desvio Padrão, corrigida pelo fator de Bessel! Como estes dados são os mesmos que utilizamos no exemplo anterior, fica entendido que seguiremos todos os passos já descritos na resolução apresentada, à exceção do último, uma vez que aqui a nossa fórmula será outra! Daí, utilizando-nos dos resultados já encontrados, passaremos ao passo derradeiro, de aplicação da fórmula conveniente a este enunciado. Teremos:
∑ (Xi − X ) . fi 2
S=
n −1
Æ S=
14 10 − 1
Æ S=
14 Æ S = 1,55 Æ S = 1,25 Æ Resposta! 9
Aproveitando o ensejo, explico que estas fórmulas todas que estamos apresentando serão as que chamaremos de “fórmulas convencionais” do Desvio Padrão! Até o fim desta aula (acredito), estaremos sendo apresentados a “fórmulas alternativas” para a determinação do S. Veremos também as (importantíssimas) Propriedades do Desvio Padrão, sem cujo conhecimento não
Página 11 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 12 de 20
teremos condições de resolver as questões mais recentes elaboradas pela ESAF! Vamos em frente! Æ Desvio Padrão para Distribuição de Freqüências: Novamente observaremos aqui a transição que se dá nas fórmulas da Média. Ou seja, quando trabalhamos com Distribuição de Freqüências, deixamos de lado os elementos individuais Xi e passamos a considerar as Classes! Destarte, não mais irá constar em nossa fórmula o Xi (elemento individual), mas, em seu lugar, surgirá o PM (Ponto Médio), o qual é o legítimo representante de cada classe! Em suma: para a Distribuição de Freqüências, repetiremos a fórmula dos Dados Tabulados, e trocaremos Xi por PM. Teremos o seguinte:
∑ (PM − X ) . fi 2
S=
n
# Fator de Correção de Bessel para Distribuição de Freqüências: Da mesma forma que ocorreu com o conjunto apresentado sob a forma de rol e de Dados Tabulados, na Distribuição de Freqüências também haverá a correção de Bessel – com o acréscimo de “menos 1” no denominador – sempre que o enunciado sugerir que estamos trabalhando com uma amostra! Em suma, teremos: Æ Desvio Padrão para Distribuição de Freqüências, considerando toda a população:
∑ (PM − X ) . fi 2
S=
n
Æ Desvio Padrão para Distribuição de Freqüências, considerando apenas uma amostra:
∑ (PM − X ) . fi 2
S=
n −1
Façamos um exemplo: Exemplo) Determinar o Desvio Padrão do conjunto abaixo: 0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 1 2 5 2 1
1ºPasso) Determinar a Média do conjunto: Neste exemplo, propositadamente (para ganharmos tempo), usamos uma Distribuição Simétrica (espero que todos tenham enxergado!), de modo que sem necessitar nenhuma conta, já podemos afirmar – categoricamente – que:
X = 25
Página 12 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 13 de 20
Que é o PM da classe intermediaria! 2ºPasso) Construiremos a coluna dos Pontos Médios: 0 10 20 30 40
Xi !--!--!--!--!---
10 20 30 40 50
fi 1 2 5 2 1
PM 5 15 25 35 45
3ºPasso) Construiremos a coluna dos desvios (PM- X ): Xi 0 10 20 30 40
!--!--!--!--!---
10 20 30 40 50
fi
PM
1 2 5 2 1
5 15 25 35 45
(PM- X ) -20 -10 0 10 20
4ºPasso) Construiremos a coluna do quadrado dos desvios (PM- X )2: Xi 0 10 20 30 40
!--!--!--!--!---
10 20 30 40 50
fi
PM
1 2 5 2 1
5 15 25 35 45
(PM- X ) -20 -10 0 10 20
(PM- X )2 400 100 0 100 400
5ºPasso) Construímos a coluna {(PM- X )2.fi} e determinaremos seu somatório: Xi 0 10 20 30 40
!--!--!--!--!---
10 20 30 40 50
fi
PM
1 2 5 2 1 n=11
5 15 25 35 45
(PM- X ) -20 -10 0 10 20
(PM- X )2 400 100 0 100 400
(PM- X )2.fi 400 200 0 200 400 1200
6ºPasso) Aplicamos a fórmula do Desvio Padrão:
∑ (PM − X ) . fi 2
S=
n
Æ S=
1200 Æ S = 109,09 Æ E: S = 10,44 Æ Resposta! 11
Observemos que, caso este mesmo enunciado nos informasse que os dados deste conjunto são representativos de uma amostra, não poderíamos nos esquecer de alterar a fórmula padrão, usando o fator de correção de Bessel! Destarte, considerando esta hipótese, ou seja, supondo que a questão indagou o valor do S, afirmando tratar-se o nosso conjunto de uma amostra, teríamos como resultado o seguinte:
Página 13 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
∑ (PM − X ) . fi
Pág. 14 de 20
2
S=
n −1
Æ S=
1200 Æ S = 120,00 Æ E: S = 10,95 Æ Resposta! 10
# Fórmulas Desenvolvidas do Desvio Padrão: Até esse momento, as fórmulas acima apresentadas – para rol, dados tabulados e distribuição de freqüências – representam o que chamaremos de fórmulas reduzidas do Desvio Padrão. Observemos novamente nossas fórmulas reduzidas:
S=
∑ (Xi − X )
S=
∑ (Xi − X ) . fi
S=
∑ (Xi − X )
S=
∑ (Xi − X ) . fi
S=
∑ (PM − X ) . fi
2
Æ Para o rol:
2
ou
n 2
Æ P/ Dados Tabulados:
n
∑ (PM − X ) . fi
2
ou
2
Æ P/ Dist. de Freqüências: S =
n
n −1
n −1
2
ou
n −1
O que facilmente observamos é que, no numerador de cada uma dessas fórmulas, está presente um produto notável daquele tipo (a-b)2. Enxergaram? Pois bem! Procedendo ao desenvolvimento algébrico deste produto notável, chegaremos no final a novas apresentações dessas fórmulas originais, as quais chamaremos de fórmulas desenvolvidas do Desvio Padrão! São elas as seguintes: Æ Fórmula Desenvolvida do S para o Rol: No caso de estarmos trabalhando com os elementos de uma população:
( Xi ) 1⎡ ⎢∑ Xi 2 − ∑ S= n⎢ n ⎣
2
⎤ ⎥ ⎥⎦
ou
⎛ ∑ Xi 2 ⎞ ⎛ ∑ Xi ⎞ ⎟−⎜ ⎟ S= ⎜ ⎜ n ⎟ ⎜ n ⎟ ⎠ ⎝ ⎠ ⎝
2
No caso de estarmos trabalhando com elementos de uma amostra:
S=
2 ( Xi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ Xi − ⎥ n ⎥ n −1 ⎢ ⎣ ⎦
Estas fórmulas desenvolvidas do Desvio Padrão já foram chamadas, em programas de estatística de alguns concursos passados, de Cálculo Simplificado! Não é de se estranhar que essa nomenclatura por vezes provocasse certo questionamento...! Comparemos novamente:
∑ (Xi − X )
2
Fórmula Original: S =
n
e
Página 14 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
( Xi ) 1⎡ ⎢∑ Xi 2 − ∑ Fórmula Simplificada: S = n n⎢ ⎣
2
Pág. 15 de 20
⎤ ⎥ ⎥⎦
Embora o resultado do S encontrado por ambas as fórmulas seja precisamente o mesmo, a diferença maior entre as duas aplicações consiste no fato de que o cálculo “simplificado” dispensa o conhecimento prévio da Média do conjunto! Todos perceberam isso? Daí a pergunta: quando saberemos se devemos utilizar uma fórmula ou outra? Ora, já dissemos que o resultado é o mesmo. Portanto, decidiremos pela utilização de uma ou outra fórmula de acordo com os dados apresentados no enunciado. Vamos a um exemplo! Farei uma pequena adaptação de uma questão do Fiscal da Receita 1998: Exemplo: Os dados seguintes foram obtidos de uma pequena amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. {4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14, 15, 15, 15, 16, 16, 18, 23} Os valores seguintes foram calculados para a amostra:
∑ Xi = 490
e
∑ Xi
2
(∑ Xi ) − 50
2
= 668
Assinale a opção que corresponde os Desvio Padrão amostral:
c)
12 13 13,6
d)
14
a) b)
Sol.: Percebemos que o conjunto foi apresentado sob a forma de um rol. Como este mesmo conjunto representa uma amostra, conforme dito expressamente no enunciado, as duas fórmulas que poderíamos empregar para chegarmos à resposta seriam as seguintes:
∑ (Xi − X )
2
S=
S=
ou
n −1
2 ( Xi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ Xi − ⎥ n ⎥ n −1 ⎢ ⎣ ⎦
Ora, se fizermos uma pequena análise, facilmente constataremos que, se nos decidíssemos pela fórmula reduzida (a primeira), gastaríamos o restante do tempo
(Xi − X )
ainda
o
Xi − X , para, finalmente, calcularmos conjunto dos quadrados dos desvios somatório deste último conjunto e chegarmos ao numerador da fórmula!
o
da
prova
para
construirmos
o
conjunto
(
dos
)
desvios
e
depois
2
Ou seja, tornou-se praticamente inviável a resolução desta questão pela utilização da fórmula reduzida!
Página 15 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 16 de 20
Por outro lado, os dados adicionais fornecidos pelo enunciado nos indicam claramente que poderemos chegar sem demoras ao resultado, caso utilizemos aquela segunda informação que nos foi dada, qual seja:
∑ Xi
2
(∑ Xi ) − 50
2
= 668
Comparemos esta informação com a nossa fórmula desenvolvida do S:
S=
2 ( Xi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ Xi − ⎥ n ⎥ n −1 ⎢ ⎣ ⎦
Pronto! Matamos a charada! Temos que nosso n (número de elementos da amostra) é 50, daí, o restante da resolução reduziu-se a um mero “copiar-colar”. Teremos:
S=
2 ( Xi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ Xi − ⎥ Æ S= n ⎥ n −1 ⎢ ⎣ ⎦
1 ⋅ (668) Æ (50 − 1)
S=
668 49
Æ E: S = 13,6 Æ Resposta! Æ Fórmula Desenvolvida do S para Dados Tabulados: Se estivermos trabalhando com uma população, teremos:
( Xi. fi ) 1⎡ ⎢∑ Xi 2 . fi − ∑ n n⎢ ⎣
2
S=
⎤ ⎥ ⎥⎦
ou
⎛ ∑ Xi 2 . fi ⎞ ⎛ ∑ Xi. fi ⎞ ⎟−⎜ ⎟ S= ⎜ ⎟ ⎜ ⎟ ⎜ n n ⎝ ⎠ ⎝ ⎠
2
No caso de estarmos trabalhando com elementos de uma amostra:
S=
2 ( Xi. fi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ Xi . fi − ⎥ n n −1 ⎢ ⎥⎦ ⎣
Da mesma forma que se dá com o Rol, também aqui os resultados obtidos pelas fórmulas reduzidas e desenvolvidas do Desvio Padrão serão exatamente os mesmos! Caberá a nós observarmos os dados fornecidos pela questão, para decidirmos qual das duas fórmulas nos será mais conveniente! Æ Fórmula Desenvolvida do S para Distribuição de Freqüências: Para elementos de uma população, teremos:
( PM . fi ) 1⎡ ⎢∑ PM 2 . fi − ∑ n⎢ n ⎣
2
S=
⎤ ⎥ ⎥⎦
ou
⎛ ∑ PM 2 . fi ⎞ ⎛ ∑ PM . fi ⎞ ⎟−⎜ ⎟ S= ⎜ ⎟ ⎜ ⎟ ⎜ n n ⎝ ⎠ ⎝ ⎠
2
Página 16 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 17 de 20
No caso de estarmos trabalhando com elementos de uma amostra:
S=
2 ( PM . fi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ PM . fi − ⎥ n n −1 ⎢ ⎥⎦ ⎣
Observação: Se formos atentos, verificaremos que também aqui nas fórmulas desenvolvidas do Desvio Padrão, obedecemos àquelas mesmas transições observadas nas fórmulas da Média, quando passamos de rol para dados tabulados, e destes para a distribuição de freqüências! Vejamos:
( Xi ) 1⎡ ⎢∑ Xi 2 − ∑ Æ Fórmula do S para o Rol: S = n n⎢ ⎣
2
⎤ ⎥ ⎥⎦
Na transição desta fórmula para a dos Dados Tabulados, o que ocorrerá? Qual é a “novidade” que surge nos Dados Tabulados e que não havia no rol? É a freqüências absoluta simples - fi -, a qual aparecerá na nova fórmula, multiplicando no numerador. Teremos:
( Xi. fi ) 1⎡ ⎢∑ Xi 2 . fi − ∑ n n⎢ ⎣
2
Æ Fórmula do S para Dados Tabulados: S =
⎤ ⎥ ⎥⎦
Na nova transição, agora para a fórmula do S da Distribuição de Freqüências, lembraremos que deixamos de trabalhar com elementos individualizados (Xi) e passamos a trabalhar com classes! Destarte, em substituição ao Xi (que representa os elementos individualizados) colocaremos o Ponto Médio – PM -, que representará cada classe do conjunto! Teremos, portanto:
( PM . fi ) 1⎡ ⎢∑ PM 2 . fi − ∑ n n⎢ ⎣
2
Æ Fórmula do S p/ Dist. de Freqüências: S =
Este todas!
raciocínio
certamente
nos
auxiliará
a
memorização
⎤ ⎥ ⎥⎦ destas
fórmulas
# Propriedades do Desvio Padrão: Agora, sim! Vamos ao que interessa! Estamos à página 17 da nossa aula de hoje, e somente agora chegamos ao Ponto principal! Convém ressaltar, portanto, que as questões de prova atualmente elaboradas (pela ESAF, sobretudo) - e que pedem a determinação do Desvio Padrão – têm explorado continuamente o conhecimento de algumas das propriedades desta medida! Veremos inicialmente duas propriedades, e sua aplicação prática em questões de prova! Æ Propriedade do Desvio Padrão da Soma e Subtração: Reza o seguinte: Se somarmos ou subtrairmos todos os elementos de um conjunto original por uma constante, o Desvio Padrão deste mesmo conjunto não se alterará, ou seja, permanecerá exatamente o mesmo.
Página 17 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 18 de 20
Em outras palavras: o Desvio Padrão de um conjunto não é influenciado por operações de soma ou subtração! E isto é de fácil compreensão: imaginemos um conjunto simétrico, representado por uma curva de freqüências – aquela em forma de sino. Pois bem: se somarmos todos os elementos do nosso conjunto por uma mesma constante, o efeito disso será apenas que estaremos deslocando aquela nossa curva original para a direita. Todavia, o formato da curva permanecerá exatamente o mesmo! Em outras palavras: estaremos modificando a Posição da nossa curva, mas não a sua Dispersão! É por isso que as Medidas de Posição sofrem a influência das operações de soma e subtração! Já o mesmo não ocorre com as Medidas de Dispersão, uma vez que ao efetuarmos essas mesmas operações, o “afastamento” dos elementos do conjunto não se alterará!
Æ Propriedade do Desvio Padrão do Produto e Divisão: Semelhante à propriedade da Média: Se multiplicarmos ou dividirmos todos os elementos de um conjunto original por uma constante, o Desvio Padrão do novo conjunto será o Desvio Padrão do conjunto original multiplicado ou dividido por aquela mesma constante. Em outras palavras: o Desvio Padrão é uma medida que é influenciada por operações de produto e divisão! # O Desvio Padrão e a Variável Transformada: Questões recentes de concurso têm explorado o Desvio já conhecida) Variável Transformada! Estamos lembrados que original em outra, somente precisamos realizar uma ou mais conjunto. Essas operações, conforme já sabemos, podem ser ou divisão.
Padrão, associando-o à (nossa para transformar uma variável operações com os elementos do de adição, subtração, produto
Quando aprendemos a calcular a Média de um conjunto, trabalhando com a Variável Transformada, vimos que, na maioria das vezes, nós mesmos precisávamos construir uma Coluna de Transformação da variável original. Já nas questões que envolvem o Desvio Padrão, o mais comum é que o enunciado apresente, ele mesmo, a transformação que deve ser considerada! Vamos a um exemplo! Exemplo: Considere a transformação Z=(X-30)/3. Sabendo que o desvio padrão do atributo Z é Sz=2,0, determine o desvio padrão da variável X. Sol.: Este é um enunciado clássico! Caberá a nós apenas analisar a transformação descrita pela questão para, a partir disso, “desenharmos” o Caminho de Ida e o Caminho de Volta, utilizados para sair da variável original e chegar à transformada e vice-versa. Ora, a variável original é a Xi. Para chegarmos à variável Zi, quais foram as operações realizadas com Xi? Primeiramente, subtraímos o Xi da constante 30; e depois, dividimos pela constante 3. Daí, teremos:
Caminho de Ida 1º)(-30) Sx=?
e
2º)(÷3)
Xi
Zi
Variável Original
Sz=2,0
Variável Transformada
2º)(+30)
e
1º)(x3)
Caminho de Volta
Página 18 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 19 de 20
Observemos que, como já era do nosso conhecimento, o Caminho de Volta será exatamente o inverso do Caminho de Ida, de forma que operações (no caminho de ida) de adição, transformam-se em subtração (no caminho de volta). Analogamente, subtração vira adição, produto vira divisão, e divisão vira produto! Cabe ressaltar que o Caminho de Volta começa onde termina o Caminho de Ida! Disso também já sabíamos! Daí, se quisermos chegar ao valor do Desvio Padrão da variável original (Sx), partiremos do valor do Desvio Padrão da variável Z – Sz – percorrendo o Caminho de Volta – e nos lembrando das propriedades que estudamos há pouco! Daí teremos: 1º)(x3)Æ Pensaremos assim: operações de multiplicação influenciam o Desvio Padrão? Sim! Logo, faremos: 2,0x3=6,0 2º)(+30)Æ Perguntaremos o seguinte: operações de soma influenciam o Desvio Padrão? A resposta é “não”! Logo, não faremos esta segunda conta! Destarte, já chegamos ao final procurado, que será o resultado da primeira operação do Caminho de Volta! Ou seja: Sx=6,0 Æ Resposta da Questão! Vamos a mais um exemplo! Exemplo: Sabendo que o desvio padrão da variável transformada Y=(X-200)/5 é Sy=13, determine o valor do desvio padrão da variável original X. Sol.: O procedimento é o mesmo! Construiremos o desenho dos Caminhos de ida e de Volta, usado para irmos de uma variável à outra e, posteriormente, analisaremos as propriedades do Desvio Padrão! Teremos que: Caminho de Ida 1º)(-200) Sx=?
e
2º)(÷5)
Xi
Yi
Variável Original
Sy=13,0
Variável Transformada
2º)(+200)
e
1º)(x5)
Caminho de Volta Daí, percorrendo o Caminho de Volta e observando as propriedades do S, teremos que: 1º)(x5)Æ A pergunta: multiplicação altera o Desvio Padrão? Sim! Logo, faremos: 13x5=65,0 2º)(+200)Æ Perguntaremos: soma altera o Desvio Padrão? Não! Logo, não faremos essa segunda operação do Caminho de Volta. Destarte, já chegamos ao nosso resultado! Æ Achamos, portanto: Sx=65,0 Æ Resposta da Questão!
Página 19 de 20
ESTATÍSTICA
*** Ponto 23 – MEDIDAS DE DIPERSÃO – PARTE 02 ***
Pág. 20 de 20
Tudo claro? Tudo entendido? Espero que sim! Acho eu que por hoje é só! Aliás, essa nossa aula de hoje foi quase um tratado sobre o Desvio Padrão, não foi mesmo? Só não digo que foi um tratado porque ainda não esgotamos o assunto! Pasmem! Próxima aula ainda começaremos com o que faltou falar sobre essa medida! Quero aproveitar o ensejo e, mais uma vez, agradecer sinceramente pelo carinho que tenho constantemente recebido de vocês todos, meus alunos virtuais! Ainda ontem recebi um e-mail vindo do Uruguai, agradecendo-me pelas nossas aulas! Senti-me bastante lisonjeado. A cada dia que passa me surpreendo mais e mais com o alcance e a repercussão do “Ponto dos Concursos”. Sinto-me cada vez mais honrado em fazer parte desta equipe! Domingo último comemorou-se o Dia dos Pais. Quero, portanto, dedicar esta aula de hoje ao meu pai, o Sr. Sérgio de Carvalho, cujo nome eu carrego com orgulho e alegria. Obrigado, meu pai, pelo seu inigualável exemplo de vida e de dedicação aos seus. Deus o abençoe sempre mais! É também dedicada a nossa aula aos meus alunos que são pais, e que têm que dividir o tempo entre o trabalho, os estudos e a família. Força, meus amigos! A recompensa se aproxima a cada dia! Um forte abraço a todos e até a próxima!
Página 20 de 20
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 1 de 15
Olá, meus amigos! Tudo bem com vocês? Começaremos nossa aula de hoje de uma forma diferente: com uma errata. Recebi alguns e-mails, pelo que sou muito grato, alertando-me acerca de dois "deslizes" cometidos na nossa última aula. # ERRATA DO PONTO 23: 1) O primeiro engano foi um "erro de conta", que surgiu logo na página 1 do Ponto 23, quando estava resolvendo a primeira questão que havia ficado ainda do Ponto 22. Nesta questão, procurávamos calcular o valor do Desvio Quartílico, e já tínhamos encontrado os valores do Primeiro e do Terceiro Quartil, que eram os seguintes: Q1=24,2 e Q3=51,0 Quando foi na hora de aplicar a fórmula do Desvio Quartílico, adivinhem! Errei a subtração! O correto seria:
Dq =
(Q3 − Q1) 2
Æ Dq =
(51− 24,2) 2
Æ
Dq =
(26,8) 2
Æ E: Dq=13,40
Quem me alertou acerca deste equívoco que cometi na subtração foi o amigo paranaense Marcos Aurélio. Muito obrigado! 2) O segundo erro aconteceu na página 10 de nossa aula, quando estávamos no segundo passo da resolução de um exemplo, a fim de encontrarmos o valor do Desvio Padrão. Vou repetir a tabela em que se deu o equívoco, e destacá-lo em vermelho: 2ºPasso) Construiremos a coluna dos desvios (Xi- X ): Xi
fi
1 2 3 4 5
2 3 3 2 1 n=11
(Xi- X ) -2 (=1-3) 0 (=3-3) 0 (=3-3) 1 (=4-3) 2 (=5-3)
Viram aí? Na segunda linha da coluna (Xi- X ), na hora de colocar o Xi, eu chamei de 3, quando o correto seria 2. Além do mais, na hora de somar a coluna do fi, achei o valor 10, quando o correto seria 11. (Nossa! Como foi que eu consegui passar no concurso?!) Daí, a tabela correta teria o seguinte formato: Xi
fi
(Xi- X ) -2 (=1-3) -1 (=2-3) 0 (=3-3) 1 (=4-3) 2 (=5-3)
2 3 3 2 1 n=11 Obviamente que esse "pequeno deslize" influenciou todo o restante da questão que, por fim, ficou com resultado prejudicado. Portanto, a seguir, apresentamos o resultado já corrigido da questão: (as alterações vêm em destaque, em vermelho!) 1 2 3 4 5
Página 1 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 2 de 15
3ºPasso) Construiremos a coluna do quadrado dos desvios (Xi- X )2: Xi
fi
1 2 3 4 5
2 3 3 2 1 n=11
(Xi- X ) -2 -1 0 1 2
(Xi- X )2 4 1 0 1 4
4ºPasso) Construímos a coluna {(Xi- X )2.fi} e determinaremos seu somatório: Xi
fi
1 2 3 4 5
2 3 3 2 1 n=11
(Xi- X ) -2 -1 0 1 2
(Xi- X )2 4 1 0 1 4
(Xi- X )2.fi 8 3 0 2 4 17
5ºPasso) Aplicamos a fórmula convencional do Desvio Padrão para Dados Tabulados:
∑ (Xi − X ) . fi 2
S=
n
Æ S=
17 Æ S = 1,55 Æ 11
S = 1,24 Æ Resposta!
Quem colaborou conosco para indicar este segundo equívoco foram os amigos do Amapá, a turma do Stélio, Rubenita e Cia., além do amigo Cícero Cláudio Falcão. Valeu mesmo! E já que hoje é o “dia da errata”, aproveito o ensejo para fazer uma correção de uma palavra que usei já em diversas ocasiões, escrevendo-a sempre de forma errada! A palavra é mnemônico (esse é o certo!), e eu estava usando “mneumônico”. Essa letra “u” não existe! Desculpem-me! Não foi erro de digitação: foi erro de fato! Quem me advertiu acerca disso foi uma aluna do Espírito Santo que, por uso do e-mail, se tornou uma grande e querida amiga: a Fátima! Depois dessa, contratei-a como minha revisora de ortografia e gramática! Obrigado, Fafá, um grande abraço! Conforme dito na aula anterior, ainda nos faltou falar algo sobre o Desvio Padrão! É o que faremos agora! # Propriedade do Desvio Padrão: Faltou-nos falar acerca de uma outra propriedade do Desvio-Padrão, que é de muito fácil compreensão e que já foi objeto de questão de prova do AFRF! Trata-se de uma propriedade “visual”, porque apenas olhando para o “desenho” abaixo, já teremos como entendê-la. Vejamos:
Página 2 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 3 de 15
1a Parte da Propriedade: Se estivermos trabalhando com uma distribuição simétrica, ou muito próxima da simetria, teremos que, no intervalo compreendido sob a curva de freqüência, limitada pelos valores de ( X -S) a ( X +S), haverá aí aproximadamente 68% dos elementos do conjunto!
( X -S) X ( X +S) 68% 2a Parte da Propriedade: Se estivermos trabalhando com uma distribuição simétrica, ou muito próxima da simetria, teremos que, no intervalo compreendido sob a curva de freqüência, limitada pelos valores de ( X -2S) a ( X +2S), haverá aí aproximadamente 95% dos elementos do conjunto!
( X -2S)
X
( X +2S)
≈95%
3a Parte da Propriedade: Se estivermos trabalhando com uma distribuição simétrica, ou muito próxima da simetria, teremos que, no intervalo compreendido sob a curva de freqüência, limitada pelos valores de ( X -3S) a ( X +3S), haverá aí aproximadamente 99% dos elementos do conjunto!
Página 3 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
( X -3S)
X
Pág. 4 de 15
( X +3S)
≈99%
Como podemos ver, trata-se de uma propriedade cheia de limitações que, exatamente por isso, não será aplicada por nós em uma questão numérica. Destarte, restaria precisarmos dela diante de uma questão teórica. E é exatamente o que já ocorreu! O que temos, efetivamente, que ter em mente acerca desta propriedade? 1º) Só se aplica a distribuições simétricas ou “quase simétricas”. Este “quase simétricas” já é um conceito subjetivo. Quando podemos dizer que a distribuição é “quase simétrica”?? Fica esta pergunta no ar! 2º) Trata-se de uma propriedade de aproximação, e não de exatidão! Se o enunciado da questão vier nos falar palavras como “exatamente”, “precisamente” (ou análogas), já saberemos que é falsa! Vejamos a questão abaixo, extraída do AFRF 2001: Questão) Tem-se um conjunto de n mensurações X1, ..., Xn com média aritmética M e variância S2 , onde M=(X1+...+Xn)/n e S2=(1/n)∑(Xi-M)2. Seja θ a proporção dessas mensurações que diferem de M, em valor absoluto, por pelo menos 2S. Assinale a opção correta: a) Apenas com o conhecimento de M e S não podemos determinar θ exatamente, mas sabe-se que 0,25≥θ. b) O conhecimento de M e S é suficiente para determinar θ exatamente, na realidade tem-se θ=5%, para qualquer conjunto de dados X1,..., Xn. c) O conhecimento de M e S é suficiente para determinar θ exatamente, na realidade tem-se θ=95%, para qualquer conjunto de dados X1,..., Xn. d) O conhecimento de M e S é suficiente para determinar θ exatamente, na realidade tem-se θ=30%, para qualquer conjunto de dados X1,..., Xn. e) O conhecimento de M e S é suficiente para determinar θ exatamente, na realidade tem-se θ=15%, para qualquer conjunto de dados X1,..., Xn. Sol.: O que é preciso aqui é, durante a leitura do enunciado, identificar que ele se refere a uma diferença, em valor absoluto, entre a Média e duas vezes o Desvio Padrão. A leitura desta questão, reconheço, não é das mais fáceis, mas seria o suficiente para nos lembrarmos da propriedade visual do Desvio Padrão e, com isso, recordarmos suas duas limitações! Quais sejam: 1) Apenas para conjuntos simétricos ou quase simétricos; 2) Fornece-nos apenas uma aproximação! Página 4 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 5 de 15
Somente pela lembrança dessa segunda condição – da característica de aproximação – já teríamos condições de acertar a questão! Claro! Basta olharmos para as opções b, c, d e e. Todas elas vêm dizendo que o mero conhecimento da Média e do Desvio Padrão “é suficiente para determinar θ exatamente.” A única opção que não cita essa característica mas, ao contrário, diz expressamente que “não podemos determinar o θ exatamente” é a letra a, resposta da questão!! Agora, sim! Vamos falar em Variância! # VARIÂNCIA: S2 A Variância, conforme se depreende pelo símbolo que a designa, representa nada mais que o quadrado do Desvio-Padrão! Destarte, assim como o Desvio-Padrão, a Variância será também uma medida de dispersão que toma como referência o valor da Média Aritmética do conjunto. Ora, sabendo que a Variância é o quadrado do Desvio-Padrão, concluímos que não haverá nenhuma dificuldade em memorizarmos as fórmulas desta medida. Senão, vejamos: Æ Variância para o Rol: O ponto de partida é a fórmula do Desvio-Padrão:
∑ (Xi − X )
2
S=
n
∑ (Xi − X )
2
S=
ou, no caso da amostra:
n −1
Daí, para chegarmos às fórmulas da Variância, elevaremos as do Desvio Padrão ao quadrado, de forma que desaparecerão os sinais de radical, ou seja, desaparecerá a raiz quadrada! Teremos, portanto:
∑ (Xi − X ) =
2
S
2
n
∑ (Xi − X ) =
2
ou, no caso da amostra:
S
2
n −1
Fazendo o mesmo para o caso das Fórmulas Desenvolvidas do Desvio Padrão, ou seja, extraindo o radical daquelas fórmulas, chegaremos também a fórmulas desenvolvidas da Variância! Para o rol, teremos:
(∑ Xi ) 1⎡ S = ⎢∑ Xi 2 − n n⎢ ⎣
2
2
⎤ ⎥ ⎥⎦
,ou
⎛ ∑ Xi 2 S =⎜ ⎜ n ⎝ 2
⎞ ⎛ ∑ Xi ⎞ ⎟−⎜ ⎟ ⎟ ⎜ n ⎟ ⎠ ⎠ ⎝
2
ou, no caso da amostra: 2 ( Xi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ Xi − ⎥ S = n −1 ⎢ n ⎥ ⎣ ⎦ 2
Página 5 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 6 de 15
Observação: Como podemos ver acima, também no caso da Variância haverá o fator de correção de Bessel para todas as fórmulas, quando o enunciado da questão disser que o conjunto apresentado se trata de uma amostra (e não a população inteira!). Æ Variância para Dados Tabulados: O procedimento será o mesmo: tomaremos as fórmulas do Desvio-Padrão, excluiremos o sinal da raiz quadrada, e pronto! Somente isso! Teremos:
∑ (Xi − X ) . fi = 2
S
2
∑ (Xi − X ) . fi = 2
ou, no caso da amostra:
n
S
2
n −1
No caso das fórmulas desenvolvidas, teremos:
(∑ Xi. fi ) 1⎡ S = ⎢∑ Xi 2 . fi − n n⎢ ⎣
2
2
⎤ ⎥ ⎥⎦
ou
⎛ ∑ Xi 2 . fi ⎞ ⎛ ∑ Xi. fi ⎞ ⎟−⎜ ⎟ S =⎜ ⎟ ⎜ ⎟ ⎜ n n ⎠ ⎠ ⎝ ⎝
2
2
No caso de estarmos trabalhando com elementos de uma amostra: 2 ( Xi. fi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ Xi . fi − ⎥ S = n −1 ⎢ n ⎥⎦ ⎣ 2
Æ Variância para Distribuição de Freqüências: Finalmente, procederemos de forma análoga para determinarmos as fórmulas da Variância – S2 – de uma Distribuição de Freqüências. Teremos, portanto:
∑ (PM − X ) . fi = 2
S
2
n
∑ (PM − X ) . fi = 2
ou, no caso de amostra:
S
2
n −1
Teremos, ainda, as seguintes fórmulas desenvolvidas:
(∑ PM . fi ) 1⎡ S = ⎢∑ PM 2 . fi − n n⎢ ⎣
2
2
⎤ ⎥ ⎥⎦
ou
⎛ ∑ PM 2 . fi ⎞ ⎛ ∑ PM . fi ⎞ ⎟−⎜ ⎟ S =⎜ ⎟ ⎜ ⎟ ⎜ n n ⎠ ⎝ ⎠ ⎝
2
2
Ou, se estivermos trabalhando com elementos de uma amostra: 2 ( PM . fi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ PM . fi − ⎥ S = n n −1 ⎢ ⎥⎦ ⎣ 2
Alguém pode estar pensando: “Puxa! São muitas fórmulas para memorizar!” Bem! Podemos dizer isso de outra maneira: há, de fato, muito a ser memorizado, mas se raciocinarmos do jeito certo, a coisa fica bem mais fácil! Senão, vejamos: já sabemos que as fórmulas - tanto do Desvio Padrão, quanto da Variância – obedecem àquela regra de transição que observamos nas fórmulas da Média Aritmética. Qual seja: das fórmulas do rol para as dos dados tabulados, multiplicamos o numerador por fi; dos dados tabulados para a distribuição de freqüências, trocamos Xi (elemento individualizado) por PM (Ponto Médio). Página 6 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 7 de 15
Sabemos, também, que a Variância é o quadrado do Desvio Padrão! Desse modo, não teremos que perder tempo tentando “decorar” as fórmulas da S2! Basta excluir o sinal da raiz, presente nas fórmulas do Desvio Padrão, e pronto! Em suma: se soubermos as fórmulas do Desvio Padrão, necessariamente também conheceremos as da Variância! Acontece que, ultimamente (leia-se: nos últimos concursos!), as elaboradoras vêm exigindo algo além do mero conhecimento das fórmulas! Passamos a ter, portanto, questões mais “inteligentes”, que também serão facilmente resolvidas, caso conheçamos também as...
# ...PROPRIEDADES DA VARIÂNCIA: As principais propriedades da Variância, que aprenderemos, versam acerca do efeito que as operações de soma, subtração, produto e divisão provocarão sobre o valor desta medida! Da mesma forma que já estudamos para a Média e para o Desvio Padrão, veremos agora o que ocorrerá ao valor da Variância, quando cada elemento de um determinado conjunto for somado a uma constante, ou subtraído, multiplicado ou dividido por uma constante. Æ Propriedade da Soma e da Subtração: Já vimos na aula passada a razão pela qual operações de soma e subtração não influenciam o valor do Desvio Padrão! Ora, sendo também a Variância uma medida de dispersão, continuará valendo para esta a mesma explicação. Relembrando: quando, para todos os elementos de um conjunto, fazemos uma mesma operação de soma ou subtração, o efeito disto será o mero “deslocamento” da curva (para a direita ou esquerda, respectivamente), de modo que a “posição” do conjunto será modificado, mas o “formato” da curva permanecerá exatamente o mesmo! Em outras palavras: operações de soma e subtração alteram a posição do conjunto, mas não sua dispersão! Por conseguinte, as Medidas de Posição – Média, Moda e Mediana – sofrerão influência destas operações (soma e subtração), o mesmo não ocorrendo às Medidas de Dispersão! Conclusão: A Variância não é influenciada por operações de soma e subtração! Æ Propriedade do Produto e da Divisão: Aqui toda atenção é pouca! Para memorizarmos esta regra, pensaremos no que aprendemos para o Desvio Padrão! Para este (S), vimos que se multiplicarmos ou dividirmos os elementos do conjunto por uma constante, o novo Desvio Padrão ficaria multiplicado ou dividido por esta mesma constante! Todos lembrados disso? Pois bem! O raciocínio agora é o seguinte: a Variância é o quadrado do Desvio Padrão, certo? Logo, se multiplicarmos ou dividirmos os elementos de um conjunto por uma constante, a nova Variância ficará multiplicada ou dividida pelo quadrado da constante!!
Página 7 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 8 de 15
Vejamos um exemplo: Consideremos que, para o conjunto original W, o valor da Variância é S2 = 3,0. Se tomarmos todos os elementos deste mesmo conjunto, e os multiplicarmos pela constante k=2, qual será o valor da nova Variância? Sol.: A situação é a seguinte: Para o conjunto original: S2 = 3,0 Aí vem a pergunta: qual foi a operação que fizemos para modificar o conjunto original? Multiplicamos os elementos pela constante k=3 Logo, a Variância do novo conjunto será a Variância anterior, multiplicada pelo quadrado da constante!! Daí, teremos: S2 (Nova) = S2 (original) x (k)2 Logo:
S2 (Nova) = (3,0) x (2)2 Æ
S2 (Nova) = 12,0 Æ Resposta!
# Resumo das Propriedades da Soma, Subtração, Produto e Divisão: O quadro abaixo poderá auxiliar nossa memória, no tocante às propriedades estudadas, e em relação às medidas já vistas: Se tomarmos todos os elementos de um conjunto e os...
A nova Média estará: O novo Desvio Padrão estará: A nova Variância estará:
...Somarmos a uma constante Também somada a esta constante Inalterado
Inalterada
...Subtrairmos ...Multiplicarmos ...Dividirmos de uma por uma constante por uma constante constante Também Também Também multiplicada por dividida por subtraída esta esta constante desta constante constante Também Também Inalterado dividido por multiplicado por esta esta constante constante Multiplicada pelo Dividida pelo Inalterada quadrado quadrado desta desta constante constante
# A Variância e a Variável Transformada: Já era de se esperar que, da mesma forma que provas recentes têm explorado as propriedades da Média Aritmética e do Desvio Padrão, o mesmo também ocorresse com a Variância! Teremos, portanto, que aprender a trabalhar associada ao estudo da Variável Transformada!
a
questão
de
Variância,
Página 8 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 9 de 15
Vamos a um exemplo ilustrativo: Exemplo: Consideremos a transformação Z=(X-30)/3. Sabendo atributo Z é S2(z)=3,0, determine a Variância da variável X.
que
a
Variância
do
Sol.: Tenho certeza que já sabemos como proceder, frente a uma questão como essa! Naturalmente, teremos que “desenhar” o Caminho de Ida e o Caminho de Volta, que consistem na “transformação” descrita pelo enunciado. Assim, teremos: Caminho de Ida 1º)(-30) S2(x)=?
e
2º)(÷3)
Xi
Zi
Variável Original
S2(z)=3,0
Variável Transformada
2º)(+30)
e
1º)(x3)
Caminho de Volta Resta-nos agora apenas percorrermos as operações do Caminho lembrando-nos das propriedades da Variância! Assim, teremos:
de
Volta,
1º)(x3)Æ Pensaremos assim: operações de multiplicação influenciam a Variância? Sim! De que forma? De forma que a nova Variância será a Variância original multiplicada pelo quadrado da constante!! Logo, faremos: 3,0 x (3)2 = 3,0 x 9,0 = 27,0 2º)(+30)Æ A resposta alcançamos Caminho de
Perguntaremos o seguinte: operações de soma influenciam a Variância? é “não”! Logo, deixaremos de efetuar essa segunda conta! Portanto, a resposta desejada, que será o resultado da primeira operação do Volta! Ou seja: S2(x)=27,0 Æ Resposta da Questão!
Vamos aí a uma questão de prova!
Extraída do AFRF 2002.1: Considere
∑Z
2
a
transformação
Z=(X-140)/10.
Para
o
atributo
Z
encontrou-se
. fi = 1680 , onde fi é a freqüência simples da classe i e Zi o ponto médio de
classe transformado. Assinale a opção que dá a variância amostral do atributo X. a) 720,00 b) 840,20 c) 900,00 d) 1200,15 e) 560,30 Obs.: Considerando informações da primeira questão desta prova, teremos que o número de elemento deste conjunto é n=200. Sol.: Vamos iniciar esta questão “desenhando” os Caminhos de Ida e de Volta, percorridos para sairmos da variável original – Xi – e chegarmos à transformada – Yi -, e vice-versa! Teremos: Página 9 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 10 de 15
Caminho de Ida 1º)(-140) S2(x)=?
e
2º)(÷10)
Xi
Zi
Variável Original
Variável Transformada
2º)(+140)
e
Z2.fi=1680,
1º)(x10)
Caminho de Volta
Daí, procuraremos em nossas fórmulas da Variância, alguma delas com a qual possamos trabalhar o dado fornecido pela questão! Ou seja, alguma fórmula na qual apareça o PM2.fi.
Se tomarmos as fórmulas convencionais, veremos que todas trabalham com os desvios (Xi- X )2 ou (PM- X )2. Como não dispomos desta informação para a variável transformada Zi, então já percebemos que iremos usar, de fato, a fórmula desenvolvida da Variância!
Teremos, como vimos acima, as seguintes possibilidades:
(∑ PM . fi ) 1⎡ S = ⎢∑ PM 2 . fi − n n⎢ ⎣
2
(I)
(II)
(III)
2
⎤ ⎥ ⎥⎦
⎛ ∑ PM 2 . fi ⎞ ⎛ ∑ PM . fi ⎞ ⎟−⎜ ⎟ S =⎜ ⎟ ⎜ ⎟ ⎜ n n ⎠ ⎠ ⎝ ⎝
2
2
2 ( PM . fi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ PM . fi − ⎥ S = n n −1 ⎢ ⎥⎦ ⎣ 2
Já sabemos que a fórmula (III) se aplicará aos casos em que o conjunto apresentado for uma amostra! É o nosso caso? Sim! Uma vez que o enunciado solicitou o cálculo da Variância Amostral! De uma forma ou de outra, parece-me que o enunciado foi falho em apresentar os dados, pois se observarmos qualquer destas três possibilidades, veremos que nos foi fornecida apenas a primeira parte da fórmula, ou seja, a parte que trata do (Σ PM2.fi). Não temos nada a respeito do que seria o valor de (Σ PM.fi)2!! E outra: se o elaborador queria mesmo que trabalhássemos com uma resolução rápida (quase imediata), também não deveria tratar o conjunto como uma amostra. Senão vejamos: Se nosso conjunto não se tratasse de uma amostra, utilizaríamos a fórmula (II), e teríamos o seguinte:
Página 10 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 *** ⎛ ∑ PM 2 . fi ⎞ ⎛ ∑ PM . fi ⎞ ⎟−⎜ ⎟ S =⎜ ⎟ ⎜ ⎟ ⎜ n n ⎠ ⎝ ⎠ ⎝
Pág. 11 de 15
2
2
Daí, faríamos ainda a seguinte consideração: a segunda parcela desta fórmula tem como denominador o n2. Como n é igual a 200, teríamos, portanto que n2=40.000. Ora, qualquer coisa dividida por 40.000 torna-se um valor muito pequeno, que poderíamos “desprezar”. Destarte, reduziríamos nossa fórmula (II) a apenas:
⎛ ∑ PM 2 . fi ⎞ ⎟ S =⎜ ⎜ ⎟ n ⎝ ⎠ 2
E, agora sim, usaríamos chegaríamos ao seguinte:
⎛ ∑ PM 2 . fi ⎞ ⎟ S =⎜ ⎜ ⎟ n ⎝ ⎠ 2
Æ
o
dado
⎛ ∑ Z 2 . fi ⎞ ⎟ Æ S (Z ) = ⎜ ⎜ ⎟ n ⎝ ⎠ 2
fornecido
⎛ 1680 ⎞ S 2 (Z ) = ⎜ ⎟ ⎝ 200 ⎠
pelo
Æ
enunciado,
pelo
qual
S 2 ( Z ) = 8,40
Na seqüência, retornaremos aos Caminhos, para enfim percorrermos o de Volta e chegarmos ao valor da Variância da Variável original, lembrando-nos das propriedades da Variância. Teremos: Caminho de Ida 1º)(-140) S2(x)=?
e
2º)(÷10)
Xi
Zi
Variável Original
S2(z)=8,4
Variável Transformada
2º)(+140)
e
1º)(x10)
Caminho de Volta Daí: 1º)(x10)Æ Multiplicaremos pelo quadrado da constante! (Lembrados?). Ou seja, faremos: 8,4 x (10)2 = 8,4 .100 = 840,00 2º)(+140)Æ Se a operação agora é de soma, sabemos que não a efetuaremos com a Variância, uma vez que esta medida não se altera diante de somas ou subtrações! Portanto, chegamos onde queríamos, realizando apenas a primeira conta do Caminho de Volta! Ou seja: S2(x)=840,0 Æ Resposta da Questão! O problema é que, procurando no resultado, não achamos exatamente esta resposta! O que encontramos é uma bem próxima, que é a letra (b): 840,20 que, por sinal, é o gabarito oficial da questão! E esta é, de fato, a resposta a qual chegaríamos, se tivéssemos usado o caminho mais demorado, e aplicado a fórmula convencional da Variância. Querem ver?
Página 11 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 12 de 15
Apresentarei o conjunto fornecido pela questão, já com a coluna da freqüência absoluta simples! Foi o seguinte: Classes fi 70 – 90 10 90 – 110 20 110 – 130 50 130 – 150 60 150 – 170 30 170 – 190 20 190 - 210 10 O valor da Média foi determinado na primeira questão desta prova, de forma que, quando chegássemos a este presente enunciado, já disporíamos do seu valor! Teremos, pois que: X =138,00. Como dito acima, vamos encontrar para esse conjunto o valor da Variância amostral, usando a fórmula convencional! Empregaremos, portanto:
∑ (PM − X ) . fi = 2
S
2
n −1
Obs.: Não podemos esquecer da Correção de Bessel, ou seja, do “menos 1” no denominador, uma vez que estamos trabalhando com uma amostra! 1o Passo) Construir a coluna dos Pontos Médios! Classes fi PM 80 10 70 – 90 100 20 90 – 110 120 50 110 – 130 140 60 130 – 150 160 30 150 – 170 180 20 170 – 190 200 10 190 - 210 2o Passo) Construir a coluna do (PM- X ): Classes 70 90 110 130 150 170 190
– – – – – – -
90 110 130 150 170 190 210
fi
PM
10 20 50 60 30 20 10
80 100 120 140 160 180 200
(PM- X ) -58 -38 -18 2 22 42 62
3o Passo) Construir a coluna do (PM- X )2: Classes 70 90 110 130 150 170 190
– – – – – – –
90 110 130 150 170 190 210
fi
PM
10 20 50 60 30 20 10
80 100 120 140 160 180 200
(PM- X ) -58 -38 -18 2 22 42 62
(PM- X )2 3.364, 1.444, 324, 4, 484, 1.764, 3.844,
Página 12 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 13 de 15
4o Passo) Construir a coluna do [(PM- X )2.fi] e determinar seu somatório: Classes 70 90 110 130 150 170 190
– – – – – – -
90 110 130 150 170 190 210
fi
PM
10 20 50 60 30 20 10 n=200
80 100 120 140 160 180 200
(PM- X ) -58 -38 -18 2 22 42 62
(PM- X )2 3.364, 1.444, 324, 4, 484, 1.764, 3.844,
(PM- X )2.fi 33.640, 28.880, 16.200, 240, 14.520, 35.280, 38.440, 167.200,
5o Passo) Aplicar a fórmula. Teremos:
∑ (PM − X ) . fi = 2
S
2
n −1
Æ E:
Æ
S2 =
S 2 = 840,20 Æ
167.200 (200 − 1)
Æ
S2 =
167.200 199
Resposta da Questão!
Essa sim, igual a do gabarito! Agora comparemos as duas resoluções. Nem há como fazer isso...! Levaríamos infinitamente mais tempo para resolver pela fórmula convencional (segunda resolução), do que pela fórmula desenvolvida (primeira resolução), embora aqui tivéssemos que fazer uma série de considerações e encontraríamos, ainda assim, uma resposta aproximada. Ufa! E aí, meus amigos? Ultimamente este modelo de questão acima é o que tem sido normalmente cobrado em provas de estatística dos concursos. Ou seja: questões que trabalham com a variável transformada! Veremos agora o Coeficiente de Variação, nossos estudos sobre as Medidas de Dispersão!
o
qual
praticamente
encerrará
# Coeficiente de Variação de Pearson: CV Falaremos rápido a respeito do Coeficiente de Variação! A primeira consideração é que o CV é uma Medida de Dispersão Relativa! O que é isso? É um tipo de medida que se utiliza de uma relação entre o valor do Desvio Padrão e o valor de uma Medida de Tendência Central. Existem, portanto, diferentes tipos de Coeficiente de Variação! Interessarnos-á apenas um: o CV de Pearson! Este consiste no quociente entre o valor do Desvio Padrão e o valor da Média Aritmética do conjunto. Ou seja:
CV =
S X
Página 13 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 14 de 15
Por isso chama-se Dispersão Relativa: é o valor do Desvio Padrão em relação a alguém! E esse alguém é a Média! Portanto, se conhecermos, para um determinado conjunto, o valor do Desvio Padrão e o valor da Média Aritmética, então já poderemos calcular imediatamente o Coeficiente de Variação! Outra observação importante: o CV é uma medida adimensional. Ou seja, não tem unidade! Por exemplo, se estivermos analisando um conjunto cujos elementos representam a altura de um grupo de pessoas, medidas em quilogramas (kg). Dessa forma, se calcularmos os valores do Desvio Padrão e da Média Aritmética desse conjunto, ambos estarão representados igualmente em quilogramas. Daí, se quisermos calcular o Coeficiente de Variação deste mesmo conjunto, teremos:
CV =
S ( kg ) X (kg )
, de forma que as unidades se anularão, e o que restará será um
resultado adimensional! Esta observação já foi exigida em uma prova antiga, em uma questão teórica! Atualmente, é outro o enfoque das questões de concurso a respeito do Coeficiente de Variação! Vejamos o enunciado abaixo, extraído da prova do AFRF 2001: Questão) Numa amostra de tamanho 20 de uma população de contas a receber, representadas genericamente por X, foram determinadas a média amostral M=100 e o desvio-padrão S=13 da variável transformada (X-200)/5. Assinale a opção que dá o coeficiente de variação amostral de X. a) 3,0% b) 9,3% c) 17,0% d) 17,3% e) 10,0% Sol.: Este enunciado é o “retrato” atual das questões que envolvem cálculo do CV! Novamente aqui teremos que trabalhar com a variável transformada! Desenharemos, pois, os Caminhos de Ida e Volta de transformação das variáveis, da forma determinada pela questão! Teremos: Caminho de Ida 1º)(-200)
X =? Sx=?
e
2º)(÷5)
Xi
Zi
Variável Original
Variável Transformada
2º)(+200)
e
Z =100, Sz=13,
1º)(x5)
Caminho de Volta Tenho certeza que já sabemos qual será nosso procedimento! Estou certo? Claro! Teremos que trabalhar, individualmente, com as duas medidas que conhecemos: Média e Desvio-Padrão! Daí, primeiro encontraremos o valor da Média da variável original, percorrendo o Caminho de Volta e lembrando as propriedades da Média. Depois, faremos o mesmo para o Desvio-Padrão, ou seja: percorreremos o Caminho de Volta partindo do Sz, e lembrando-nos das propriedades do DesvioPadrão! Página 14 de 15
ESTATÍSTICA
*** Ponto 24 – MEDIDAS DE DIPERSÃO – PARTE 03 ***
Pág. 15 de 15
Fazendo isso, chegaremos ao que nos interessa: os valores da Média e do Desvio-Padrão da variável original. E aí, fica fácil! Só nos restará aplicar a fórmula do CV. Passemos ao passo de achar a Média X : 1º)(x5)Æ Multiplicaremos pela constante! Ou seja, faremos: 100 x 5 = 500 2º)(+200)Æ Somaremos ao valor da constante! Teremos, portanto: 500+200= 700 Ou seja: X =700 Encontraremos agora o Sx: 1º)(x5)Æ Multiplicaremos pela constante! Ou seja, faremos: 13 x 5 = 65 2º)(+140)Æ A soma não influencia o valor do Desvio-Padrão! Ou seja: Sx=65 Daí, aplicando agora a fórmula do Coeficiente de Variação, teremos que:
CV =
S 65 Æ CV = Æ E: CV = 0,093 Æ 700 X
CV=9,3%
Æ Resposta da Questão!
É isso! Ficaremos hoje por aqui! E encerramos, com isso, o estudo das Medidas de Dispersão! Irei tentar selecionar algumas boas questões de prova, e as colocarei na próxima aula, sob título de SIMULADO 02. Que tal? Aos apressadinhos de plantão (e como tem gente “aperreada” com a expectativa do edital...!), digo que estamos bem mais próximos que distantes de vermos toda a teoria para a prova do AFRF. O momento é de manter a calma, a tranqüilidade e a perseverança! Após o simulado da próxima aula, veremos Assimetria e Curtose, que são dois assuntos facílimos!! E rápidos! E ficará restando apenas Números Índices! Nas minhas contas, vai dar tempo de sobra! Quero mandar um abraço forte ao meu amigo Prof. João Antônio, com quem estive essa semana passada no Recife (eu estava de férias!), dando aulas de Matemática Financeira para várias turmas (cerca de 800 alunos!), culminando com um “aulão”, ocorrido no Teatro Guararapes. O Prof. João Antônio registrou alguns momentos deste aulão e os colocou no seu site pessoal, o . Se alguém quiser conferir, é só acessar. Dedico esta nossa aula a todos os que, assim como eu, estão aniversariando hoje! (O Serginho aqui está fazendo 31...) Um abraço forte a todos! Até a próxima! Página 15 de 15
ESTATÍSTICA
*** Ponto 25 – SIMULADO 02 ***
Pág. 1 de 3
SIMULADO 02 Olá, amigos! Conforme combinado, apresentamos hoje nosso segundo simulado, envolvendo apenas questões de concurso acerca dos assuntos já estudados em nossas aulas! Diferentemente do simulado anterior, estamos apresentando apenas os enunciados, e deixamos as resoluções para o início do próximo Ponto. Convém que ninguém deixe de tentar resolver esse simulado, e mais agora que os concursos fiscais foram autorizados! O momento é de intensificar os estudos, porém com tranqüilidade e, sobretudo, com planejamento! Vamos às questões... 1. (TTN-94) Marque a alternativa correta: a) O intervalo de classe que contém a moda é o de maior freqüência relativa acumulada (crescentemente). b) A freqüência acumulada denominada “abaixo de” resulta da soma das freqüências simples em ordem decrescente. c) Em uma distribuição de freqüências existe uma freqüência relativa acumulada unitária, ou no primeiro, ou no último intervalo de classe. d) O intervalo de classe que contém a mediana é o de maior freqüência absoluta simples. e) Os intervalos de classe de uma distribuição de freqüência têm o ponto médio eqüidistante dos limites inferior e superior de cada classe e sua amplitude ou é constante ou guarda uma relação de multiplicidade com a freqüência absoluta simples da mesma classe. (AFC-94) Para a solução das três próximas questões (2, 3 e 4) considere os dados da tabela abaixo, que representa a distribuição de freqüências das notas em uma prova de estatística aplicada em três turmas de 100 alunos cada.
0 2 4 6 8 2. a) b) c) d) e)
Classes de Notas !--- 2 !--- 4 !--- 6 !--- 8 !--- 10 Total
Freqüências das Notas na Prova de Estatística TURMA 01 TURMA 02 TURMA 03 20 10 5 40 15 10 30 50 70 6 15 10 4 10 5 100 100 100
(AFC-94) Assinale a afirmação correta: Moda (turma 2) < Moda (turma 3) Média (turma 1) > Média (turma 2) Média (turma 2) < Média (turma 3) Mediana (turma 1) < Mediana (turma 2) Mediana (turma 2) > Mediana (turma 3)
ESTATÍSTICA
3. a) b) c) d) e)
*** Ponto 25 – SIMULADO 02 ***
Pág. 2 de 3
(AFC-94) A única opção errada é: 1º quartil (turma 1) > 1º quartil (turma 3) desvio-padrão (turma 2) > desvio-padrão (turma 3) média (turma 2) = média (turma 3) coeficiente de variação (turma 2) > coeficiente de variação (turma 3) na turma 3: média = mediana = moda
4. (AFC-94) A distribuição aritmética: a) Nas três turmas b) Nas turmas 1 e 2 c) Nas turmas 1 e 3 d) Somente na turma 1 e) Nas turmas 2 e 3
de
notas
é
simétrica
em
relação
à
média
5. (BANCO CENTRAL-94) Em certa empresa, o salário médio era de $90.000,00 e o desvio-padrão era de $10.000,00. Todos os salários receberam um aumento de 10%. O salário médio passou a ser de: a) $ 90.000,00 d) $ 99.000,00 b) $ 91.000,00 e) $ 100.000,00 c) $ 95.000,00
6. (AFRF-2002) Um atributo W tem média amostral a≠0 e desvio padrão positivo b≠1. Considere a transformação Z=(W-a)/b. Assinale a opção correta. a) A média amostral de Z coincide com a de W. b) O coeficiente de variação amostral de Z é unitário. c) O coeficiente de variação amostral de Z não está definido. d) A média de Z é a/b. e) O coeficiente de variação amostral de W e o de Z coincidem.
7. (FTE-PA-2002/ESAF) Um certo atributo W, medido em unidades apropriadas, tem média amostral 5 e desvio-padrão unitário. Assinale a opção que corresponde ao coeficiente de variação, para a mesma amostra, do atributo Y = 5 + 5W. a) 16,7% b) 20,0% c) 55,0% d) 50,8% e) 70,2%
ESTATÍSTICA
*** Ponto 25 – SIMULADO 02 ***
Pág. 3 de 3
8. (ACE-MICT-1998/ESAF) Num estudo sobre a distribuição do preço de venda de um produto obteve-se, a partir de uma amostra aleatória de 25 revendedores, a tabela de freqüências seguinte: Classe de mi fi Preços [ 5 – 9) 7 3 [ 9 – 13) 11 5 [13 – 17) 15 7 [17 – 21) 19 6 [21 – 25) 23 3 [25 – 29) 27 1 As quantidades mi e fi representam o ponto médio e a freqüência da classe de preços i. Sabendo-se que: ∑(fi mi2) – (∑ fi mi)2 / 25 ≈ 694 assinale a opção que melhor aproxima o desvio padrão amostral. a) b) c) d) e)
0,5 (347/3)0.5 6 0,9 (345/3)0.5 28,91 8 Boa sorte a todos! Resoluções na próxima aula. Até lá!
ESTATÍSTICA
*** Ponto 26 – RESOLUÇÃO DO SIMULADO 02 ***
Pág. 1 de 9
RESOLUÇÃO DO SIMULADO 02 Olá, amigos! Sem perda de tempo, passemos às resoluções do Simulado 02! Vamos às questões! 1. (TTN-94) Marque a alternativa correta: a) O intervalo de classe que contém a moda é o de maior freqüência relativa acumulada (crescentemente). Sol.: Falso! O intervalo que contém a Moda, sabemos bem disso, é o da Classe Modal, a qual é aquela que possui maior freqüência absoluta simples, ou seja, maior fi! b) A freqüência acumulada denominada “abaixo de” resulta da soma das freqüências simples em ordem decrescente. Sol.: Falso! A coluna “apelidada” de abaixo de, conforme já estamos cansados de saber, é a coluna da freqüência absoluta acumulada crescente – fac! E, portanto, é uma freqüência que se acumula pela soma da freqüência simples, em ordem crescente! c) Em uma distribuição de freqüências existe uma freqüência relativa acumulada unitária, ou no primeiro, ou no último intervalo de classe. Sol.: Verdadeiro! Conforme estudamos, no tocante às freqüências relativas acumuladas, a Fac(↓) termina com 100% e a Fad (↑) começa com 100%. E 100%=1, logo, este item está perfeito! d) O intervalo de classe que contém a mediana é o de maior freqüência absoluta simples. Sol.: Falso! Tornar-se-ia correto este item, se trocássemos a palavra “mediana” pela palavra “moda”. Pois sabemos que a classe de maior fi é justamente a Classe Modal! e) Os intervalos de classe de uma distribuição de freqüência têm o ponto médio eqüidistante dos limites inferior e superior de cada classe e sua amplitude ou é constante ou guarda uma relação de multiplicidade com a freqüência absoluta simples da mesma classe. Sol.: Falso! Esta proposição está correta até a palavra “classe” no começo da terceira linha! Daí em diante, a informação que passou a ser fornecida está inteiramente equivocada, uma vez que inexiste qualquer relação (de multiplicidade ou outra) entre a amplitude da classe – h – e a freqüência absoluta simples – fi.
ESTATÍSTICA
*** Ponto 26 – RESOLUÇÃO DO SIMULADO 02 ***
Pág. 2 de 9
(AFC-94) Para a solução das três próximas questões (2, 3 e 4) considere os dados da tabela abaixo, que representa a distribuição de freqüências das notas em uma prova de estatística aplicada em três turmas de 100 alunos cada.
0 2 4 6 8 2. a) b) c) d) e)
Classes de Notas !--- 2 !--- 4 !--- 6 !--- 8 !--- 10 Total
Freqüências das Notas na Prova de Estatística TURMA 01 TURMA 02 TURMA 03 20 10 5 40 15 10 30 50 70 6 15 10 4 10 5 100 100 100
(AFC-94) Assinale Moda (turma 2) Média (turma 1) Média (turma 2) Mediana (turma 1) Mediana (turma 2)
a < > < < >
afirmação correta: Moda (turma 3) Média (turma 2) Média (turma 3) Mediana (turma 2) Mediana (turma 3)
Sol.: Façamos uma análise preliminar acerca das três distribuições de freqüências que nos foram fornecidas! Já disse em outras ocasiões e repito aqui: nossa primeira preocupação ao nos depararmos com uma distribuição em nossa prova será a de verificar se ela é simétrica ou não! Neste caso, facilmente constatamos que são simétricos os conjuntos “Turma 02” e “Turma 03”. Como as três distribuições têm as mesmas classes, já podemos, somente lembrando das dicas de ouro do nosso curso, concluir que: Média (turma 2) = Moda (turma 2) = Mediana (turma 2) = 5 Média (turma 3) = Moda (turma 3) = Mediana (turma 3) = 5 Uma vez que 5 é o Ponto Médio da classe intermediária! Somente por esta constatação, já eliminamos das possibilidades de resposta as opções a, c e e, as quais fazem comparativos entre medidas das turmas 2 e 3. Restam-nos, portanto, duas opções. Na letra b, o item compara a Média das turmas 1 e 2. Na letra d, compara a Mediana destas mesmas turmas. Daí, como já sabemos que Média e Mediana da turma 2 têm valor igual a 5, bastaria que calculássemos ou Média, ou Mediana da turma 1 e chegaríamos à resposta! Todavia, podemos até poupar esse trabalho, se tivermos o seguinte raciocínio: O que significa a Mediana de um conjunto? Significa aquele elemento que o divide em duas partes iguais, ou seja, exatamente ao meio.
ESTATÍSTICA
*** Ponto 26 – RESOLUÇÃO DO SIMULADO 02 ***
Pág. 3 de 9
Se olharmos bem para a turma 1, veremos que a maior parte dos seus elementos (90% deles) se encontra distribuído nas três primeiras classes. Daí, podemos estar certos de que a Mediana deste conjunto será um valor menor do que o valor que seria encontrado caso a distribuição fosse simétrica. Não é claro isso? Então, por mera dedução, concluímos que a resposta da questão é a letra a. Caso, na hora da prova, não conseguíssemos desenvolver esse raciocínio, calcularíamos a Média ou a Mediana da turma 1 (só é preciso uma delas!) e chegaríamos à mesma resposta correta! 3. a) b) c) d) e)
(AFC-94) A única opção errada é: 1º quartil (turma 1) > 1º quartil (turma 3) desvio-padrão (turma 2) > desvio-padrão (turma 3) média (turma 2) = média (turma 3) coeficiente de variação (turma 2) > coeficiente de variação (turma 3) na turma 3: média = mediana = moda
Sol.: As opções c e e trazem assertivas verdadeiras, conforme já havíamos concluído pela análise da questão anterior. Logo, uma vez que a questão quer saber a opção errada, aquelas já estão excluídas das nossas possibilidades de resposta! Agora, observemos as letras b e d. Elas comparam Desvio-Padrão e Coeficiente de Variação das turmas 2 e 3. Acerca das turmas 2 e 3, já sabemos que ambas são simétricas e, portanto, têm a mesma Média, Moda e Mediana. Lembremos, então, de qual é a relação que há entre o Coeficiente de Variação (CV) e o Desvio-Padrão (S) de um conjunto: CV =
S X
Ora, uma vez que, para as turmas 2 e 3, o valor da Média (que é o denominador da fórmula) é o mesmo, então podemos concluir que, nesse caso: Æ Se S(turma 2) > S(turma 3) ⇒ CV(turma 2) > CV(turma 3) Æ Se S(turma 2) < S(turma 3) ⇒ CV(turma 2) < CV(turma 3)
e
Em suma: se a opção b estiver correta, necessariamente a opção d também o estará! E se a opção b estiver errada, necessariamente o mesmo valerá para a opção d. Como nesta questão só poderemos ter um único item errado, a opção que nos restou foi a letra a, que é exatamente a nossa resposta! Daí: Opção a Æ Resposta da Questão!
ESTATÍSTICA
*** Ponto 26 – RESOLUÇÃO DO SIMULADO 02 ***
Pág. 4 de 9
Obs.: A prova da ESAF de estatística geralmente é assim: ela é feita para dar tempo de ser resolvida, desde que o aluno perceba os caminhos que o levarão a economizar o tempo de resolução! São exatamente estes caminhos que estou tentando mostrar aqui! 4. (AFC-94) A distribuição aritmética: a) Nas três turmas b) Nas turmas 1 e 2 c) Nas turmas 1 e 3 d) Somente na turma 1 e) Nas turmas 2 e 3
de
notas
é
simétrica
em
relação
à
média
Sol.: Esta era a mais fácil desta seqüência! Aliás, já sabíamos sua resposta desde o início: são simétricas as distribuições “turma 2” e “turma 3”. Portanto: Opção e Æ Resposta da Questão! 5. (BANCO CENTRAL-94) Em certa empresa, o salário médio era de $90.000,00 e o desvio-padrão era de $10.000,00. Todos os salários receberam um aumento de 10%. O salário médio passou a ser de: a) $ 90.000,00 d) $ 99.000,00 b) $ 91.000,00 e) $ 100.000,00 c) $ 95.000,00 Sol.: Uma questão bastante fácil, desde que saibamos ler as entrelinhas do enunciado! O que precisamos fazer aqui é apenas traduzir a informação fornecida pela questão! E a informação foi a seguinte: todos os elementos do conjunto sofreram um aumento de 10%. Que operação é essa, aumentar 10%? É uma soma? É um produto? É uma divisão? Qual? Podemos fazer um teste. Usemos os elementos 100, 200 e 300. Æ Æ Æ
100 aumentado de 10% vai para 110; 200 aumentado de 10% vai para 220; 300 aumentado de 10% vai para 330.
Daí, qual seria a mesma operação que aplicaríamos aos valores 100, 200 e 300, para que os resultados fossem exatamente aqueles (110, 220 e 330). Todos enxergaram, agora? É um produto! Aumentar um valor em 10% é o mesmo que multiplicá-lo por 1,10.
ESTATÍSTICA
*** Ponto 26 – RESOLUÇÃO DO SIMULADO 02 ***
Pág. 5 de 9
Agora é só lembrar das propriedades da Média, e recordar que se multiplicarmos todos os elementos do conjunto por uma constante, nossa nova Média ficará também multiplicada por esta mesma constante!
6. a) b) c) d) e)
Daí: Média original=90.000 E: 90.000 x 1,10 = 99.000,00 Æ Opção d Æ Resposta da Questão! (AFRF-2002) Um atributo W tem média amostral a≠0 e desvio padrão positivo b≠1. Considere a transformação Z=(W-a)/b. Assinale a opção correta. A média amostral de Z coincide com a de W. O coeficiente de variação amostral de Z é unitário. O coeficiente de variação amostral de Z não está definido. A média de Z é a/b. O coeficiente de variação amostral de W e o de Z coincidem.
Sol.: Também uma questão muito fácil! O que complica um pouco é a mistura das letrinhas! Então, minha dica é que demos “nomes aos bois”, mas aqueles nomes com os quais já estamos acostumados. Por exemplo: a questão chamou média da variável W de a. Nós a chamaremos de W ! A questão chamou Desvio-Padrão da variável W de b. Nós o chamaremos de Sw. Logo, a transformação proposta pelo enunciado, quando traduzido para a nossa nomenclatura convencional, ficará a seguinte: Z=
(W − W ) Sw
Onde: W é nossa Variável Original e Z, nossa Variável Transformada! Daí, desenhemos os Caminhos de Ida e Volta desta transformação: Caminho de Ida
Sw
W
1º)(- W )
Wi
e
2º)(÷Sw)
Variável Original
Zi
Variável Transformada
2º)(+ W )
e
1º)(xSw)
Caminho de Volta
Agora, sim! Analisemos as opções! a) A média amostral de Z coincide com a de W.
Sz
Z
ESTATÍSTICA
*** Ponto 26 – RESOLUÇÃO DO SIMULADO 02 ***
Pág. 6 de 9
Sol.: Falso! Para sairmos de W e chegarmos a Z teremos que percorrer o caminho de ida da transformação. Daí, faremos duas operações! Na primeira delas, faremos ( W - W )=0. Na segunda, dividiríamos o resultado por Sw. Ora, zero dividido por qualquer coisa é zero, mesmo! Daí, concluímos que o Z =0. Como o enunciado falou que o W é um valor diferente de zero, então concluímos que W e Z não podem ser iguais! b) O coeficiente de variação amostral de Z é unitário. Sol.: Teremos que nos lembrar da fórmula do Coeficiente de Variação! No caso da variável transformada Z, será a seguinte: CV =
Sz Z
Como o item quer saber a respeito do CV da variável transformada Z, teremos que conhecer os valores da sua média e do seu desvio-padrão! Para isso, percorreremos o Caminho de Ida da transformação! Primeiramente, com a Média W ! Teremos: Caminho de Ida 1º)(- W )
W
e
2º)(÷Sw)
Wi Variável Original
Zi
Z
Variável Transformada
Logo na primeira operação, quando fizermos W - W , chegaremos a zero! E zero dividido por qualquer coisa (2a operação) fica zero, mesmo! Conclusão: a Média da Variável Transformada - Z - é igual a zero. Sz Voltemos à fórmula da CV: CV = Z Ora, se achamos que Z =0 e está no denominador, então “matamos” a questão! Pode haver zero no denominador? Não! Então, “o coeficiente de variação amostral de Z, o CVz, não está definido”. É o que reza a opção c! Portanto: Opção c Æ Resposta da Questão! 7. (FTE-PA-2002/ESAF) Um certo atributo W, medido em unidades apropriadas, tem média amostral 5 e desvio-padrão unitário. Assinale a opção que corresponde ao coeficiente de variação, para a mesma amostra, do atributo Y = 5 + 5W. a) 16,7% b) 20,0% c) 55,0% d) 50,8% e) 70,2%
ESTATÍSTICA
*** Ponto 26 – RESOLUÇÃO DO SIMULADO 02 ***
Pág. 7 de 9
Sol.: Facílima esta questão! Sobretudo se desenharmos os caminhos da transformação da variável proposta pelo enunciado! Aqui, uma observação importante: olhemos bem para essa transformação trazida pela questão! Nossa variável original é W. Qual foi a primeira operação realizada com o W? Foi somar mais 5 ou foi multiplicar por 5? O produto foi a primeira! (Não é o produto que está acompanhando o nosso W?). Daí, o desenho será o seguinte: Caminho de Ida Sw=1
W =5
1º)(x5)
Wi
e
2º)(+5)
Variável Original
2º)(÷5)
Yi
Variável Transformada
e
Sy=?
Y =?
1º)(-5)
Caminho de Volta
A questão quer saber o valor do CV da variável Y. Nossa fórmula do CV para esta variável será, portanto: CV =
Sy Y
Daí, conhecendo os valores da Média e do Desvio-Padrão da variável original W, só precisaremos percorrer o Caminho de Ida da transformação acima desenhada, recordando-nos das propriedades destas duas medidas. Comecemos com a Média: Temos: W =5, logo: 1o) 5x5=25
e 2o)25+5=30. Daí: Y =30
Trabalhando com o Desvio –Padrão, teremos: SW=1, logo:
1º) 1x5=5 e 2º)Soma não altera o S. Daí: Sy=5
Finalmente, aplicando a fórmula do Coeficiente de Variação, teremos: CV =
5 Sy Æ CV = Æ E: CV=0,167=16,7% Æ Opção a Æ Resposta da Questão! 30 Y
ESTATÍSTICA
*** Ponto 26 – RESOLUÇÃO DO SIMULADO 02 ***
Pág. 8 de 9
8. (ACE-MICT-1998/ESAF) Num estudo sobre a distribuição do preço de venda de um produto obteve-se, a partir de uma amostra aleatória de 25 revendedores, a tabela de freqüências seguinte: fi Classe de mi Preços [ 5 – 9) 7 3 [ 9 – 13) 11 5 [13 – 17) 15 7 [17 – 21) 19 6 [21 – 25) 23 3 [25 – 29) 27 1 As quantidades mi e fi representam o ponto médio e a freqüência da classe de preços i. Sabendo-se que: ∑(fi mi2) – (∑ fi mi)2 / 25 ≈ 694 assinale a opção que melhor aproxima o desvio padrão amostral. a) b) c) d) e)
0,5 (347/3)0.5 6 0,9 (345/3)0.5 28,91 8
Sol.: Outra questão bastante fácil! Até parece Álgebra do que, propriamente, uma de Estatística!
mais
uma
questão
de
O que precisaríamos, neste caso, era nos recordarmos da fórmula desenvolvida do Desvio-Padrão, para o caso da Distribuição de Freqüências, e para o caso da amostra, ou seja, incluindo o fator de correção de Bessel! Estamos lembrados disso? Nossa fórmula seria, portanto: 2 ( PM . fi ) ⎤ 1 ⎡ ∑ 2 ⎢∑ PM . fi − ⎥ S= n −1 ⎢ n ⎥⎦ ⎣ Se fizermos o somatório da coluna do fi, descobriremos que o número de elementos do nosso conjunto será n=25
Agora, observemos que o valor do colchete da fórmula acima já foi fornecido pelo enunciado! E é igual a 694. Daí, resta-nos concluir as nossas contas! Teremos que:
S=
694 Æ S = 28,91 24
ESTATÍSTICA
*** Ponto 26 – RESOLUÇÃO DO SIMULADO 02 ***
Pág. 9 de 9
Encontramos aí uma resposta parecida com a opção d. Mas, parecido não é igual! A letra d não traz o sinal da raiz! Logo, percebemos que vamos ter que desenvolver o nosso radical, até encontrarmos uma das outras opções de resposta! Dividindo numerador e denominador por 2, teremos:
S=
694 347 = 24 12
Agora, fatorando o 12, teremos:
S=
694 347 347 1 347 0,5 = = = . = 0,5.(347 / 3) Æ Opção a Æ Resposta da Questão! 24 12 4 x3 2 3 É isso, meus amigos! Como se saíram neste segundo simulado? Espero que bem!
Não demora muito agora, até termos visto o restante do programa do AFRF! Próxima aula, aprenderemos a calcular os Coeficientes de Assimetria. Na seqüência, veremos o estudo da Curtose. E, para fechar a matéria, Números Índices! Estou certo que haverá tempo de sobra... Tenho uma notícia em primeira mão! É a respeito do meu livro de Estatística Básica Para Concursos. Agora é pra valer: estou apenas dando o acabamento final, e logo, logo, se Deus quiser, estará à venda nas livrarias desse “Brasilzão sem porteira”... Fico hoje por aqui! Um abraço forte a todos! E até a próxima!
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS ***
Pág. 1 de 10
MOMENTOS ESTATÍSTICOS Olá, amigos! Tudo bem? Na última aula concluímos o estudo das Medidas de Dispersão. Anteriormente, havíamos já encerrado também a análise das Medidas de Posição. Destarte, para darmos termo à descrição de um conjunto, resta-nos apenas conhecer duas de suas características, que dizem respeito ao “formato” da Curva de Freqüência! Uma destas características é a Assimetria, cujas primeiras noções já foram vistas em aula anterior. A segunda, chamada Curtose, trata acerca do achatamento da curva! São, portanto, estes dois assuntos – Assimetria e Curtose - que nos faltam estudar, para compor todo o “time” da Estatística Descritiva! Todavia, para passarmos a estes assuntos, teremos que conhecer um outro tipo de medida estatística, o qual chamamos de Momentos! Se verificarmos alguns editais de concursos anteriores, constataremos que este assunto – Momentos – não consta como parte dos programas! Ora, se não são exigidos expressamente, por que então teremos que estudá-los? Por um motivo muito simples. Sem conhecer os Momentos Estatísticos, não teremos condições de chegar aos resultados dos índices de Assimetria e de Curtose! Destarte, pensaremos nos Momentos como um assunto intermediário (um “ator coadjuvante”), para chegarmos às respostas principais, que virão nas nossas provas, quais sejam: Assimetria e Curtose! # Tipos de Momentos: Teremos três tipos distintos de Momentos: -
Momento Natural; Momento Centrado numa Origem Qualquer; Momento Centrado na Média Aritmética.
e
Para cada um destes tipos de Momento, aprenderemos como calculá-lo para o rol, para os dados tabulados e para a distribuição de freqüências. # Momento Natural de Ordem r : Æ Momento Natural para o Rol: Será determinado pela seguinte fórmula:
∑ ( Xi ) =
r
mr
n
Exemplo: Consideremos o conjunto W = {1, 2, 3, 4, 5} Determinemos o valor do Momento Natural de Ordem 1 para o conjunto acima. Sol.: Teremos que o “1” de “ordem 1” substituirá o r da fórmula. Daí:
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS ***
∑ ( Xi ) =
r
mr
n
∑ (1) + (2) + (3) + (4) + (5) = 1
Æ
m1
1
1
1
1
5
=
15 =3 5
Pág. 2 de 10
Æ Resposta!
Pela mera observação, concluímos que o Momento Natural de Ordem 1 (ou Primeiro Momento Natural) de um conjunto é a mesma coisa que a sua Média Aritmética! Determinemos para o mesmo conjunto W, o valor do Momento Natural de Ordem 2 (ou Segundo Momento Natural). Sol.: Neste caso, em lugar do r da fórmula, usaremos o 2 de “ordem 2”. Daí, teremos:
∑ ( Xi ) =
r
mr
n
∑ (1) + (2) + (3) + (4) + (5) = 2
Æ
m2
2
2
2
2
5
=
55 = 11 5
Æ Resposta!
E assim por diante! Se quiséssemos calcular, por exemplo, o Momento Natural de Ordem 8, nossa contas seriam:
∑ (1) + (2) + (3) + (4) + (5) = 8
m8
8
8
8
8
5
Não daremos este resultado acima para não perdermos mais tempo com as contas. O que importa é saber como se calcula! E isso, acho que já conseguimos. Æ Momento Natural para Dados Tabulados: Veremos aqui que as fórmulas dos Momentos seguem as mesmas regras de transição das fórmulas da Média Aritmética! Portanto, neste caso, para o Dados Tabulados, repetiremos a fórmula do rol, e multiplicaremos o numerador por fi! Termemos:
∑ ( Xi ) . fi = r
mr
n
Exemplo: Consideremos o conjunto abaixo: Xi 1 2 3 4
fi 2 3 2 1
Determinemos o valor do Momento Natural de Ordem 2. Sol.: Neste caso, a nossa fórmula teria o seguinte formato:
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS ***
Pág. 3 de 10
∑ ( Xi ) . fi = 2
m2
n
Daí, como primeiro passo, construiremos a coluna do (Xi)2 : Xi 1 2 3 4 Na seqüência, somatório:
construiremos Xi 1 2 3 4
Xi2 1 4 9 16
fi 2 3 2 1 a
coluna
[(Xi)2.fi]
Xi2 1 4 9 16
fi 2 3 2 1 n=8
e
encontraremos
o
seu
Xi2.fi 2 12 18 16 48
Finalmente, aplicamos a fórmula:
∑ ( Xi ) . fi = 2
m2
n
Æ
m2 =
48 =6 8
Æ Resposta!
Somente isso! Caso tenhamos que determinar qualquer outro Momento Natural para Dados Tabulados basta lembrar: o r da fórmula é a ordem daquele momento que se deseja encontrar! Como ficaria a fórmula, por exemplo, do Oitavo Momento Natural do conjunto acima? Teríamos que:
∑ (1) .2 + (2) .3 + (3) .2 + (4) .1 = 8
m8
8
8
8
5
Não precisamos fazer essas contas agora! É só pra saber se entendemos a fórmula! Ficou claro? Æ Momento Natural para Distribuição de Freqüências: Prosseguindo aquela mesma seqüência de transições, chegaremos à fórmula para a Distribuição de Freqüências se repetirmos a fórmula dos dados tabulados e, em lugar do Xi (elemento individualizado) colocarmos o PM (Ponto Médio) da classe! Teremos, pois, o seguinte:
∑ (PM ) . fi = r
mr
n
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS ***
Pág. 4 de 10
Exemplo: Consideremos o conjunto abaixo. 0 4 8 12
Xi - 4 – 8 – 12 – 16
fi 1 2 2 1
Determinemos o valor do Momento Natural de Terceira Ordem! Sol.: Nossa fórmula, adaptada ao Terceiro Momento Natural, será a seguinte:
∑ (PM ) . fi = 3
m3
n
Daí, como passo inicial, construiremos a coluna dos Pontos Médios: 0 4 8 12
Xi - 4 – 8 – 12 – 16
fi 1 2 2 1
PM 2 6 10 14
Depois, faremos a coluna (PM)3: 0 4 8 12
Xi - 4 – 8 – 12 – 16
fi 1 2 2 1
PM 2 6 10 14
(PM)3 8 216 1000 2744
Na seqüência, construiremos [(PM)3.fi], e acharemos seu somatório: (PM)3.fi Xi Fi PM (PM)3 0 – 4 1 2 8 8 4 – 8 2 6 216 432 8 – 12 2 10 1000 2000 12 – 16 1 14 2744 2744 N=6 5184 Daí, aplicaremos a fórmula:
∑ (PM ) . fi = 3
m3
n
Æ
m3 =
5184 = 864 6
Æ Resposta!
# Momento Centrado Numa Origem Qualquer: Æ Para o rol: Aqui, neste segundo tipo de Momento, em lugar de usarmos no numerador apenas o valor do elemento Xi, usaremos um desvio – uma diferença – entre o
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS ***
Pág. 5 de 10
elemento Xi e um elemento qualquer Yi. Por isso tem esse nome: “Centrado Numa Origem Qualquer”. Será calculado da seguinte maneira:
∑ ( Xi − Y ) =
r
mr
n
Exemplo: Consideremos o conjunto V={1, 2, 3, 4}. Determinemos, conjunto, o valor do “Momento de Ordem 3 Centrado na Origem 2”:
para
este
Neste caso, nossa fórmula adaptada ao que se está pedindo na questão seria a seguinte:
∑ ( Xi − 2) =
3
m3
n
Daí, a princípio, encontraremos o conjunto do (Xi-2): Xi-2={(1-2), (2-2), (3-2), (4-2)} = {-1, 0, 1, 2} Na seqüência, buscaremos o conjunto (Xi-2)3. Teremos: (Xi-2)3={(-1)3, (0)3, (1)3, (2)3} = {-1, 0, 1, 8} Daí, tiramos que: ∑(Xi-2)3=8
∑ ( Xi − 2)
3
Logo: m3 =
n
Æ m3 =
8 =2 4
Æ
Resposta!
Æ Para Dados Tabulados: Obedecendo às regras de transição das fórmulas da Média, usaremos aqui a seguinte fórmula:
∑ ( Xi − Y ) . fi r
mr =
n
Æ Para a Distribuição de Freqüências: Teremos que:
∑ (PM − Y ) . fi r
mr =
n
Observação: Deixamos de colocar exemplos para as duas últimas fórmulas por um motivo muito simples! Este segundo tipo de Momento – Centrado Numa Origem Qualquer – não será usado por nós na nossa prova! Destarte, apenas os citei para que saibamos que ele existe, mas não vale a pena nos prolongarmos com exemplos que não nos serão úteis no concurso.
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS ***
Pág. 6 de 10
# Momento Centrado na Média Aritmética: Esse sim, é o principal! É este que precisamos conhecer, e bem! Será exatamente este tipo de Momento que encontraremos nas nossas fórmulas de Assimetria e Curtose!! Nossas fórmulas aqui serão as mesmas do Momento Centrado numa Origem Qualquer, com uma diferença: em lugar da “origem qualquer (Y)”, colocaremos a Média Aritmética do conjunto! Ou seja, a Média X fórmula!
será o valor de referência da
Æ Para o rol: Usaremos o seguinte:
∑ (Xi − X ) =
r
mr
n
Se durante nossa prova precisássemos determinar o Momento de Ordem 2 Centrado na Média, para um determinado conjunto, como ficaria nossa fórmula? Da seguinte forma:
∑ (Xi − X ) =
2
m2 Agora olhemos conhecemos?
bem
para
a
fórmula
n
acima!!
É
parecida
com
algo
que
já
Acertou quem disse:”Sim! É igual à Variância”! Daqui, extraímos mais esta conclusão: O Momento de Segunda Ordem Centrado na Média Aritmética de um conjunto é o mesmo que a sua Variância! Em 99% das questões de prova de estatística, quando eventualmente precisarmos trabalhar com o cálculo do Momento, o faremos quando o conjunto vier apresentado sob a forma de uma Distribuição de Freqüênicas. Então, vamos poupar um pouco de tempo e apresentar as outras fórmulas, e deixar os exemplos para o caso da Distribuição de Freqüências. Æ Para Dados Tabulados: Teremos que:
∑ (Xi − X ) . fi = r
mr
n
Æ Para Distribuição de Freqüências:
∑ (PM − X ) . fi = r
mr
n
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS ***
Pág. 7 de 10
Obs.: Observemos que as fórmulas dos Momentos não sofrem a Correção de Bessel! Estamos lembrados do Bessel? Para quem está esquecido, a correção de Bessel nada mais é do que o “menos 1”, colocado nas fórmulas do Desvio-Padrão e da Variância, quando o conjunto trazido pela questão representar uma amostra! Portanto, não esqueçamos disso: Correção de Bessel é somente para Desvio Padrão (S) e para Variância (S2)! Exemplo: Consideremos o conjunto abaixo. 0 4 8 12
Xi – 4 – 8 – 12 – 16
fi 1 2 2 1
Determinemos o valor do Terceiro Momento Centrado na Média para o conjunto acima. Sol.: Para o que a questão solicitou, nossa fórmula será a seguinte:
∑ (PM − X ) . fi = 3
m3 Ora,
como
o
Momento
será
n
centrado
na
Média,
o
primeiro
passo
será,
necessariamente, calcular o X ! A pergunta: para essa distribuição de freqüências apresentada, precisaremos fazer contas para determinar o valor da Média? Observaram bem? Então, perceberam todos que se trata de uma distribuição simétrica (com um número par de classes!). Daí, a Média (que será igual à Moda e à Mediana) será exatamente o limite superior da primeira classe intermediária, que é também igual ao limite inferior da segunda classe intermediária! Esta é uma das nossas Regras de Ouro! Então, teremos que: X = 8 Como próximo passo, construiremos a coluna dos Pontos Médios (PM). Teremos, portanto: 0 4 8 12
Xi - 4 – 8 – 12 – 16
fi 1 2 2 1
PM 2 6 10 14
Na seqüência, encontraremos a coluna (PM- X ). Teremos:
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS *** Xi
fi
PM
(PM- X )
Pág. 8 de 9
0 4 8 12
– – –
4 8 12 16
1 2 2 1
2 6 10 14
-6 -2 2 6
Prosseguindo, encontraremos a coluna [(PM- X )3]. Ficaremos com: Xi 0 4 8 12
– – – –
4 8 12 16
fi
PM
1 2 2 1
2 6 10 14
(PM- X ) -6 -2 2 6
(PM- X )3 -216 -8 8 216
Observemos que não é preciso “decorar” esta seqüência de passos! Basta olharmos para a fórmula – que será nossa guia! – e vermos o que dispomos e o que precisamos encontrar. Daí, saberemos imediatamente qual será nosso passo seguinte! É assim sempre!!
O que nos falta agora é acharmos a coluna do [(PM- X )3.fi] e determinarmos seu somatório. Teremos, portanto: Xi fi PM (PM- X ) (PM- X )3 (PM- X )3.fi 0 – 4 1 2 -6 -216 -216 4 – 8 2 6 -2 -8 -16 8 – 12 2 10 2 8 16 12 – 16 1 14 6 216 216 n=6 0 Finalmente, aplicando a fórmula do Terceiro Momento, teremos:
∑ (PM − X ) . fi = 3
m3
n
Æ
m3 =
0 =0 6
Æ
Resposta!
Exemplo: Para o mesmo conjunto abaixo, determinemos o valor do Momento Centrado na Média de Ordem 4. Eis o conjunto: Xi fi 0 – 4 1 4 – 8 2 8 – 12 2 12 – 16 1 Nossa fórmula adaptada seria a seguinte:
∑ (PM − X ) . fi = 4
m4
n
Uma vez que se trata do mesmo conjunto do exemplo anterior, saltaremos aqui os passos iniciais e apresentaremos já a coluna do (PM- X ). Teremos: Xi fi PM (PM- X ) 0 - 4 1 2 -6 4 – 8 2 6 -2 8 – 12 2 10 2 12 – 16 1 14 6
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS ***
Pág. 9 de 10
Na seqüência, encontraremos a coluna (PM- X )4: Xi 0 4 8 12
– – –
4 8 12 16
fi
PM
1 2 2 1
2 6 10 14
(PM- X )4 1296 16 16 1296
(PM- X ) -6 -2 2 6
E agora a coluna (PM- X )4.fi: Xi 0 4 8 12
– – –
4 8 12 16
fi
PM
1 2 2 1 n=6
2 6 10 14
(PM-
X)
(PM- X )4
(PM- X )4.fi
1296 16 16 1296
1296 32 32 1296 2656
-6 -2 2 6
Daí, aplicando a fórmula, teremos o seguinte:
∑ (PM − X ) . fi = 4
m4
Æ
n
m4 =
2656 = 442,67 Æ Resposta! 6
Fizemos questão de apresentar dois exemplos, com M3 e M4 (Terceiro e Quarto Momentos), porque serão precisamente estes os que serão exigidos em cálculos de Assimetria e Curtose, como veremos oportunamente! Daí, conclusões finais: - Usaremos esta teoria dos Momentos como “muletas” para chegarmos aos valores de Assimetria e Curtose; - O momento natural de primeira ordem é o mesmo que a Média; - O momento centrado na Média de segunda ordem é o mesmo que a Variância; - Daremos ênfase ao M3 e ao M4 para efeito de utilização das fórmulas (que aprenderemos em breve!) de Assimetria e de Curtose! # Resumo das Fórmulas de Momento: Æ Momento Natural:
∑ ( Xi ) =
r
mr
n
∑ ( Xi ) . fi = r
;
mr
n
∑ (PM ) . fi = r
ou
mr
n
Æ Momento Centrado Numa Origem Qualquer (Y):
∑ ( Xi − Y ) =
r
mr
n
∑ ( Xi − Y ) . fi = r
;
mr
n
∑ (PM − Y ) . fi = r
ou
mr
n
ESTATÍSTICA
*** Ponto 27 – MOMENTOS ESTATÍSTICOS ***
Pág. 10 de 10
Æ Momento Centrado na Média Aritmética:
∑ (Xi − X ) =
r
mr
n
∑ (Xi − X ) . fi = r
;
mr
n
∑ (PM − X ) . fi = r
ou
mr
n
Por hoje, ficaremos nisso! O assunto foi rápido e necessário! Não havia como falarmos em Assimetria e Curtose sem antes explicarmos esses Momentos...! Próxima aula, sim! Assimetria. E depois, Curtose. E depois, para fechar esse primeiro momento meu aqui no Ponto, Números Índices. Quero desculpar-me por esta ausência dos últimos dias, sobretudo estando assim tão perto do edital! E quero agradecer a Deus por ter restituído a saúde do meu pai, que esteve abalada, a ponto de me deixar sem condição nenhuma de elaborar nova aula. Agora, tudo bem! Só quero dizer que vai dar tempo de vermos tudo! Estou convicto de que vocês, meus alunos virtuais, no que depender da prova de estatística, serão todos Auditores-Fiscais da Receita Federal! É essa a minha torcida! Um abraço forte a todos e até a próxima!
ESTATÍSTICA
*** Ponto 28 – ASSIMETRIA ***
Pág. 1 de 13
ASSIMETRIA Olá, amigos! Todos bem? Hoje, avançaremos na matéria e aprenderemos a calcular os índices de Assimetria de um conjunto! A respeito deste assunto, já temos inclusive uma boa noção, uma vez que aprendemos, em uma aula anterior, que existe uma relação estreita entre o comportamento da curva no tocante à sua assimetria, e entre as Medidas de Tendência Central. Naquela ocasião, vimos que existem três situações distintas sob as quais um conjunto pode apresentar-se, em termos de assimetria. E ainda, qual seria o comportamento da Média, Moda e Mediana para cada uma daquelas situações. Vamos dar uma relembrada rápida? Æ Distribuição Assimétrica à Direita (ou de Assimetria Positiva):
Moda < Mediana < Média Æ Distribuição Assimétrica à Esquerda (ou de Assimetria Negativa):
Média
STATÍSTICA
<
Mediana <
Moda
*** Ponto 28 – ASSIMETRIA ***
Pág. 2 de 13
Página 1 de 13
Æ Curva Simétrica:
Média=Mediana=Moda Pois bem! Este conhecimento seria suficiente para acertarmos uma questão que quisesse saber apenas se o conjunto é simétrico, ou assimétrico à esquerda ou à direita! Porém, se o enunciado vier solicitando o valor do índice (ou coeficiente) de assimetria, então precisaríamos conhecer as fórmulas necessárias para chegarmos a essa resposta! Existem quatro formas distintas de determinarmos índices de Assimetria! Na questão, nossa primeira preocupação será saber qual dos métodos está sendo requerido! E a segunda, naturalmente, será conhecer a fórmula solicitada! # Índice Quartílico de Assimetria: Será calculado pela fórmula seguinte:
A= Onde: -
(Q3 + Q1 − 2Md ) (Q3 − Q1)
Q1 é o primeiro Quartil; Q3 é o terceiro Quartil; Md é a Mediana.
Gosto de memorizar esta fórmula usando as seguintes etapas: 1o) Ponho na fórmula apenas o Q3 e o Q1: A =
Q3
Q3
Q1
2o) Depois, coloco o “mais e menos”: A =
Q1
Q3 + Q1 Q3 − Q1
3o) Completo o numerador com o “menos duas Medianas”:
Q3 + Q1 − 2 Md Q3 − Q1 *** Ponto 28 – ASSIMETRIA *** A=
ESTATÍSTICA
Pág. 3 de 13
E pronto! Claro que essa é apenas uma sugestão!
Página 2 de 13
Acerca desta fórmula, convém sabermos que seus resultados estarão sempre no intervalo de –1 a +1. De forma que, se o índice der positivo, isso indica, naturalmente, uma Curva de Assimetria Positiva (Curva Assimétrica à Direita). Se o índice der negativo, teremos uma Curva de Assimetria Negativa (Curva Assimétrica à Esquerda). No mais, já sabemos como calcular as Medidas Separatrizes, de modo que estamos mais que preparados para enfrentar uma questão de prova que exija a determinação da Assimetria por esse método! Vamos a um exemplo! Questão extraída do AFRF-2002.2 (a mais recente!): O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
– – – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Freqüência (fi) 4 8 14 20 26 18 10
Assinale a opção que dá o valor do coeficiente quartílico de assimetria: a) 0,080 b) –0,206 c) 0,000 d) –0,095 e) 0,300 Sol.: Comecemos pela Mediana! 1o Passo) Determinamos n pelo somatório da coluna do fi e calculamos (n/2): Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
– – – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Freqüência (fi) 4 8 14 20 26 18 10 n=100
Daí, teremos n=100 e (n/2)=50
Página 3 de 13
ESTATÍSTICA
*** Ponto 28 – ASSIMETRIA ***
Pág. 4 de 13
2o Passo) Construiremos a coluna da freqüência absoluta acumulada crescente (fac): Classes fi fac↓ 29,5 – 39,5 4 4 39,5 – 49,5 8 12 49,5 – 59,5 14 26 59,5 – 69,5 20 46 69,5 – 79,5 26 72 79,5 – 89,5 18 90 89,5 – 99,5 10 100 n=100 3o Passo) Passamos às perguntas comparativas dos valores da fac com o valor de referência (n/2). Teremos: Classes 29,5 – 39,5 39,5 – 49,5 49,5 – 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5
fi 4 8 14 20 26 18 10 n=100
Daí, nossa Classe Mediana aplicarmos a fórmula:
fac↓ 4 12 26 46 72 90 100
Æ Æ Æ Æ Æ
4 é ≥ 50? Não! 12 é ≥ 50? Não! 26 é ≥ 50? Não! 46 é ≥ 50? Não! 72 é ≥ 50? SIM!
será a quinta classe (69,5 – 79,5). Agora é só
⎡⎛ n ⎞ ⎤ ⎢ ⎜ 2 ⎟ − fac ANT ⎥ 50 − 46 ⎤ ⎥.h Æ Md = 69,5 + ⎡⎢ Md = l inf + ⎢ ⎝ ⎠ .10 Æ Md = 71,04 fi ⎢ ⎥ ⎣ 26 ⎥⎦ ⎢ ⎥ ⎣ ⎦ Agora, partamos em busca do Primeiro Quartil – Q1: 1o Passo) Determinemos o valor de (n/4): Como n=100, teremos que (n/4)=25 2o Passo) Como comparativas:
já
dispomos
Classes 29,5 – 39,5 39,5 – 49,5 49,5 – 59,5 59,5 – 69,5 69,5 – 79,5 79,5 – 89,5 89,5 – 99,5
ESTATÍSTICA
fi 4 8 14 20 26 18 10 n=100
da
coluna
Fac↓ 4 12 26 46 72 90 100
da
fac,
passamos
às
perguntas
Æ 4 é ≥ 25? Não! Æ 12 é ≥ 25? Não! Æ 26 é ≥ 25? SIM!
*** Ponto 28 – ASSIMETRIA ***
Pág. 5 de 13
Página 4 de 13
Daí, a classe do Q1 é a terceira classe (49,5 – 59,5). Resta-nos aplicar a fórmula do Primeiro Quartil. Teremos:
⎡⎛ n ⎞ ⎤ ⎢ ⎜ 4 ⎟ − fac ANT ⎥ ⎥.h Æ Q1 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎥ ⎢ ⎥ ⎣ ⎦
⎡ 25 − 12 ⎤ Q1 = 49,5 + ⎢ .10 Æ Q1 = 58,78 ⎣ 14 ⎥⎦
Finalmente, resta-nos encontrar o valor do Terceiro Quartil, Q3: 1o Passo) Calculemos o valor de (3n/4)! Como n=100, teremos: (3n/4)=75 2o Passo) Uma vez que já temos a coluna da fac, passemos às perguntas de praxe: Classes fi fac↓ 29,5 – 39,5 4 4 Æ 4 é ≥ 75? Não! 39,5 – 49,5 8 12 Æ 12 é ≥ 75? Não! 49,5 – 59,5 14 26 Æ 26 é ≥ 75? Não! 59,5 – 69,5 20 46 Æ 46 é ≥ 75? Não! 69,5 – 79,5 26 72 Æ 72 é ≥ 75? Não! 18 90 79,5 – 89,5 Æ 90 é ≥ 75? SIM! 10 100 89,5 – 99,5 n=100 Achamos nossa Classe do Terceiro Quartil: é a penúltima classe 89,5). Daí, aplicaremos a fórmula do Q3:
⎡ ⎛ 3n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q3 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥.h Æ ⎥ ⎥ ⎦
(79,5 –
⎡ 75 − 72 ⎤ .10 Æ Q1 = 81,17 Q3 = 79,5 + ⎢ ⎣ 18 ⎥⎦
Agora, vamos relacionar os valores das medidas encontradas por nós: Æ Q1=58,78 Æ Q3=81,17 Æ Md=71,04 Daí, aplicando a fórmula do Índice Quartílico de Assimetria, teremos:
A=
Q3 + Q1 − 2 Md Q3 − Q1
Æ
A=
81,17 + 58,78 − 2 x71,04 81,17 − 58,78
Æ
E: A = −0,095 Æ Resposta!
Acharam muito trabalhosa? Claro que, à primeira vista, parece ser bem mais demorada do que fato é! Na hora da prova, com o candidato já bastante “treinado”, realmente não se perde muito tempo nesta resolução! Mesmo porque é um procedimento tão repetitivo...! Já vai estar, certamente, automatizado!
ESTATÍSTICA
*** Ponto 28 – ASSIMETRIA ***
Pág. 6 de 13
Uma observação acerca desta questão: na prova do AFRF-2002.2, este enunciado apareceu como a quinta questão. Na primeira, foi solicitado o valor da Mediana, Página 5 de 13
que foi igual a 71,04. (Md=71,04). Na terceira, foi pedido o valor da Moda, que seria igual a 73,78. (Mo=73,78). Ora, somente dispondo destes dois valores, já tínhamos como extrair uma conclusão importante acerca da Assimetria deste conjunto! Claro! Se a Moda foi maior que a Mediana, então já sabemos que a Média será menor que as duas (Mo e Md), e que estaremos diante de uma distribuição assimétrica à esquerda ou de assimetria negativa! Com isso, se na hora da prova você estiver em situação de desespero, com o tempo já esgotado e o examinador pedindo que entregue o gabarito, então seu “chute” já estaria bem melhor “encaminhado”, porque só há, entre as opções de resposta, duas delas com valor de assimetria negativa. Sua chance de acerto saltou para 50%! Por amor a Deus, ninguém diga por aí que o professor Sérgio Carvalho é um incentivador do “chute”. Absolutamente! Não sou! Apenas que, como bom concurseiro, já enfrentei diversas situações adversas e sei o quão preciosa pode vir a ser uma dica como essa! # Coeficientes de Assimetria de Pearson: Veremos agora duas outras maneiras de calcular o índice de assimetria de um conjunto, as quais envolvem as Medidas de Tendência Central. São as seguintes: Æ
Primeiro Coeficiente de Assimetria de Pearson: Será dado pela fórmula que se segue:
A=
(X − Mo)
Onde:
S
- X é a Média Aritmética; - Mo é a Moda; e - S é o Desvio-Padrão do conjunto. Observando bem esta fórmula que define o Primeiro Coeficiente de Pearson, verificamos que o sinal da assimetria será definido pelo seu numerador. Assim, apenas comparando os valores da Média Aritmética e da Moda, saberemos qual o tipo de assimetria da distribuição. Assim, de acordo com este coeficiente, teremos: → Se X = Mo → Se X > Mo → Se X < Mo
→ → →
Assimetria Nula! Ou seja, distribuição Simétrica! Assimetria Positiva! Curva Assimétrica à Direita! Assimetria Negativa! Curva Assimétrica à Esquerda.
Naturalmente que já sabíamos disso!
Página 6 de 13
ESTATÍSTICA
*** Ponto 28 – ASSIMETRIA ***
Pág. 7 de 13
Æ Segundo Coeficiente de Assimetria de Pearson: Será calculado da seguinte maneira:
A=
(
3 X − Md S
)
- X é a Média Aritmética; - Md é a Mediana; e - S é o Desvio-Padrão do conjunto.
Onde:
Aqui, para este Segundo Coeficiente de Pearson, observamos que o sinal da assimetria será definido apenas comparando os valores da Média Aritmética e da Mediana do conjunto. Teremos, portanto: → Se X = Md → Se X > Md → Se X < Md
→ → →
Assimetria Nula. Ou seja, distribuição Simétrica. Assimetria Positiva. Curva Assimétrica à Direita. Assimetria Negativa. Curva Assimétrica à Esquerda.
Novamente aqui não há nenhuma novidade para nós! Uma boa maneira para memorizarmos os Coeficientes de Assimetria de Pearson é justamente recordarmos da Relação Empírica de Pearson, que aprendemos no estudo das relações entre as Medidas de Tendência Central. Recordemos: Relação Empírica de Pearson:
X - Mo = 3( X - Md) Como podemos verificar, o numerador do Primeiro Coeficiente de Assimetria de Pearson é igual à primeira parte da equação que define a Relação Empírica (X
- Mo); enquanto que o Segundo Coeficiente de Assimetria de Pearson traz,
também em seu numerador, a segunda parte da equação acima: [3( X - Md)]. Estes dois Coeficientes de Assimetria de Pearson não costumavam ser muito exigidos em provas de Estatística Básica dos concursos. Tal foi, portanto, a surpresa dos candidatos que enfrentaram a prova do AFRF 2002.1! Vejamos a questão abaixo: Questão Extraída do AFRF-2002.1:
Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes.
Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
P (%) 5 15 40 70 85 95 100
Página 7 de 13
ESTATÍSTICA
*** Ponto 28 – ASSIMETRIA ***
Pág. 8 de 13
Seja S o desvio padrão do atributo X. Assinale a opção que corresponde à medida de assimetria de X como definida pelo primeiro coeficiente de Pearson. a) 3/S b) 4/S c) 5/S d) 6/S e) 0 Sol.: Para resolvermos esta questão, precisaríamos inicialmente trabalhar com as colunas de freqüências, para chegarmos à freqüência absoluta simples – fi. O resultado deste procedimento, já realizado para este enunciado em aulas anteriores, é o seguinte: Classes Fac↓ 70 – 90 5% 90 – 110 15% 110 – 130 40% 130 – 150 70% 150 – 170 85% 170 – 190 95% 190 – 210 100% Agora o que nos resta é apenas Coeficiente de Assimetria de Pearson:
A=
Fi fi 5% 10 10% 20 25% 50 30% 60 15% 30 10% 20 5% 10 recordarmos da
fórmula
do
Primeiro
(X − Mo) S
Se observarmos as opções de resposta, veremos que elas vêm com o DesvioPadrão – S – no denominador. Ou seja, só precisaremos nos preocupar com o numerador da fórmula. Na primeira questão desta prova, já havia sido exigido o cálculo da Média. Inclusive já a fizemos, em oportunidade anterior. Vamos transcrever aquela solução: 1º Passo) Construiremos a coluna do PM e coluna de transformação: Classes 70 90 110 130 150 170 190
– – – – – – –
90 110 130 150 170 190 210
fi
PM
10 20 50 60 30 20 10
80 100 120 140 160 180 200
(PM-80)= Yi 20 0 1 2 3 4 5 6
Página 8 de 13
ESTATÍSTICA
*** Ponto 28 – ASSIMETRIA ***
Pág. 9 de 13
2º Passo) Construiremos a coluna do (Yi.fi): Classes 70 90 110 130 150 170 190
– – – – – – –
90 110 130 150 170 190 210
fi
PM
10 20 50 60 30 20 10 n=200
80 100 120 140 160 180 200
Yi.fi
(PM-80)= Yi 20 0 1 2 3 4 5 6
0 20 100 180 120 100 60 580
3º Passo) Efetuaremos o cálculo do Y :
⎛ ∑ Yi ⋅ fi ⎞ ⎟ Y =⎜ ⎜ ⎟ n ⎝ ⎠ 4º Passo) variáveis:
Desenharemos
os
caminhos
Æ
de
Æ
Y =(580/200) ida
e
volta
Y =2,9 da
transformação
das
Caminho de Ida 1º)(-80)
X =?
e
2º)(÷20)
Xi
Yi 2º)(+80)
e
Y = 2,9
1º)(x20)
Caminho de Volta 5º Passo) Efetuaremos os cálculos do Caminho de Volta, partindo do Y : 1º)(x20)Æ 2,9x20=58,0
e 2º)(+80)Æ 58+80=138
Daí: X Agora, tudo o que temos que fazer é distribuição de freqüências. Seguiremos os isso: Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
= 138 descobrir o valor da Moda desta passos já nossos conhecidos para fi 10 20 50 60 30 20 10
Página 9 de 13
ESTATÍSTICA
*** Ponto 28 – ASSIMETRIA ***
Pág. 10 de 13
1º Passo) Determinaremos da Classe Modal: Xi fi 70 – 90 10 90 – 110 20 110 – 130 50 Æ Classe Modal! Æ (a de maior fi) 60 130 – 150 150 – 170 30 170 – 190 20 190 – 210 10 Para a qual teremos: linf=130 e h=10 2º Passo) Calcularemos os elementos da fórmula de Czuber: Δa e Δp Xi fi 70 – 90 10 90 – 110 20 110 – 130 50 Æ Classe Anterior: Δa=60-50 Æ Δa=10 60 130 – 150 Æ Classe Modal! 150 – 170 30 Æ Classe Posterior: Δp=60-30 Æ Δp=30 170 – 190 20 190 – 210 10 3º Passo) Aplicaremos a fórmula da Moda de Czuber: Segundo Czuber, teremos que:
⎛ 10 ⎞ ⎟ ⋅ 20 ⎝ 10 + 30 ⎠
Daí: Mo = 130 + ⎜
Finalmente, dispondo aplicaremos a fórmula do Teremos:
A=
(X − Mo) S
Æ
Æ
⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠ E: Mo=135
já de todos os elementos que procurávamos, Primeiro Coeficiente de Assimetria de Pearson.
A=
(138 − 135) S
Æ
A=
3 Æ Resposta da Questão! S
(Não ficaria surpreso se, na próxima prova do AFRF, uma questão Estatística cobrasse o Segundo Coeficiente de Assimetria de Pearson...!)
de
# Índice Momento de Assimetria: Esta é o quarto e último método pelo qual aprenderemos a determinar o valor do grau de Assimetria de um conjunto. Será dado pela seguinte fórmula:
A=
m3 S3
Página 10 de 13
ESTATÍSTICA Onde:
*** Ponto 28 – ASSIMETRIA ***
Pág. 11 de 13
- m3 é o Terceiro Momento Centrado na Média Aritmética; e - S3 é o Desvio-Padrão, elevado à terceira potência.
Para efeitos mnemônicos, lembraremos deste cálculo como sendo a Fórmula do 3, uma vez que é o único algarismo que aparece nela. Trata-se de um índice cuja aplicação não é das relembrar como se calculam os elementos deste índice. No numerador, teremos
mais
rápidas.
Vamos
m3, que é dado por:
∑ (PM − X ) . fi = 3
m3
n
E, no denominador, o Desvio-Padrão ao cubo, que poderá ser encontrado da seguinte maneira:
⎛ ⎜ 3 S =⎜ ⎜ ⎝
∑(
)
⎞ PM − X . fi ⎟ ⎟ n ⎟ ⎠ 2
3
Daí, teremos que a fórmula completa do Índice Momento de Assimetria será:
∑ (PM − X ) . fi 3
A=
n ⎛ ⎜ ⎜ ⎜ ⎝
∑(
)
⎞ PM − X . fi ⎟ ⎟ n ⎟ ⎠ 2
3
Percebemos, portanto, que para encontrar o Índice Momento de Assimetria teríamos que trabalhar o numerador e o denominador da fórmula isoladamente, para em seguida chegar ao resultado. Exatamente como se fossem duas questões em uma só. O que pode acontecer, é de a prova já fornecer uma tabela de freqüências bastante completa, de forma que já nos estivessem disponíveis todas as colunas que precisaríamos para usar na fórmula. Por exemplo, suponhamos que o enunciado da questão nos fornecesse uma distribuição nos moldes dessa abaixo: Classes
Fi
PM
... Σ
... N
...
PM- X ...
(PM- X )2 ...
(PM- X )2.fi ... E
(PM- X )3 ...
(PM- X )3.fi ... F
Observemos que designamos algumas letras (E e F) para os somatórios das colunas que nos interessarão, somente para efeitos de desenvolvermos o raciocínio a seguir.
Página 11 de 13
ESTATÍSTICA
*** Ponto 28 – ASSIMETRIA ***
Pág. 12 de 13
Nossa resolução, neste caso, se resumiria quase a uma transposição dos dados da tabela para a fórmula. Teríamos, portanto:
F n
A=
⎛ E⎞ ⎟ ⎜ ⎜ n⎟ ⎠ ⎝
3
# Resumo das Fórmulas de Assimetria: Segue, abaixo, um sumário das fórmulas dos índices e coeficientes de Assimetria que aprendemos hoje, e que seguramente poderão ser cobrados nas próximas provas de estatística dos concursos. Æ Índice Percentílico de Assimetria:
A=
(Q3 + Q1 − 2Md ) (Q3 − Q1)
Æ Primeiro Coeficiente de Assimetria de Pearson:
A=
(X − Mo) S
Æ Segundo Coeficiente de Assimetria de Pearson:
A=
(
3 X − Md S
)
Æ Índice Momento de Assimetria:
∑ (PM − X ) . fi 3
A=
m3 S3
Æ
A=
n ⎛ ⎜ ⎜ ⎜ ⎝
⎞ ∑ (PM − X ) . fi ⎟ 2
n
3
⎟ ⎟ ⎠
Bem, meus caros alunos virtuais! Por hoje é só! Espero que estudem essa aula com carinho, porque certamente haverá uma questão deste assunto na próxima prova. É só esperar para conferir. Tenho uma boa notícia: terminei, fi-nal-men-te, o livro de Estatística Para Concursos! Eu sei que sou suspeito para dizer qualquer coisa, mas vou dizer mesmo assim, e no estilo dos meus amigos recifenses: “o livro não tá ruim não, visse?” Agora é só uma questão de esperar um pouquinho para encontrá-lo nas livrarias.
Página 12 de 13
ESTATÍSTICA
*** Ponto 28 – ASSIMETRIA ***
Pág. 13 de 13
No mais, quero agradecer o carinho de várias pessoas que mandaram mensagens desejando o restabelecimento da saúde do meu pai. Muito obrigado, de coração! Dedico esta aula de hoje a todos vocês, meus batalhadores alunos virtuais, que dedicam o melhor de seu tempo e o maior de seus esforços, no objetivo de crescer profissionalmente. Que Deus abençoe a todos! Um abraço especial a Adriana Franco, minha amiga curitibana, que “devagar e sempre”, assim como tantos outros, vai certamente conquistar a sua vaga! Na próxima aula, Curtose! E depois, Números Índices. E ainda teremos tempo pra ficar resolvendo questões e mais questões, até chegar o dia da prova. Olha, e tem mais: eu, na condição de professor exigente que sou, não quero ver ninguém acertando menos que 90% dessa prova de Estatística. Falei? Tá falado! Até a próxima!
Página 13 de 13
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 1 de 14
CURTOSE Olá, amigos! Hoje estudaremos um assunto rápido, bastante cobrado em provas de estatística: a Curtose!
fácil
e
O que significa analisar um conjunto quanto à Curtose? Significa apenas verificar o “grau de achatamento da curva”. Ou seja, saber se a Curva de Freqüência que representa o conjunto é mais “afilada” ou mais “achatada” em relação a uma Curva Padrão, chamada de Curva Normal! Teremos, portanto, no tocante às situações de Curtose de um conjunto, as seguintes possibilidades:
Curva Leptocúrtica Curva Mesocúrtica Curva Platicúrtica
Logo, como vemos acima, uma curva (um conjunto) poderá ser, quanto à sua Curtose: -
Mesocúrtica: ou de curtose média! Será essa a nossa Curva Normal. “Meso” lembra meio! Esta curva está no meio termo: nem muito achatada, nem muito afilada;
-
Platicúrtica: é a curva mais achatada. Seu desenho lembra o de um prato emborcado, estão vendo? Então “prato” lembra “plati” e “plati” lembra “platicúrtica”;
-
Leptocúrtica: é a curva mais afilada!
Em aulas anteriores, vimos que existe uma relação estreita entre o valor das Medidas de Tendência Central (Média, Moda e Mediana) e o comportamento da Assimetria de um conjunto! Estamos lembrados disso? Todavia, quando se trata de Curtose, não há como extrairmos uma conclusão sobre qual será a situação da distribuição – se mesocúrtica, platicúrtica ou leptocúrtica – apenas conhecendo os valores da Média, Moda e Mediana. Página 1 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 2 de 14
Outra observação relevante, e que já foi bastante explorada em questões teóricas de provas anteriores, é que não existe uma relação entre as situações de Assimetria e as situações de Curtose de um mesmo conjunto. Ou seja, Assimetria e Curtose são medidas independentes e que não se influenciam mutuamente! Aprenderemos duas distintas maneiras de calcular o Índice de Curtose de um conjunto! # Índice Percentílico de Curtose: Encontraremos este índice usando a seguinte fórmula:
C= Onde: - Q3 é - Q1 é - D9 é - D1 é
o o o o
(Q3 − Q1 ) 2(D9 − D1 )
terceiro quartil; primeiro quartil; nono decil e primeiro decil.
Ou seja, trabalharemos aqui com duas Medidas Separatrizes – o Quartil e o Decil! Conforme vimos no Ponto 22, uma das primeiras Medidas de Dispersão que estudamos foi a chamada Amplitude Semi-Interquartílica - k. Estamos lembrados dela? É dada por:
k=
(Q3 − Q1 ) 2
Daí, uma outra forma de apresentar o Índice Percentílico de Curtose é o seguinte:
C=
k (D9 − D1 )
Onde: - K é a Amplitude Semi-interquartílica; - D1 é o primeiro Decil e - D9 é o nono Decil. Aí vem a pergunta: não se tornaria muito demorada a resolução de uma questão assim, que exigisse o cálculo de Q1, Q3, D1 e D9? Sim! De fato, não é uma questão das mais rápidas...! Mas já foi cobrada em prova e bem recentemente. Vejamos!
Página 2 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 3 de 14
Questão extraída do AFRF-2002.1: Em um ensaio para o estudo da distribuição de um atributo financeiro (X), foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüência abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 - 210
P(%) 5 15 40 70 85 95 100
Entende-se por curtose de uma distribuição seu grau de achatamento em geral medido em relação à distribuição normal. Uma medida de curtose é dada pelo quociente k = Q / (P90-P10), onde Q é a metade da distância interquartílica e P90 e P10 representam os percentis de 90% e 10%, respectivamente. Assinale a opção que dá o valor da curtose k para a distribuição de X. a) 0,263 b) 0,250 c) 0,300 d) 0,242 e) 0,000 Sol.: No enunciado, o elaborador tentou complicar um pouco a compreensão da fórmula do índice percentílico de Curtose. Além disso, usou Percentis em lugar de Decis. Todavia, sabemos perfeitamente que Décimo Percentil (P10) é o mesmo que Primeiro Decil (D1), e que Nonagésimo Percentil (P90) é a mesma coisa que Nono Decil (D9). Daí, tudo esclarecido. Usaremos, de fato, para encontrar esta resposta, o Índice Percentílico de Curtose, exatamente da forma como o conhecemos:
C=
(Q3 − Q1 ) 2(D9 − D1 )
Aproveitaremos que todo esse trabalho de encontrar os Quartis (Q1 e Q3) e os Decis (D1 e D9) já foram feitos para este mesmo enunciado, e reproduziremos aqui a resolução desta questão. Obviamente que todos perceberam que havia um trabalho preliminar a ser realizado, que era exatamente o de chegarmos à coluna da freqüência absoluta simples – fi.
Página 3 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 4 de 14
Como já foi falado exaustivamente sobre este procedimento de usar o Caminho das Pedras para chegar às freqüências desejadas, expomos a seguir o resultado destas operações e, finalmente, a coluna da fi.
Classes 70 – 90 90 – 110 110 – 130 130 – 150 150 – 170 170 – 190 190 – 210
Fac↓ 5% 15% 40% 70% 85% 95% 100%
Fi 5% 10% 25% 30% 15% 10% 5%
fi 10 20 50 60 30 20 10
Æ Cálculo do Primeiro Quartil – Q1: 1º Passo) Encontraremos n e calcularemos (n/4):
70 90 110 130 150 170 190
Xi !--!--!--!--!--!--!---
90 110 130 150 170 190 210
fi 10 20 50 60 30 20 10 n=200
Daí, achamos que n=200, portanto, (n/4)=50 2º Passo) Construímos a fac: Xi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210
Fi 10 20 50 60 30 20 10 n=200
fac↓ 10 30 80 140 170 190 200
3º Passo) Comparamos os valores da fac com o valor de a pergunta de praxe, adaptada ao primeiro quartil: Xi fi fac↓ 70 !--- 90 10 10 Æ 10 é maior ou igual 90 !--- 110 20 30 Æ 30 é maior ou igual 50 80 110 !--- 130 Æ 80 é maior ou igual 60 140 130 !--- 150 30 170 150 !--- 170 20 190 170 !--- 190 10 200 190 !--- 210 n=200
(n/4), fazendo
a 50? NÃO! a 50? NÃO! a 50? SIM!
Página 4 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 5 de 14
Como a resposta foi afirmativa na terceira fac, procuramos a classe correspondente (110 !--- 130) e dizemos que esta será nossa Classe do Primeiro Quartil. 4º Passo) Aplicamos a fórmula do Primeiro Quartil, tomando como referência a Classe do Q1. Teremos: ⎡⎛ n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q1 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ 50 − 30 ⎤ ⎥ ⋅ h Æ Q1 = 110 + ⎡ ⋅ 20 Æ E: Q1=118,0 ⎢ ⎥ ⎣ 50 ⎥⎦ ⎥ ⎦
Æ Cálculo do Terceiro Quartil: Q3 Sol.: 1º Passo) Encontraremos n e calcularemos (3n/4): Xi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210
fi 10 20 50 60 30 20 10 n=200
Daí, achamos que n=200 e, portanto, (3n/4)=150 2º Passo) Construímos a fac: Xi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210
fi 10 20 50 60 30 20 10 n=200
fac↓ 10 30 80 140 170 190 200
3º Passo) Comparamos os valores da fac com o valor de (3n/4), fazendo a pergunta de praxe, adaptada ao terceiro quartil: Xi fi fac↓ 70 !--- 90 10 10 Æ 10 é maior ou igual a 150? NÃO! 90 !--- 110 20 30 Æ 30 é maior ou igual a 150? NÃO! 110 !--- 130 50 80 Æ 80 é maior ou igual a 150? NÃO! 130 !--- 150 60 140 Æ 140 é maior ou igual a 150? NÃO! 30 170 150 !--- 170 Æ 170 é maior ou igual a 150? SIM! 20 190 170 !--- 190 10 200 190 !--- 210 n=200
Página 5 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 6 de 14
Como a resposta SIM surgiu na fac da quinta classe (150 !--- 170), diremos que esta será nossa Classe do Terceiro Quartil. 4º Passo) Aplicaremos a fórmula do Q3, usando os dados da Classe do Q3, que acabamos de identificar.
⎡ ⎛ 3n ⎞ ⎢ ⎜ 4 ⎟ − fac ANT Q3 = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
Æ
⎡150 − 140 ⎤ Q3 = 150 + ⎢ ⋅ 20 ⎣ 30 ⎥⎦
Æ E: Q3=156,6 Æ Cálculo do Primeiro Decil: D1 Sol.: 1º Passo) Encontraremos n e calcularemos Xi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210
(n/10): fi 10 20 50 60 30 20 10 n=200
Daí, achamos que n=200 e, portanto, (n/10)=20 2º Passo) Construímos a fac: Xi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210
fi 10 20 50 60 30 20 10 n=200
fac↓ 10 30 80 140 170 190 200
3º Passo) Comparamos os valores da fac com o valor de (n/10), fazendo a pergunta de praxe, adaptada ao primeiro decil: Xi fi fac↓ 70 !--- 90 10 10 Æ 10 é maior ou igual a 20? NÃO! 20 30 90 !--- 110 Æ 30 é maior ou igual a 20? SIM! 50 80 110 !--- 130 60 140 130 !--- 150 30 170 150 !--- 170 20 190 170 !--- 190 10 200 190 !--- 210 n=200
Página 6 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 7 de 14
Achamos, portanto, que a classe correspondente (90 !--- 110) será nossa Classe do Primeiro Decil! 4º Passo) Aplicamos a fórmula do Primeiro Decil:
⎡⎛ n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D1 = l inf + ⎢ fi ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⋅ h Æ D1 = 90 + ⎡ 20 − 10 ⎤ ⋅ 20 Æ E: D1=100,0 ⎢⎣ 20 ⎥⎦ ⎥ ⎥ ⎦
Æ Finalmente, encontraremos o Nono Decil – D9: Sol.: 1º Passo) Encontraremos n e calcularemos (9n/10): Xi fi 70 !--- 90 10 90 !--- 110 20 110 !--- 130 50 130 !--- 150 60 150 !--- 170 30 170 !--- 190 20 190 !--- 210 10 n=200 Daí, achamos que n=200 e, portanto, (9n/10)=180 2º Passo) Construímos a fac: Xi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210
fi 10 20 50 60 30 20 10 n=200
fac↓ 10 30 80 140 170 190 200
3º Passo) Comparamos os valores da fac com o valor de (9n/10), fazendo a pergunta de praxe, adaptada ao nono decil: Xi 70 !--- 90 90 !--- 110 110 !--- 130 130 !--- 150 150 !--- 170 170 !--- 190 190 !--- 210
fi fac↓ 10 10 20 30 50 80 60 140 30 170 20 190 10 200 n=200
Æ Æ Æ Æ Æ Æ
10 é maior ou igual a 180? NÃO! 30 é maior ou igual a 180? NÃO! 80 é maior ou igual a 180? NÃO! 140 é maior ou igual a 180? NÃO! 170 é maior ou igual a 180? NÃO! 190 é maior ou igual a 180? SIM!
Página 7 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 8 de 14
Achamos, portanto, que a classe correspondente (170 !--- 190) será nossa Classe do Nono Decil. 4º Passo) Aplicamos a fórmula do Nono Decil:
⎡ ⎛ 9n ⎞ ⎢ ⎜ 10 ⎟ − fac ANT ⎝ ⎠ D9 = l inf + ⎢ fi ⎢ ⎢ ⎣ Æ
⎤ ⎥ ⎥⋅h ⎥ ⎥ ⎦
⎡180 − 170 ⎤ Æ D9 = 170 + ⎢ ⋅ 20 ⎣ 20 ⎥⎦
E: D9=180
Agora sim! Chegou o momento de reunirmos os valores encontrados, para compormos a fórmula da Curtose! Teremos, portanto:
C= Æ
(Q3 − Q1 ) 2(D9 − D1 )
Æ
C=
C = 0,242
Æ
Resposta!
2.1.
(156,6 − 118) 2(180 − 100)
Interpretação do Resultado do Índice Percentílico de Curtose:
A questão acima foi resolvida pela mera aplicação da fórmula do índice percentílico. Todavia, questões haverá que solicitarão não apenas o resultado do índice, mas questionarão a situação de curtose em que se encontra aquele conjunto. Ou seja, desejarão saber se a distribuição será Mesocúrtica, Leptocúrtica, ou Platicúrtica. Daí, teremos que saber interpretar o resultado do índice de Curtose. No caso deste Índice Percentílico, a leitura que faremos do resultado é a seguinte: Se C0,263 Æ A distribuição é PLATICÚRTICA. Para a questão que resolvemos acima, por exemplo, tendo encontrado C=0,242, concluiríamos que se tratava de uma distribuição Leptocúrtica, caso isso estivesse sendo questionado pela questão.
Página 8 de 14
ESTATÍSTICA 3.
*** Ponto 29 – CURTOSE ***
Pág. 9 de 14
Índice Momento de Curtose: Será dado pela seguinte fórmula:
C= Onde: -
m4 S4
m4 é o Momento de 4a Ordem Centrado na Média Aritmética; e S4 é o Desvio-Padrão do conjunto, elevado à quarta potência.
Como só aparece número “4” nesta fórmula, lembraremos dela como sendo a fórmula do 4. Esta nos parece tão trabalhosa quanto a primeira (a do índice percentílico). Pois, na verdade, teríamos que encontrar isoladamente o valor do numerador (que já é uma questão em si) e depois o valor do denominador. As fórmulas seriam as seguintes: Æ O numerador (m4): Quarto Momento Centrado na Média:
∑ (PM − X ) . fi = 4
m4
n
Æ O denominador (S4): Quarta potência Desvio-Padrão:
( )
S4 = S2
2
(
)
2 ⎡ PM − X . fi ⎤ ∑ ⎥ =⎢ n ⎢ ⎥ ⎣ ⎦
2
Como vimos acima, a quarta potência do mesmíssima coisa que o quadrado da Variância. Então, nossa seria a seguinte:
fórmula
completa
do
índice
Desvio-Padrão momento
de
é
a
Curtose
∑ (PM − X ) . fi 4
C=
(
n
)
2 ⎡ PM − X . fi ⎤ ∑ ⎢ ⎥ n ⎢ ⎥ ⎣ ⎦
2
Questão de prova que venha a exigir o cálculo deste índice Momento de Curtose deverá, naturalmente, fornecer uma tabela já bastante completa, de modo que, apenas pelas colunas fornecidas na distribuição, já tivéssemos condições chegar ao resultado.
Página 9 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 10 de 14
Caso a prova nos dê na questão apenas uma tabela com a coluna das classes e a coluna da freqüência absoluta simples, teríamos que fazer um trabalho bastante demorado para chegarmos à resposta. Vejamos um exemplo ilustrativo dos passos que precisaríamos seguir. A tabela abaixo representa os dados fornecidos pelo enunciado: Classes ...
fi ...
Daí, como primeiro passo, teríamos que encontrar o valor da Média do conjunto. Provavelmente, seria mais rápido determinarmos o X se utilizarmos o método da Variável Transformada. Então, construiríamos a coluna dos Pontos Médios – PM: Classes ... Em seguida,
fi ...
PM ...
a Coluna de Transformação da Variável: Classes
fi
PM
...
...
...
(PM-1ºPM)=Yi h ...
Daí, faríamos a coluna do (Yi.fi): Classes ...
fi
PM
... ...
(PM-1ºPM)=Yi h ...
Yi.fi ...
E aplicaríamos a fórmula da Média da Variável Transformada:
Y=
∑ Yi. fi n
E, com este resultado, percorreríamos o Caminho de Volta da transformação, fazendo: ( Y x h ) e {( Y x h)+ 1ºPM} = X Neste ponto, construiríamos a coluna (PM- X ): Classes
fi
PM
...
...
...
(PM-1ºPM)=Yi Yi.fi h ... ...
PM- X ...
Página 10 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 11 de 14
E a coluna (PM- X )2 : Classes
fi
PM
...
...
...
(PM-1ºPM)=Yi Yi.fi h ... ...
PM- X
(PM- X )2
...
...
E a coluna [(PM- X )2.fi]: Classes ...
fi
PM
... ...
(PM-1ºPM)=Yi h ...
Yi.fi
PM- X
(PM- X )2
(PM- X )2.fi
...
...
...
...
E a coluna (PM- X )4 : (Desaparecerão aqui a transformação e a coluna do (Yi.fi) apenas por uma espaço). Xi fi PM PM- X ... ... ... ...
(PM- X )2 ...
(PM- X )2.fi ...
coluna questão
de de
(PM- X )4 ...
E, finalmente, a coluna [(PM- X )4.fi]: Xi fi PM PM- X ... ... ... ...
(PM- X )2 ...
(PM- X )2.fi ...
(PM- X )4 ...
(PM- X )4.fi ...
Daí, vamos designar nomes aos somatórios das colunas que nos interessam, só para enxergarmos melhor como será nossa conclusão: Xi fi PM PM- X ... ... ... ... n
(PM- X )2 ...
(PM- X )2.fi ... E
(PM- X )4 ...
(PM- X )4.fi ... F
Para concluir a questão, aplicaríamos a fórmula do 4:
∑ (PM − X ) . fi 4
C=
E encontraríamos que: ⎛F⎞ ⎜ ⎟ n C = ⎝ ⎠2 ⎛E⎞ ⎜ ⎟ ⎝n⎠
Æ
(
n
)
2 ⎡ PM − X . fi ⎤ ∑ ⎢ ⎥ n ⎢ ⎥ ⎣ ⎦
2
Resposta da Questão!
Página 11 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 12 de 14
Aprenderemos a seguir a forma de interpretar o resultado do índice Momento de Assimetria e, na seqüência, faremos uma questão extraída da prova do AFRF-2002.2, para termos uma noção mais precisa de como este assunto tem sido cobrado. 3.1.
Interpretação do Resultado do Índice Momento de Curtose:
Novamente aqui precisaremos conhecer como analisar o resultado do índice de Curtose, a fim de podermos definir nossa distribuição como Mesocúrtica, Leptocúrtica, ou Platicúrtica. Interpretaremos o Índice Momento de Curtose da seguinte maneira: Se C > 3 Æ A distribuição é LEPTOCÚRTICA; Se C = 3 Æ A distribuição é MESOCÚRTICA; Se C < 3 Æ A distribuição é PLATICÚRTICA. É, portanto, de suma importância que tenhamos bem memorizados estes valores de referência, a partir dos quais poderemos dizer em qual das situações de Curtose se encontra determinado conjunto. Passemos agora a uma questão de prova, bastante recente. EXERCÍCIO RESOLVIDO DE CURTOSE Questão Extraída do AFRF-2002-2: O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes 29,5 39,5 49,5 59,5 69,5 79,5 89,5
– – – – – – –
39,5 49,5 59,5 69,5 79,5 89,5 99,5
Freqüência (fi) 4 8 14 20 26 18 10
Para a distribuição de freqüências do atributo X, sabe-se que:
∑ (Xi − X ) . fi = 24.500 2
e
∑ (Xi − X ) . fi = 14.682.500 4
Nessas expressões os Xi representam os pontos médios das classes e X a média amostral.
Página 12 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 13 de 14
Assinale a opção correta. Considere para sua resposta a fórmula da curtose com base nos momentos centrados e suponha que o valor de curtose encontrado é populacional. a) A distribuição do atributo X é leptocúrtica. b) A distribuição do atributo X é platicúrtica. c) A distribuição do atributo X é indefinida do ponto de vista da intensidade da curtose. d) A informação dada se presta apenas ao cálculo do coeficiente de assimetria com base nos momentos centrados de X. e) A distribuição de X é normal. Sol.: A questão foi bastante clara, ao definir que o índice de curtose a ser empregado será o índice Momento. Daí, teremos que relembrar a fórmula:
∑ (PM − X ) . fi 4
C=
m4 S4
Æ
C=
(
n
)
2 ⎡ PM − X . fi ⎤ ∑ ⎢ ⎥ n ⎢ ⎥ ⎣ ⎦
2
Agora, reparemos nos dados fornecidos pelo enunciado. Observemos que o que ele chamou de Xi é o nosso Ponto Médio, que chamamos de PM. Daí, não resta dúvida: já nos foram fornecidos o numerador do m4 e o numerador do S4. Ora, o n – número de elementos do conjunto – será obtido somando a coluna da fi. E chegaremos ao valor de n=100. Daí, concluímos: já dispomos de todos os elementos da fórmula. Resta-nos transpô-los. Assim, teremos:
∑ (PM − X ) . fi 4
C=
(
n
)
2 ⎡ PM − X . fi ⎤ ∑ ⎢ ⎥ n ⎢ ⎥ ⎣ ⎦
2
Æ
14.682.500 100 C= 2 ⎡ 24.500 ⎤ ⎢⎣ 100 ⎥⎦
Æ
C = 2,44
E agora passamos à interpretação do resultado. Se utilizamos o índice Momento de Curtose, e encontramos que C=2,44 (portanto, um valor menor que 3) concluímos que a distribuição é platicúrtica! Logo: Opção b Æ Resposta da Questão!
Página 13 de 14
ESTATÍSTICA
*** Ponto 29 – CURTOSE ***
Pág. 14 de 14
Sobre a Curtose, é isso! A ESAF vem explorando esse assunto, ora exigindo o cálculo por um índice (percentílico), ora por outro (momento)! Vamos ver qual será o próximo! Finalmente, saiu o edital! Acredito que a sensação de todos vocês deve ser a mesma que vejo em meus alunos aqui em Fortaleza: muita apreensão devido as mudanças do programa,e o sentimento de ter que refazer a programação de estudos até o dia da prova, em decorrência, sobretudo da matéria de Direito Administrativo, que voltou a ser cobrado. O Vicente, inclusive, já havia “cantado” essa novidade aqui no Site. Aliás, penso que no tocante a essa disciplina há dois livros que seriam muitíssimo bem indicados. Ambos da Ed. Impetus: o de autoria do Vicente Paulo e Marcelo Alexandrino, com teoria e exercícios, e um editado mais recentemente, com provas resolvidas e primorosamente comentadas pelo colega e Prof. Gustavo Barchet. Tenho estes dois livros, e os indico aos meus alunos constantemente. Outra coisa: as matérias Matemática Financeira e Estatística reduziram-se agora para apenas dez questões (antes eram quinze)! A lógica nos diz que serão cinco questões para cada uma. Já ouvi alguns comentários de alunos, matérias agora “perderam a importância”.
dizendo
que
estas
Pensamento dos mais infelizes...! Não é querendo “puxar a sardinha pra minha lata”, mas não existe, neste concurso, matéria sem importância. Vá dizer isso pra qualquer pessoa que tenha ficado de fora das vagas por uma ou por duas questões...! (Como foi o meu caso, em 2001!). Além do que, continua havendo o chamado “ponto de corte”. Ou seja, das dez, quatro terão que ser acertadas! E quanto mais pontos você fizer, melhor! Aumenta a contagem geral! A prova será, como já é de conhecimento de todos, em 29 de novembro. São quase dois meses até lá. Tempo suficiente para se fazer as revisões necessárias, intensificar a resolução dos exercícios. (E ainda aprender o que resta ser aprendido!) No nosso caso, aqui, da Estatística, meu plano é encerrar o programa, com mais uma aula – a de Números Índices – e, na seqüência, passar a resolver as questões dos cinco últimos concursos: 1996, 1998, 2001, 2002/a e 2002/b. É certo que muitas destas questões, muitas mesmo, já foram resolvidas em nossas aulas, mas não tem problema, resolvemos novamente e fixamos melhor o que foi aprendido. E, além disso, pretendo colocar novos simulados, com questões bem próximas da linha da ESAF. Espero que isso seja mais que suficiente pra nos deixar aptos a acertar as cinco questões da nossa prova! Fico por aqui! Um grande abraço a todos e até a próxima.
Página 14 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 1 de 14
SIMULADO 03
Leia agora!
Queridos amigos, VOLTAMOS!! Não sei quanto a vocês, mas eu estava com saudades. E já que voltamos, não temos mais um segundo a perder! Como vocês sabem, falta ainda para encerrarmos a nossa teoria do programa de Estatística do AFRF um assunto, que é o de Números Índices. Mas, como tivemos estas duas semanas de recesso, sem acompanhar nenhuma aula, achei por bem retomarmos com um novo simulado, abrangendo questões relativas aos assuntos já estudados por nós, e que representam uns 90% ou mais do nosso programa! Assim, nós aproveitamos para revisar tudo o que foi visto, e reavivar nossa memória! Ok? Aliás, não há muito mais o que ser feito, além de resolver exercícios! Desse modo, faremos este simulado hoje, e mais alguns outros, até chegar o dia da prova. Estou adaptando esse nosso teste para apenas cinco questões, que é exatamente o mesmo formato que virá em nossa prova. Como me parece humanamente impossível abordar todos os tópicos do programa em cinco enunciados, então teremos mesmo que fazer mais de um simulado. Então ficamos assim: escolha um horário em que você possa ter pelo menos uma hora livre. Daí, concentre-se e comece a resolver este simulado, fazendo de conta que você está na prova! Tente não consultar o material teórico. Isso vai servir para você verificar se os assuntos estudados foram bem aprendidos, se estão bem memorizados, ou se é o caso de uma nova e boa revisão! Quando terminar as questões, então passe a comparar sua resolução com a minha. Vou separar as resoluções em páginas distintas das do enunciado, para que ninguém se sinta “tentado” a consultá-las antes do tempo. Se o seu resultado não for o mais satisfatório possível, não desanime. Ainda, neste instante, podemos nos dar ao luxo de errar. E errar em casa pode ser a melhor coisa do mundo, desde que você atente para o seu erro, e aprenda, definitivamente, a resolver a questão da forma correta! Então, se acertar tudo, parabéns! Se errou alguma coisa, parabéns também: doravante passará a acertar o que errou! Chega de lero! E vamos ao teste.
Página 1 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 2 de 14
Resolva agora! Para resolver as questões que se seguem, considere a seguinte tabela de freqüências abaixo, sabendo que foram feitas 300 observações da variável Xi: Classes (Xi) 29,5 ; 39,5 39,5 ; 49,5 49,5 ; 59,5 59,5 ; 69,5 69,5 ; 79,5 79,5 ; 89,5
K(%) 100 95 80 57 20 8
1. Assinale a opção que corresponde, respectivamente, aos valores mais aproximados da média e do segundo quartil do conjunto. a) 58,5 e 55,72 c)63,09 e 60,5 e)58,5 e 61,39 b) 60,5 e 61,39 d)60,5 e 63,09
2. Assinale a opção que indica quantos elementos deste conjunto apresentam valor menor ou igual a 55. a)95,97 c)97,95 e)90,37 b)129,00 d)92,54
3. Sabendo que a variância da variável Xi é 156,0 e considerando que Zi=(2Xi-3)/4, determine a opção que corresponde aos valores mais aproximados, respectivamente, da variância e do coeficiente de variação da variável Zi. a) 78,0 e 0,442 c)6,24 e 0,325 e)31,2 e 0,340 b) 52,0 e 0,212 d)39,0 e 0,212
4. Assinale a opção que mais se aproxima do valor do primeiro coeficiente de Assimetria de Pearson do conjunto. a) -0,207 c)0,432 e)0,235 b) 0,325 d)-0,702
5. a) b) c) d) e)
Assinale a opção correta: Uma vez que a distribuição é assimétrica à esquerda, apresentará uma curva leptocúrtica. A distribuição é assimétrica à esquerda, ou de assimetria positiva. A distribuição é assimétrica à direita, ou de assimetria positiva. A distribuição é mesocúrtica, tendo em vista que é também simétrica. A distribuição é assimétrica à esquerda, ou de assimetria negativa.
Página 2 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 3 de 14
Leia depois que resolver o simulado! E aí, resoluções!
minha
Trabalhamos todo freqüências:
gente?
este
Terminaram?
simulado
com
Classes (Xi) 29,5 ; 39,5 39,5 ; 49,5 49,5 ; 59,5 59,5 ; 69,5 69,5 ; 79,5 79,5 ; 89,5
Então,
a
passemos
seguinte
agora
às
distribuição
de
K(%) 100 95 80 57 20 8
Ora, já é do nosso inteiro conhecimento que não podemos iniciar a resolução da prova antes de chegarmos à coluna da freqüência absoluta simples – fi. Daí, nosso primeiro passo consiste em descobrir qual foi a coluna de freqüência fornecida pelo enunciado, para então nos lembrarmos do caminho das pedras, e percorrê-lo para construirmos a fi. Primeiro: a coluna fornecida é de freqüência absoluta ou relativa? Ora, o sinal de percentagem (%) foi colocado no cabeçalho da coluna, logo, não há dúvidas: estamos diante de uma freqüência relativa. Para sabermos se esta freqüência relativa é acumulada ou não, é só nos lembrarmos do seguinte: a freqüência relativa acumulada ou começa ou termina com 100%. No caso desta nossa coluna, o primeiro valor é 100%, pelo que constatamos que se trata de uma freqüência relativa acumulada. Por fim, esta freqüência relativa acumulada será crescente ou decrescente? Ora, aí fica fácil! Os valores da coluna estão diminuindo! Conclusão: a prova forneceu uma coluna de freqüência relativa acumulada decrescente – Fad. Seguindo o caminho das pedras, teremos que fazer dois passos, para chegarmos à fi. No primeiro passo, chegaremos à freqüência relativa simples – Fi. Lembremos que o procedimento a ser realizado neste passo será fazer “próxima Fac menos Fac anterior”. Teremos, portanto: Classes (Xi) Fi Fad ↑ 29,5 ; 39,5 100% 5% 39,5 ; 49,5 95% 15% 49,5 ; 59,5 80% 23% 59,5 ; 69,5 57% 37% 69,5 ; 79,5 20% 12% 79,5 ; 89,5 8% 8% Página 3 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 4 de 14
No passo seguinte, chegaremos finalmente à fi, lembrando que a relação que há entre as duas freqüências simples – a absoluta (fi) e a acumulada (Fi) – é dada por: Fi=(fi/n), ou escrito de outra forma: fi=Fi.n . O enunciado da prova nos disse que foram feitas 300 observações da variável Xi, ou seja, n=300. Daí, teremos: Æ fi da 1ª classe: fi=0,05x300=15 Æ fi da 2ª classe: fi=0,15x300=45 Aqui você já percebeu que o efeito de multiplicar qualquer valor percentual por 300 é o mesmo que tirar o sinal de percentagem e multiplicar por 3. Claro: os dois zeros do trezentos irão sempre cortar com os dois zeros do por cento. Daí, nossa coluna da freqüência simples absoluta (fi) será a seguinte: Classes (Xi) 29,5 ; 39,5 39,5 ; 49,5 49,5 ; 59,5 59,5 ; 69,5 69,5 ; 79,5 79,5 ; 89,5
Fad ↑ 100% 95% 80% 57% 20% 8%
Fi 5% 15% 23% 37% 12% 8%
fi 15 45 69 111 36 24 n=300
Agora, sim, meus amigos, estamos prontos para começar a resolver as questões! Antes disso, não! 1. Assinale a opção que corresponde, respectivamente, aos valores mais aproximados da média e do segundo quartil do conjunto. Sol.: Vamos encontrar a Média deste conjunto, trabalhando pelo método da variável transformada. Como primeiro passo, construiremos a coluna dos pontos médios: Classes (Xi) 29,5 ; 39,5 39,5 ; 49,5 49,5 ; 59,5 59,5 ; 69,5 69,5 ; 79,5 79,5 ; 89,5
Fad ↑ 100% 95% 80% 57% 20% 8%
Fi 5% 15% 23% 37% 12% 8%
fi 15 45 69 111 36 24 n=300
PM 34,5 44,5 54,5 64,5 74,5 84,5
Página 4 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 5 de 14
Agora, construiremos a coluna de transformação da variável, adotando aquela sugestão: “(PM menos o primeiro PM)/amplitude da classe”. Teremos: Classes (Xi)
29,5 39,5 49,5 59,5 69,5 79,5
; ; ; ; ; ;
39,5 49,5 59,5 69,5 79,5 89,5
Fad ↑
Fi
fi
PM
(PM-34,5)=Yi 10
100% 95% 80% 57% 20% 8%
5% 15% 23% 37% 12% 8%
15 45 69 111 36 24 n=300
34,5 44,5 54,5 64,5 74,5 84,5
0 1 2 3 4 5
Daí, construiremos a coluna Yi.fi: Classes (Xi)
29,5 39,5 49,5 59,5 69,5 79,5
; ; ; ; ; ;
39,5 49,5 59,5 69,5 79,5 89,5
Fad ↑
Fi
fi
PM
(PM-34,5)=Yi 10
Yi.fi
100% 95% 80% 57% 20% 8%
5% 15% 23% 37% 12% 8%
15 45 69 111 36 24 n=300
34,5 44,5 54,5 64,5 74,5 84,5
0 1 2 3 4 5
0 45 138 333 144 120 780
Na seqüência, encontraremos transformada Yi. Teremos:
Y=
∑ Yi. fi n
Y=
Æ
o
780 300
valor
Æ
da
Média
da
variável
E: Y = 2,60
Ora, não nos interessa o valor da média da variável transformada, e sim a média da variável original Xi. Daí, desenharemos os caminhos de ida e de volta utilizados para migrar de uma a outra variável. Teremos: Caminho de Ida 1º) (-34,5)
X =?
e
2º) (÷10)
Xi (Variável Original)
Yi (Variável Transformada)
2º) (+34,5)
e
Y = 2,60
1º) (x10)
Caminho de Volta
Página 5 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 6 de 14
Para chegarmos ao X , teremos que percorrer o Caminho de Volta, recordando que a Média é influenciada pelas quatro operações matemáticas. Ou seja, qualquer operação que surja no caminho de volta será aqui efetuada. Teremos, portanto: 1º)(x10)Æ 2,6x10=26,0
e 2º)(+34,5)Æ 26+34,5=60,5
Daí: X = 60,5 A outra coisa que a questão está pedindo é exatamente o valor do segundo quartil. Ora, já sabemos que segundo quartil – Q2 – é sinônimo de Mediana! Todos lembrados? Da mesma forma que Quinto Decil (D5) e Qüinquagésimo Centil (P50). Para aplicarmos a fórmula da Mediana, teremos que saber qual será a Classe Mediana. E para tanto, independentemente de n ser um valor par ou ímpar, efetuaremos a seguinte conta:(n/2) Daí, teremos que: Então, 150 aos valores da (fac), por meio igual a (n/2)?”.
n 300 = = 150 2 2
será nosso valor de referência, que será comparado coluna da freqüência absoluta acumulada crescente daquelas perguntas de praxe: “esta fac é maior ou Construindo a coluna da fac, teremos:
Classes (Xi)
29,5 39,5 49,5 59,5 69,5 79,5
; ; ; ; ; ;
39,5 49,5 59,5 69,5 79,5 89,5
Fad ↑
Fi
fi
fac ↓
100% 95% 80% 57% 20% 8%
5% 15% 23% 37% 12% 8%
15 45 69 111 36 24 n=300
15 60 129 240 276 300
E passamos às perguntas: Classes (Xi)
29,5 39,5 49,5 59,5 69,5 79,5
; ; ; ; ; ;
39,5 49,5 59,5 69,5 79,5 89,5
Fad ↑
Fi
fi
fac ↓
100% 95% 80% 57% 20% 8%
5% 15% 23% 37% 12% 8%
15 45 69 111 36 24 n=300
15 60 129 240 276 300
Æ Æ Æ Æ
15 é ≥ 150? Não! 60 é ≥ 150? Não! 129 é ≥ 150? Não! 240 é ≥ 150? SIM!
Página 6 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 7 de 14
Como a resposta afirmativa surge na fac da quarta classe, sabemos imediatamente que esta é a nossa classe mediana: (59,5 ; 69,5). Agora, resta aplicarmos a fórmula da Md. Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣
⎤ ⎥ 150 − 129 ⎤ ⎥ ⋅ h Æ Md = 59,5 + ⎡ ⋅ 10 Æ Daí: Md=61,39 ⎢ ⎥ ⎣ 111 ⎥⎦ ⎥ ⎦
Portanto, a resposta da primeira questão será esta: Média=60,5 e Mediana=61,39 Æ OPÇÃO B. Ora, imediatamente nos lembraremos que, quando conhecemos duas medidas de tendência central de um mesmo conjunto, já somos capazes de identificar qual será o comportamento da curva de freqüência que representa este conjunto, no tocante à sua assimetria! Estamos recordados disso? Claro! Então já passaremos uma vista nas questões seguintes, para ver se alguma delas questiona exatamente isso: se a distribuição é simétrica ou assimétrica, e, caso seja assimétrica, se é assimétrica positiva (à direita) ou negativa (à esquerda)! Houve uma questão assim? HOUVE!! É a quinta questão! Saltaremos logo para ela! 5. Assinale a opção correta: a) Uma vez que a distribuição é assimétrica à esquerda, apresentará uma curva leptocúrtica. Várias questões teóricas já tentaram estabelecer uma relação entre o comportamento da assimetria de um conjunto e seu comportamento quanto à Curtose! E nós sabemos que essa relação não existe! Errado, portanto, esse item. b) A distribuição é assimétrica à esquerda, ou de assimetria positiva. Ora, sabemos que assimetria à esquerda é o mesmo que assimetria negativa, e não positiva como afirma este item. Errado, portanto! c) A distribuição é assimétrica à direita, ou de assimetria positiva. Na questão anterior, verificamos que, para o nosso conjunto, a Média é menor que a Mediana. Daí, lembraremos daquela pequena frase que diz “a seta puxa a média”, e já enxergaremos aquela curva, com a setinha apontando para o lado da esquerda, e puxando a média para o seu lado! Ora, esta curva representa o quê? Uma distribuição assimétrica à esquerda, ou de assimetria negativa! Errado este item.
Página 7 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 8 de 14
d) A distribuição é mesocúrtica, tendo em vista que é também simétrica. Novamente o enunciado tentou estabelecer uma relação entre assimetria e curtose. Falso, portanto. e) A distribuição é assimétrica à esquerda, ou de assimetria negativa. É a resposta CORRETA, conforme explicado no item “c”. Aproveitemos o ensejo e relembremos o desenho de uma curva assimétrica à esquerda, ou de assimetria negativa!
← Média < Mediana < Moda
Portanto: Resposta) OPÇÃO E. Passemos à questão dois! 2. Assinale a opção que indica quantos elementos deste conjunto apresentam valor menor ou igual a 55. Sol.: Este enunciado, caso quisesse, poderia ter acrescentado o seguinte: “...ou igual a 55, utilizando a interpolação linear da ogiva.” Estamos lembrados disso? Como primeiro passo, descobriremos quais são as classes que participarão da composição da resposta, e de que forma o farão. Vejamos. Abaixo de 55, teremos: Classes (Xi)
29,5 39,5 49,5 59,5 69,5 79,5
; ; ; ; ; ;
39,5 49,5 59,5 69,5 79,5 89,5
fi
15 45 69 111 36 24 n=300
Æ 1ªclasse: participa integralmente Æ 2ªclasse: participa integralmente Æ 3ªclasse: participa parcialmente
Trabalharemos, pois, com a terceira classe, fazendo uma regra de três para calcularmos com quantos elementos esta classe participará da resposta.
Página 8 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 9 de 14
Nossa classe é essa: (49,5 ; 59,5) Na primeira linha da regra de três, trabalhamos com a classe completa, fazendo “amplitude da classe está para freqüência simples”. Ou seja:(h --- fi). Teremos: 10 --- 69 Na segunda linha da regra de três, trabalharemos com a classe quebrada. Ora, nesta classe, valores até 55 são os seguintes: (49,5 -- 55). Daí, teremos: 5,5 --- X Onde 5,5 é a amplitude quebrada, encontrada por (55-49,5). Daí, nossa regra de três completa será a seguinte: 10 --- 69 5,5 --- X Acharemos que X=37,95. Este valor corresponde exatamente participação da terceira classe na resposta. Agora passaremos compor nosso resultado, fazendo: 1ªclasse Æ 2ªclasse Æ 3ªclasse Æ Total =
15 45 37,95 97,95
elementos elementos elementos elementos
à a
(fi=15) (fi=45) (X=37,95) Æ Resposta: OPÇÃO C.
3. Sabendo que a variância da variável Xi é 156,0 e considerando que Zi=(2Xi-3)/4, determine a opção que corresponde aos valores mais aproximados, respectivamente, da variância e do coeficiente de variação da variável Zi. Sol.: Neste enunciado a questão nos forneceu uma transformação da variável original, em uma nova variável Zi! Construiremos de imediato os caminhos de ida e volta de conversão de uma variável em outra. Teremos: Caminho de Ida 1º) (x2)
S x = 156 2
Æ
2º) (-3)
Æ
3º)(÷4)
Xi
Zi
(Variável Original) 3º)(÷2)
Sz = ? 2
(Variável Transformada) ←
2º) (+3)
←
1º) (x4)
Caminho de Volta
Página 9 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 10 de 14
Começaremos trabalhando com a Variância, recordando as suas propriedades! Lembraremos que a variância não é influenciada por operações de soma e subtração, contudo sofre o efeito de operações de produto e divisão. Além disso, temos que lembrar que quando multiplicamos ou dividimos os elementos de um conjunto por uma constante, a nova variância ficará multiplicada ou dividida pelo quadrado daquela constante! Assim, as operações que influenciarão a variância, em nosso caminho de ida, são as seguintes: 1º) (x2) Æ a variância ficará multiplicada por (2)2, ou seja, por 4; 2º) (÷4) Æ a variância ficará dividida por (4)2 = 16. Daí, multiplicar um valor qualquer por 4, e em seguida dividilo por 16 é exatamente o mesmo que apenas dividi-lo por 4. Senão, vejamos: ⎛4⎞ ⎛1⎞ X X .⎜ ⎟ = X .⎜ ⎟ = ⎝ 16 ⎠ ⎝4⎠ 4 Portanto, nossa nova Variância será dada por:
Sz = 2
156 4
Æ
E:
S z = 39 2
Æ Resposta!
A questão pede agora o valor do Coeficiente de Variação da variável Zi. Temos que o valor do CV é dado por: CV z =
Sz
, ou seja: desvio-padrão dividido pela média! Z A Média da variável original - X - já foi calculada na primeira questão, na qual encontramos que: X =60,5. Só que agora nos interessa conhecer o valor da média da variável transformada Zi. Para isso, percorreremos o caminho de ida, lembrando-nos de que a média é influenciada pelas quatro operações, de modo que para encontrar o Z , faremos: 1º) (x2) Æ 60,5 x 2 = 121,00; 2º) (-3) Æ 121,0-3=118,0 3º) (÷4) Æ 118,0÷4=29,5 Determinamos, portanto, que: Z =29,5
Página 10 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 11 de 14
Daí, resta-nos determinar o valor do desvio-padrão da variável Z. Sabemos a relação que há entre desvio-padrão e variância: S = S 2 . Assim, tendo já calculado o valor da variância (S2) da variável Zi, teremos agora que calcular a raiz quadrada deste valor! Ou seja: 2 Æ Se S z = 39 , então: S z = 39
Æ
Daí: S z = 6,24
Finalmente, aplicaremos a fórmula do coeficiente de variação, para calcular que:
CV z =
Sz Z
Æ
E: CV =
6,24 29,5
Æ
Daí: CVz=0,212 Æ Resposta!
Os valores solicitados como resposta foram, portanto, 2 seguintes: S z = 39 & CVz=0,212 Æ Resposta: OPÇÃO D.
os
Obs.: Talvez alguns de vocês (ou muitos!) tenham se assustado um pouco pelo fato de ter sido exigido nesta questão que se soubesse calcular o valor de uma raiz quadrada. O fato é que a ESAF até hoje evitou de exigir esse conhecimento! Mas a verdade é que não há nada, absolutamente nada, que a impeça de fazê-lo quando bem entender! Na prova, somente nos daremos ao trabalho de calcular uma raiz quadrada quando isso for totalmente imprescindível! Ou seja, quando não houver outra forma de se chegar ao resultado. Imagine uma situação em que você fez todos os cálculos, e chegou ao seguinte: S = 27 . Imagine ainda que esta mesma questão está pedindo o valor que mais se aproxima do desvio-padrão S desta variável. O que você vai fazer? Suponha que as opções de resposta são as seguintes: a)4,8;
b)5,2;
c)5,5;
d)5,6;
e)5,8
Ora, em vez de perder tempo tentando calcular o valor da raiz de 27, você irá fazer o seguinte: pegará cada opção de resposta e multiplicará por ela mesma! Aquela resposta que ao quadrado der 27 será justamente a que estamos procurando! A minha sugestão é que você comece pela opção “C”. Porque assim, haverá dois valores menores e dois maiores que o valor desta opção. Daí, faremos: Æ opção C:
(5,5)x(5,5)=30,2
Página 11 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 12 de 14
Ora, como o resultado foi um valor maior que 27, então nossa resposta estará entre as opções A e B. Passamos à análise da opção B. Teremos: Æ opção B: (5,2)x(5,2)=27,04 ≈ 27,0 Pronto! Achamos nossa resposta: opção B! Agora, se tivermos realmente que calcular uma raiz quadrada, existem vários diferentes métodos para se fazer isso! Conheço um que gosto muito, e que me parece o mais fácil de todos. Com esse método, calculamos a raiz quadrada trabalhando apenas com subtrações! Não hoje, mas talvez já na próxima aula eu prometo apresentarlhes este método. Ok? Vamos à questão quatro!
4. Assinale a opção que mais se aproxima do valor do primeiro coeficiente de Assimetria de Pearson do conjunto. Sol.: Aqui a coisa mais importante seria apenas conhecer a fórmula do primeiro coeficiente de assimetria de Pearson. Todos lembrados? É a seguinte: X − Mo A= S
(
)
Como já havíamos calculado na primeira questão o valor da Média da variável Xi – ( X =60,5) - teremos, destarte, que nos dedicar aos cálculos da Moda e do Desvio-Padrão. Vamos à Moda! O primeiro passo é descobrir a Classe Modal, qual seja, aquela que apresenta maior fi! Teremos: Classes (Xi)
29,5 39,5 49,5 59,5 69,5 79,5
; ; ; ; ; ;
fi
39,5 49,5 59,5 69,5 79,5 89,5
15 45 69 111 Æ Classe Modal! 36 24 n=300 Descoberta a Classe Modal, resta-nos aplicar a fórmula da Moda de Czuber! E é a seguinte: ⎛ Δa ⎞ ⎟⎟ ⋅ h Mo = l inf + ⎜⎜ ⎝ Δa + Δp ⎠
Página 12 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 13 de 14
Vamos logo saber quem serão os deltas: Classes (Xi)
29,5 39,5 49,5 59,5 69,5 79,5
; ; ; ; ; ;
39,5 49,5 59,5 69,5 79,5 89,5
fi
15 45 69 111 36 24
Æ Classe Anterior: Δa=111-69 Æ Δa=42 Æ Classe Modal! Æ Classe Posterior: Δp=111-36 Æ Δp=75
n=300
⎛ 42 ⎞ Daí: Mo = 59,5 + ⎜ ⎟ ⋅ 10 ⎝ 42 + 75 ⎠
Æ
E: Mo=63,09
Feito isso, falta-nos conhecer o valor do desvio-padrão da variável original Xi. Ora, já nos foi fornecido na questão anterior que o valor da Variância de Xi é igual a 156. Ou seja: 2 S x = 156 Daí, teremos que: S x = 156
Æ
Daí: S z = 12,49
Agora, aplicando a fórmula da assimetria pelo 1º coeficiente de Pearson, teremos que:
A=
(X − Mo) S
Æ E: A =
(60,5 − 63,09) 12,49
Æ
Daí: A=-0,207
Æ Resposta: OPÇÃO A. Ora, como já sabíamos que este conjunto apresenta assimetria à esquerda, já estávamos esperando como resultado do coeficiente de assimetria um valor negativo! Nas opções de resposta, só havia duas opções com valores negativos. Daí, se estivéssemos naquela situação desesperadora, de o tempo da prova estar esgotado e o examinador já se aproximando de você para tomá-la, obviamente que direcionaríamos o nosso “chute” para uma daquelas opções (A ou D).
Página 13 de 14
ESTATÍSTICA
*** Ponto 30 –SIMULADO 03 ***
Pág. 14 de 14
Bem, amigos! Por hoje é só. Espero que este teste tenha servido como uma pequena revisão. Nesta reta final, o mais importante de tudo, além de manter a calma, é resolver o máximo de exercícios! Estou ainda concluindo a aula de Números Índices. Enquanto isso, se for o caso, apresentarei um novo simulado. O importante é que não fiquemos muitos dias sem aula. Estejam certos que farei de tudo para não me ausentar por longos dias, até que chegue nossa prova. Último aviso aos concursandos de Fortaleza. Na próxima semana, estaremos iniciando novas turmas – as últimas antes do AFRF – de Estatística e de Matemática Financeira! Vagas limitadas. Preço de fim de feira! É ligar para conferir:(85)91.11.92.21. Dedico este Ponto de hoje a um grupo de amigos do Recife, que tive a oportunidade de rever há poucos dias: Eleonora, Vanice, Luís Augusto e o casal Marcos Santa Clara e Sandra. Todos concurseiros de primeira categoria! Que Deus os ilumine, e que o sucesso esteja mais próximo a cada dia. Forte abraço a todos, e até breve!
Página 14 de 14
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 1 de 21
SIMULADO 04 Olá, amigos! E aí, como se saíram no “simulado 03”? Espero que estejam no caminho certo. Quem eventualmente não fez um bom teste, espero que se recorde das minhas palavras e tire proveito dos erros cometidos, para que não se repitam no futuro, especialmente na hora da prova! Enquanto a aula de números índices “não sai”, vamos passar hoje a um novo simulado e, conforme prometido, vou tentar ensinar um método bastante prático para calcularmos a raiz quadrada de um valor qualquer. # Aprendendo a Calcular a Raiz Quadrada: EXEMPLO 01) Quanto é
9?
Sol.: Façamos de conta que não sabemos o resultado. Este método se baseia em subtrações sucessivas dos números ímpares!! Quem é o primeiro subtraindo por ele!
número
ímpar?
É
o
número
1.
Então,
começaremos
Teremos: 9 1 – 8 A pergunta: podemos continuar subtraindo pelo próximo número ímpar? Quem é o próximo número ímpar, depois de 1? É o número 3. Então, podemos subtrair. Teremos: 8 3 – 5 Quem é o próximo número ímpar? É o 5. Podemos continuar subtraindo? Sim! Teremos: 5 5 – 0 Quando nosso resultado der igual a zero (foi o caso!), diremos que a nossa raiz é exata. Então, paramos, e contamos quantas subtrações foram feitas! Quantas? Três! Logo, 3 é nossa resposta! Daí:
9 = 3
Æ
Resposta!
Página 1 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 2 de 21
EXEMPLO 02) Quanto é 144 ? Façamos de conta que não sabemos a resposta! O primeiro passo será sempre esse: dividir nosso número de duas em duas casas, da direita para a esquerda. E começamos a trabalhar com quem está à nossa esquerda! Teremos:
1´44
Iniciaremos Teremos:
Æ Ou seja, começaremos a trabalhar com o 1.
nossas 1´44 1 – 0
subtrações,
a
partir
do
primeiro
número
ímpar!
Quando não for possível prosseguir as subtrações, ou porque o resultado foi zero (nosso caso), ou porque o resultado foi um valor menor que o próximo número ímpar, faremos o seguinte: pararemos, e contaremos quantas subtrações foram feitas! Quantas? Uma. Então, o número 1 é o primeiro algarismo da nossa resposta! Ou seja, por enquanto:
144 =1...
Prosseguindo, baixaremos as duas próximas casas. Lembrem-se que sempre trabalharemos baixando duas casas! Teremos: 1´44 1 0 44 Agora, atenção! O segredo deste método vem agora! Se entendermos o que vou explicar neste momento, então matamos a charada! A grande questão é: a partir de qual número ímpar nós iremos reiniciar nossas subtrações? A regra é a seguinte: no lugar das unidades, teremos sempre o número 1. Vejamos: 1´44 1 0 44 1E, acompanhando a unidade, no lado esquerdo, teremos o valor do último número ímpar que usamos para subtrair, somado a um! Quem foi o último número ímpar usado para subtrair? Vejamos: 1´44 1 0 44 1-
último número ímpar usado para subtrair!
Página 2 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 3 de 21
Foi o número “1”. Daí, somamos (1+1)=2. Logo, o número 2 irá acompanhar a unidade na próxima subtração. Vejamos: 1´44 1 0 44 21-
último número ímpar usado para subtrair!
[(último número ímpar)+1] Ou seja: reiniciaremos nossas subtrações, a partir do número ímpar 21. Teremos: 1´44 1 0 44 2123 Quem é o próximo número ímpar, depois de 21? Naturalmente que é o 23. Teremos: 1´44 1 0 44 2123 230 Quando a resposta for zero, estamos diante de uma raiz exata! Temos agora que contar quantas subtrações foram realizadas após a descida das duas últimas casas!! Ora, as duas últimas casas foram “44”, e depois que descemos o “44”, fizemos duas subtrações. Então, o número 2 é o segundo algarismo da nossa resposta! Teremos: 144 =12 Æ Resposta!
EXEMPLO 03) Quanto é
59049 ?
Façamos de conta que não sabemos! (Alguém já sabe quanto é?) Como primeiro passo, dividiremos o nosso número de duas em duas casas, iniciando da direita para a esquerda! Teremos: 5´90´49 Já sabemos que vamos começar as subtrações pelo lado esquerdo, ou seja, pelo 5. Teremos: 5´90´49 1 – 4 Página 3 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 4 de 21
Podemos continuar subtraindo pelo próximo número ímpar? Sim! Teremos: 5´90´49 1 – 4 3 – 1 Podemos continuar subtraindo pelo próximo ímpar? Não! Quando a resposta for “NÃO”, pararemos, e contaremos quantas subtrações foram feitas. Quantas? Duas! Então, o número 2 é o primeiro na composição do resultado desta raiz. Ou seja: 59049 = 2... Na seqüência, já sabemos, Teremos, portanto:
têm
que
descer
as
duas
próximas
casas!
5´90´49 1 4 3 190 Aqui, novamente, a grande questão! A partir de qual número ímpar nós reiniciaremos nossas subtrações? No lugar das unidades, é sempre ele: o número 1. Teremos: 5´90´49 1 4 3 190 1E acompanhando a unidade, no lado esquerdo, tomaremos o último número ímpar usado para subtrair, e somaremos a um. Quem foi este último ímpar que utilizamos? 5´90´49 1 4 3 190 1-
último número ímpar usado para subtrair!
Página 4 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 5 de 21
Daí, somaremos este número a um! Teremos: (3+1)=4 . Teremos, pois, o número 4 acompanhando a unidade no lado esquerdo. Ou seja, nossas subtrações reiniciarão a partir do número 41. Vejamos: 5´90´49 1 4 3 190 41-
último número ímpar usado para subtrair!
[(último número ímpar)+1] Teremos, portanto, que: 5´90´49 1 4 3 190 41149 Quem é o próximo ímpar? É o 43. Teremos: 5´90´49 1 4 3 190 41149 43106 Quem é o próximo ímpar depois de 43? É o 45! Dá para subtrair por ele? Sim! Então, teremos: 5´90´49 1 4 3 190 41149 43106 4561 Página 5 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 6 de 21
Quem é o próximo ímpar? É o 47. É possível subtrair por ele? Sim! Em frente: 5´90´49 1 4 3 190 41149 43106 4561 4714
Quem é o próximo ímpar? É o 49. Dá pra subtrair? NÃO! Logo, como a resposta é “NÃO”, nós pararemos, e contaremos quantas subtrações foram feitas desde que desceram as duas últimas casas! Quem foram as duas últimas casas que desceram? Foram os 90! E depois que desceram os 90, foram feitas exatamente quatro subtrações! Portanto, o número 4 passa a compor nosso resultado. Até aqui, temos o seguinte: 59049 = 24... O que fazemos agora? Descemos as duas próximas casas! Teremos: 5´90´49 1 4 3 190 41149 43106 4561 471449
Página 6 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 7 de 21
E agora? A partir de qual número ímpar retomaremos nossas subtrações? No lugar das unidades, já sabemos, sempre ela: a própria unidade! 5´90´49 1 4 3 190 41149 43106 4561 471449 1-
E acompanhando a unidade, no seu lado esquerdo, pegaremos o último ímpar usado para subtrair e o somaremos a um. Quem foi o último ímpar usado para subtrair? Foi o 47. Somando (47+1), chegamos a 48. Este valor ficará ao lado da unidade, de modo que reiniciaremos nossas subtrações, a partir do número 481. Vejamos: 5´90´49 1 4 3 190 41149 43106 4561 471449 481-
último ímpar usado para subtrair!
[(último ímpar)+1]
Página 7 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 8 de 21
Teremos: 5´90´49 1 4 3 190 41149 43106 4561 471449 481968 Quem é o próximo número ímpar? É o 483. Teremos: 5´90´49 1 4 3 190 41149 43106 4561 471449 481968 483485
Página 8 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 9 de 21
Quem é o próximo ímpar? É o 485. Podemos ainda subtrair? Sim! Teremos: 5´90´49 1 4 3 190 41149 43106 4561 471449 481968 483485 4850 Podemos continuar subtraindo? Não! Então paramos e contamos quantas subtrações foram feitas, depois que desceram as duas últimas casas. Neste caso, perguntamos: quantas subtrações fizemos depois que desceu o 49? A resposta é “três subtrações”! Logo, 3 passa a compor nosso resultado. Como o último resto foi igual a zero, dizemos que nossa raiz é exata! Daí, concluímos:
59049 = 243 Æ Resposta!
Exemplo 04) Quanto é
18 ?
Começaremos subtraindo pelo primeiro ímpar. Teremos: 18 1 – 17 Quem é o próximo ímpar? É o 3. Dá para subtrair? Sim. Teremos: 18 1 – 17 3 14 Página 9 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 10 de 21
Próximo ímpar: 5. Podemos subtrair? Sim. Em frente:
18 1 – 17 3 14 5 9 Próximo ímpar? É o 7. Podemos? Sim, podemos! Então, teremos: 18 1 17 3 14 5 9 7 2
– -
Próximo ímpar: 9. Dá para subtrair? NÃO! Então, paramos, e contamos as subtrações realizadas. Quantas foram? Foram 4. Logo, 4 inicia nossa resposta. Ou seja: 18 =4... Acontece que, aqui, pela primeira vez, nosso resto foi diferente de zero! De modo que a nossa raiz não é exata!! Para continuarmos nossas contas, já sabemos que teríamos que descer duas casas (não é assim?). Mas, não há mais ninguém para descer! E agora? Agora, passamos uma vírgula no nosso 4, ou seja: duas novas casas. Vejamos quais: 18 1 17 3 14 5 9 7 2
18 =4,... e descemos
– 00
É isso! As duas casas que vamos criar “quando não houver mais ninguém para descer” serão sempre “zero-zero”. Daí, temos agora que descobrir o número ímpar, a partir do qual iremos reiniciar nossas subtrações. No lugar das unidades, o número 1, sempre! Página 10 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 11 de 21
E quem foi o último ímpar usado para subtrair? Foi o 7. Somado a um, fica 8. Então, teremos o seguinte: 18 1 – 17 3 14 5 9 7 último ímpar usado para subtrair! 200 81 [(último ímpar)+1] Daí, teremos: 18 1 – 17 3 14 5 9 7 200 81119 Próximo ímpar? 83. Podemos? Sim! Teremos: 18 1 – 17 3 14 5 9 7 200 81 119 83 36 É possível continuar subtraindo do próximo número ímpar? Não! Então, paramos e contamos quantas subtrações foram efetuadas após a descida das duas últimas casas, que foram o “zero-zero”. Quantas? Duas! Então, o número 2 passa a compor nosso resultado! Teremos, por enquanto, que: 18 =4,2... Página 11 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 12 de 21
Aqui, verificamos que o resto ainda foi diferente de zero. Isso significa que, se quisermos, poderemos continuar nossas contas. Vai depender de com quantas casas decimais nós queremos trabalhar. A meu ver, duas casas decimais costumam nos fornecer uma aproximação já razoavelmente segura. Então, sigamos em busca da segunda casa decimal! A pergunta é: quem vai descer para continuarmos as subtrações? Ora, como não há mais ninguém para descer, “escorregaremos” aqui um “zero-zero”. Teremos: 18 1 – 17 3 14 5 9 7 200 81 119 83 36 00 A velha pergunta: a partir de qual número ímpar reiniciaremos nossas subtrações? No lugar da unidade, sempre o “1”. Ao lado esquerdo deste, colocaremos o último ímpar utilizado para subtrair somado a 1. Teremos: 18 1 – 17 3 14 5 9 7 200 81 119 83 último ímpar usado para subtrair! 3600 841 [(último ímpar)+1]
Página 12 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 13 de 21
Daí, teremos: 18 1 – 17 3 14 5 9 7 200 81 119 83 3600 841 2759 Prosseguindo! Quem é o próximo ímpar? É o 843. Podemos usá-lo? Sim! Teremos: 18 1 – 17 3 14 5 9 7 200 81 119 83 3600 841 2759 843 – 1916
Página 13 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 14 de 21
O próximo ímpar é 845. Teremos:
18 1 – 17 3 14 5 9 7 200 81 119 83 3600 841 2759 843 – 1916 845 – 1071 O próximo ímpar é o número 847. Podemos usá-lo? Sim! Então, teremos: 18 1 – 17 3 14 5 9 7 200 81 119 83 3600 841 2759 843 1916 845 1071 847 224
– – –
Página 14 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 15 de 21
E agora? Podemos prosseguir subtraindo do próximo número ímpar? A resposta é NÃO! Então paramos, e contamos quantas subtrações foram feitas desde a descida das últimas duas casas! Quantas foram? Foram quatro subtrações! Daí, o número 4 passa a fazer parte do nosso resultado! Chegamos, portanto, ao seguinte: 18 =4,24 Como ainda houve na nossa última subtração um resto diferente de zero, sabemos que ainda não chegamos a uma resposta exata. Ou seja, se quisermos, poderemos prosseguir com as subtrações, para conhecermos a resposta com mais casas decimais! Fica a gosto do freguês! Como disse, duas casas decimais já nos fornecem uma boa aproximação! Vejamos que (4,24)2=17,98, o que já bem próximo de 18! Alguém pode pensar que este método é demorado. Não é! Sobretudo quando se pega a prática!
EXEMPLO 05) Vamos fazer um último exemplo. No simulado da aula passada, precisamos calcular 156 . Estão lembrados? Vamos fazer essa conta! Começaremos trabalhando com o “1”. Teremos: 1´56 1 0 Fizemos apenas uma subtração e já paramos. Significa que o número 1 já compõe nosso resultado. Por enquanto, temos que: 156 =1... Descemos agora o 56 (duas próximas casas). E vamos reiniciar nossas subtrações. Teremos: 1´56 1 0 56 21 -
último ímpar usado para subtrair
[(último ímpar)+1] Teremos, portanto: 1´56 1 0 56 21 35
Página 15 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 16 de 21
Próximo ímpar? 23. Teremos: 1´56 1 0 56 21 35 23 – 12 Aqui não dá prosseguir. Portanto, paramos, e contamos quantas subtrações foram feitas após a descida do 56. Quantas? Duas. Teremos, por enquanto, que: 156 =12... Na seqüência, teremos que descer duas casas, tendo em vista que o último resto foi diferente de zero, ou seja, não estamos com um raiz exata! Quem desceremos? A dupla “zero-zero”. Não podemos esquecer que teremos de colocar uma vírgula no nosso resultado! Daí, ficaremos que 156 =12,... E reiniciaremos nossas subtrações a partir de quem? No lugar das unidades, sempre ele: o “1”. Ao lado dele (na esquerda), poremos o último ímpar usado para subtrair, somado a 1. Ficaremos, portanto, assim: 1´56 1 0 56 21 35 23 – 1200 241 –
último ímpar
[(último ímpar)+1] Teremos: 1´56 1 0 56 21 35 23 – 1200 241 – 959
Página 16 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 17 de 21
Próximo ímpar: 243. Teremos: 1´56 1 0 56 21 35 23 – 1200 241 – 959 243 – 716 Próximo ímpar: 245. Teremos: 1´56 1 0 56 21 35 23 – 1200 241 – 959 243 – 716 245 – 471 Próximo ímpar: 247. Teremos, agora: 1´56 1 0 56 21 35 23 – 1200 241 – 959 243 – 716 245 – 471 247 – 224 Será que é possível continuar subtraindo pelo próximo ímpar? NÃO. Então, paramos e contamos quantas subtrações foram feitas depois que desceram as duas últimas casas (o “zero-zero”). Quantas? Quatro! Logo, 4 vai para o resultado! Daí, por enquanto, ficamos com: 156 =12,4...
Página 17 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 18 de 21
Se quisermos, podemos reiniciar as subtrações, a fim de encontrar novas casas decimais no resultado. Particularmente, gosto de encontrar sempre até a segunda casa decimal. Aqui vou deixar esse trabalho com vocês. Acho que já temos elementos suficientes para aplicar o método! Espero que tenham gostado. Aprendi este método com o Prof. Jonofon Sérates, em entrevista ocorrida há muitos anos, no programa do Jô Soares. Professor Jonofon é um matemático brasileiro dos mais renomados. É autor de diversos livros de matemática, e criador do MCL – Método Cuca Legal! Ele foi aluno do grande Malba Tahan (de “O Homem que Calculava”). Se não estou muito enganado, o professor Jonofon participou (não sei se continua) da banca elaboradora da ESAF. Eu, eterno insone, tive a sorte de assistir àquela entrevista, (deve ter sido lá pelos idos de 1997) e nunca esqueci essa aula. Bem, passemos agora ao nosso SIMULADO Nº04. Neste Ponto de apresentarei apenas as questões. As resoluções virão no seguinte!
hoje,
As regras são as mesmas: tente reservar um tempo (uma hora, mais ou menos) para fazer o exercício. Concentre-se. Faça de conta que está fazendo a prova! As questões que estou apresentando neste simulado, em sua maioria, são dúvidas que me foram apresentadas por vocês, meus alunos virtuais! Então, aproveito o ensejo para dar mais uma oportunidade a quem não conseguiu fazê-las de tentar novamente, e a quem não as conhece, de tentar resolvê-las pela primeira vez! Boa sorte a todos! (Vide próxima página!)
Página 18 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 19 de 21
SIMULADO 04
A tabela abaixo dá a distribuição de freqüências de um atributo X, para uma amostra de tamanho 66. As observações foram agrupadas em 9 classes de tamanho 5. Não existem observações coincidentes com os extremos das classes: Classes 4 9 14 19 24 29 34 39 44 -
(Xi) 9 14 19 24 29 34 39 44 49
fi 5 9 10 15 12 6 4 3 2
1. Sabe-se que o desvio-padrão da distribuição de X é aproximadamente 10. Assinale a opção que dá o valor do coeficiente de assimetria de Pearson que é baseado na média, na mediana e no desvio-padrão. a) -0,600 b) 0,191 c) 0,709 d) 0,603 e) -0,610 2. Uma estatística importante para o cálculo do coeficiente de assimetria de um conjunto de dados é o momento central de ordem 3, μ3. Assinale a opção correta: a) O valor de μ3 é obtido calculando-se a média dos desvios absolutos em relação à média. b) O valor de μ3 é obtido calculando-se a média dos quadrados dos desvios em relação à média. c) O valor de μ3 é obtido calculando-se a média dos desvios positivos em relação à média. d) O valor de μ3 é obtido subtraindo-se o cubo da média da massa de dados da média dos cubos das observações. e) O valor de μ3 é obtido calculando-se a média dos cubos dos desvios em relação à média.
Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 400 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa Página 19 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 20 de 21
acumulada. Não existem observações coincidentes com os extremos das classes. A próxima questão se refere a esses ensaios.
Classes 14,5 24,5 34,5 44,5 54,5 64,5 74,5 -
(Xi) 24,5 34,5 44,5 54,5 64,5 74,5 84,5
P(%) 5 10 20 50 70 95 100
3. Seja S o desvio-padrão do atributo X. Assinale a opção que corresponde à medida de assimetria de X como definida pelo segundo coeficiente de Pearson. a) Negativo e maior que menos um; b) Positivo e maior que um; c) Positivo e menor que um; d) Negativo e menor que menos um; f) Zero.
4. Considere a seguinte transformação Z=(X-75)/20. Para o atributo Z encontrou-se que ∑ Zi 2 . fi = 15,6250 , onde fi é a freqüência simples da classe i e Zi o ponto médio de classe transformado. Assinale a opção que dá o desvio-padrão amostral do atributo X. Sabe-se que a amostra possui 50 elementos e que a média desses elementos é 85. a) 5,00 b) 5,05 c) 5,10 d) 25,00 e) 25,51
5. Aplicando a transformação z = (x - 14)/4 aos pontos médios das classes (x) obteve-se o desvio padrão de 1,10 salários mínimos. Assinale a opção que corresponde ao desvio padrão dos salários não transformados. a) 6,20 b) 4,40 c) 5,00 d) 7,20 e) 3,90
É isso! As questões 3 e 4 foram extraídas de um simulado, vulgo “nacional”, que houve recentemente. Foram diversos os e-mails que recebi pedindo a resolução particularmente destas duas questões. As Página 20 de 21
ESTATÍSTICA
*** Ponto 31 –SIMULADO 04 ***
Pág. 21 de 21
questões 1 e 2 caíram na prova do AFPS-2002, que foi realizada pela ESAF, e a última questão foi do TJ-CE/2002, para o cargo de oficial de justiça. Boa sorte a todos! Um abraço forte e até a próxima, se Deus quiser!
Página 21 de 21
ESTATÍSTICA
*** Ponto 32 – RESOLUÇÃO DO SIMULADO 04 ***
Pág. 1 de 9
Olá, amigos! Hoje, começamos com as questões do “Simulado 4”, que ficou da última aula. Sem tempo a perder, vamos às resoluções! A tabela abaixo dá a distribuição de freqüências de um atributo X, para uma amostra de tamanho 66. As observações foram agrupadas em 9 classes de tamanho 5. Não existem observações coincidentes com os extremos das classes: Classes (Xi) fi 4 - 9 5 9 - 14 9 14 - 19 10 19 - 24 15 24 - 29 12 29 - 34 6 34 - 39 4 39 - 44 3 44 - 49 2 1. Sabe-se que o desvio-padrão da distribuição de X é aproximadamente 10. Assinale a opção que dá o valor do coeficiente de assimetria de Pearson que é baseado na média, na mediana e no desvio-padrão. a) -0,600 b) 0,191 c) 0,709 d) 0,603 e) -0,610 Sol.: Nesta questão, nossa primeira preocupação será a de descobrir o que está sendo solicitado. Ora, temos dois coeficientes de assimetria de Pearson! Aquele que se baseia nos valores da Média, Mediana e do DesvioPadrão é exatamente o Segundo Coeficiente de Pearson, que é dado pela 3 X − Md fórmula: A = S Sabendo disso, teremos agora que fazer todo o trabalho para calcular essas três medidas que compõem a nossa fórmula!
(
)
# Cálculo da Média: Trabalharemos pelo método da variável transformada! Perfazendo os passos já nossos conhecidos, teremos: Classes (Xi) fi PM (PM-6,5)=Yi Yi.fi 5 4 - 9 5 6,5 0 0 9 - 14 9 11,5 1 9 14 - 19 10 16,5 2 20 19 - 24 15 21,5 3 45 24 - 29 12 26,5 4 48 29 - 34 6 31,5 5 30 34 - 39 4 36,5 6 24 39 - 44 3 41,5 7 21 44 - 49 2 46,5 8 16 n=66 213 Página 1 de 9
ESTATÍSTICA
*** Ponto 32 – RESOLUÇÃO DO SIMULADO 04 ***
Pág. 2 de 9
Agora, calcularemos o valor da Média da variável transformada Yi, ∑ Yi. fi pela utilização da fórmula: Y = n Teremos que: Y =
∑ Yi. fi
Y=
Æ
n
213 66
Æ
Y = 3,227
Construindo os caminhos de transformação da variável, teremos: Caminho de Ida Æ
1º) (-6,5)
X =?
2º)(÷5)
Xi
Yi
(Variável Original)
Y = 3,227
(Variável Transformada)
←
3º)(+6,5)
1º)(x5)
Caminho de Volta
Daí, percorrendo o caminho de volta, e lembrando-nos das propriedades da média, que é influenciada pelas quatro operações, teremos que: 1o) 3,227 x 5 = 16,14 e 2o) 16,14 + 6,5 = 22,64 Æ Ou seja: X = 22,64 # Cálculo da Mediana: Para descobrirmos quem é a Classe Mediana, calcularemos o (n/2). Teremos que: (n/2)=33 Æ Nosso valor de referência! Partimos para as perguntas de praxe, comparando o (n/2) com os valores da fac! Teremos: Classes 4 9 14 19 24 29 34 39 44 -
(Xi) 9 14 19 24 29 34 39 44 49
fi 5 9 10 15 12 6 4 3 2 n=66
fac↓ 5 14 24 39 51 57 61 64 66
Æ Æ Æ Æ
5 é ≥ 33? NÃO! 14 é ≥ 33? NÃO! 24 é ≥ 33? NÃO! 39 é ≥ 33? SIM!
Daí, descobrimos que a Classe Mediana é a quarta classe: 24)! Agora, resta aplicarmos a fórmula da Mediana.
(19 –
Página 2 de 9
ESTATÍSTICA
*** Ponto 32 – RESOLUÇÃO DO SIMULADO 04 ***
Pág. 3 de 9
Teremos:
⎡⎛ n ⎞ ⎢ ⎜ 2 ⎟ − fac ANT Md = l inf + ⎢ ⎝ ⎠ fi ⎢ ⎢ ⎣ # Cálculo do Desvio Padrão:
⎤ ⎥ ⎥.h ⎥ ⎥ ⎦
Æ
⎡ 33 − 24 ⎤ Md = 19 + ⎢ .5 ⎣ 15 ⎥⎦
Æ
Md=22,0
Este não precisaremos calcular, porque já foi fornecido pelo enunciado!! Toda atenção é pouca, quando se trata de ler as questões! Alguém mais desatento talvez fosse perder um tempo incomensuravelmente valioso, calculando este Desvio Padrão, que já havia sido “dado de bandeja”! Segundo o enunciado, teremos: S=10,0 # Calculando o Segundo Coeficiente de Assimetria de Pearson: Aplicando a fórmula, teremos:
A=
(
3 X − Md S
)
Æ
A=
3(22,64 − 22 ) 10
Æ
Æ
A=0,191
Resposta!!
2. Uma estatística importante para o cálculo do coeficiente de assimetria de um conjunto de dados é o momento central de ordem 3, μ3. Assinale a opção correta: a) O valor de μ3 é obtido calculando-se a média dos desvios absolutos em relação à média. b) O valor de μ3 é obtido calculando-se a média dos quadrados dos desvios em relação à média. c) O valor de μ3 é obtido calculando-se a média dos desvios positivos em relação à média. d) O valor de μ3 é obtido subtraindo-se o cubo da média da massa de dados da média dos cubos das observações. e) O valor de μ3 é obtido calculando-se a média dos cubos dos desvios em relação à média. Sol.: Esta questão é meramente conceitual! Quer saber se o aluno conhece a fórmula do Terceiro Momento ou Momento de Terceira Ordem Centrado na Média Aritmética! Apenas isso! A fórmula do m3 (chamado de μ3 pelo enunciado!) é a seguinte:
∑ (Xi − X ) =
3
m3
n
Traduzindo a fórmula acima, vemos que o seu numerador representa “os desvios dos elementos Xi em relação à Média, elevados à terceira Página 3 de 9
ESTATÍSTICA
*** Ponto 32 – RESOLUÇÃO DO SIMULADO 04 ***
Pág. 4 de 91
potência”. Em outras palavras: o numerador é o cubo dos desvios em relação à média! O denominador é apenas o número de elementos do conjunto. Se estamos dividindo o somatório de um conjunto de elementos pelo seu número de elementos, estamos na verdade determinando a sua Média! Daí, o entendimento completo da fórmula do M3, será a seguinte: ”a média dos cubos dos desvios em relação à média”. Portanto: Opção E Æ Resposta!! Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 400 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. A próxima questão se refere a esses ensaios. Classes 14,5 24,5 34,5 44,5 54,5 64,5 74,5 -
(Xi) 24,5 34,5 44,5 54,5 64,5 74,5 84,5
P(%) 5 10 20 50 70 95 100
3. Seja S o desvio-padrão do atributo X. Assinale a opção que corresponde à medida de assimetria de X como definida pelo segundo coeficiente de Pearson. a) Negativo e maior que menos um; b) Positivo e maior que um; c) Positivo e menor que um; d) Negativo e menor que menos um; e) Zero. Sol.: Sabemos que antes de qualquer coisa, teremos que trabalhar as colunas de freqüências, para chegarmos à fi! É o que faremos agora: Classes 14,5 24,5 34,5 44,5 54,5 64,5 74,5 -
(Xi) 24,5 34,5 44,5 54,5 64,5 74,5 84,5
Fac 5% 10% 20% 50% 70% 95% 100%
Fi 5% 5% 10% 30% 20% 25% 5%
fi 20 20 40 120 80 100 20
Página 4 de 9
ESTATÍSTICA O
*** Ponto 32 – RESOLUÇÃO DO SIMULADO 04 ***
Pág. 5 de 91
Segundo Coeficiente de Pearson é determinado pela fórmula 3 X − Md , conforme havíamos visto na primeira questão! seguinte: A = S
(
)
Daí, calcularemos a Média e a Mediana deste conjunto! # Cálculo da Média: Usando o método da variável transformada, teremos: Classes (Xi) 14,5 24,5 34,5 44,5 54,5 64,5 74,5
-
24,5 34,5 44,5 54,5 64,5 74,5 84,5
fi
PM
20 20 40 120 80 100 20 n=400
19,5 29,5 39,5 49,5 59,5 69,5 79,5
(PM-19,5)=Yi 10 0 1 2 3 4 5 6
Yi.fi 0 20 80 360 320 500 120 1400
Após isso, acharemos o valor da média da variável transformada Yi. Da seguinte forma:
Y=
∑ Yi. fi n
Æ
Y=
1400 400
Æ
Y = 3,5
Desenhando os caminhos de transformação, teremos: Caminho de Ida 1º) (-19,5)
X =?
Æ
2º)(÷10)
Xi
Yi
(Variável Original)
3º)(+19,5)
Y = 3,5
(Variável Transformada)
←
1º)(x10)
Caminho de Volta
Daí, percorrendo o caminho de volta, e lembrando-nos das propriedades da média, que é influenciada pelas quatro operações, teremos que: 1o) 3,5 x 10 = 35,0 e 2o) 35,0 + 19,5 = 54,5 Æ Ou seja: X = 54,5 # Cálculo da Mediana: Vamos logo descobrir quem é a Classe Mediana! Página 5 de 9
ESTATÍSTICA
*** Ponto 32 – RESOLUÇÃO DO SIMULADO 04 ***
Pág. 6 de 9
Fazemos (n/2)=200, e comparamos esse valor (200) com os valores da fac! Teremos: Classes 14,5 24,5 34,5 44,5 54,5 64,5 74,5 -
(Xi) 24,5 34,5 44,5 54,5 64,5 74,5 84,5
fi 20 20 40 120 80 100 20 n=400
fac 20 40 80 200 280 380 400
Æ 20 é ≥ 200? NÃO! Æ 40 é ≥ 200? NÃO! Æ 80 é ≥ 200? NÃO! Æ 200 é ≥ 200? SIM! É o quê? É IGUAL!!! Logo: 2a REGRA DE OURO DA MEDIANA!!!
Olha que beleza!! Sem fazer mais nenhuma conta, já podemos afirmar que: Md=54,5 (=limite superior da classe correspondente!) Finalmente, aplicando a fórmula do Segundo Coeficiente de Pearson a este conjunto, verificamos que o numerador irá se anular! Vejamos:
A=
(
3 X − Md S
)
Æ A=
3(54,5 − 54,5) 0 Æ A= S S
Æ
A=0 (zero) Æ Resposta!
4. Considere a seguinte transformação Z=(X-75)/20. Para o atributo Z encontrou-se que ∑ Zi 2 . fi = 15,6250 , onde fi é a freqüência simples da classe i e Zi o ponto médio de classe transformado. Assinale a opção que dá o desvio-padrão amostral do atributo X. Sabe-se que a amostra possui 50 elementos e que a média desses elementos é 85. a) 5,00 b) 5,05 c) 5,10 d) 25,00 e) 25,51 Sol.: Uma questãozinha das boas! Aqui, temos que saber, e bem, trabalhar com a variável transformada! Comecemos construindo os caminhos de transformação das variáveis. Teremos: Caminho de Ida 1º) (-75)
X = 85
Æ
2º)(÷20)
Xi
Zi
(Variável Original)
3º)(+75)
∑ Zi
2
. fi = 15,65
(Variável Transformada)
←
1º)(x20)
Caminho de Volta
O enunciado pede que encontremos o valor do Desvio-Padrão Amostral da variável original Xi. Pelos dados fornecidos na questão, percebemos facilmente que a fórmula a ser empregada é a seguinte: Página 6 de 9
ESTATÍSTICA
*** Ponto 32 – RESOLUÇÃO DO SIMULADO 04 ***
SX =
Pág. 7 de 9
2 ( PM . fi ) ⎤ 1 ⎡ ∑ 2 ⎢ ∑ PM . fi − ⎥ n (n − 1) ⎢ ⎥⎦ ⎣
(
)
Observando a presença do “menos 1” no denominador (fora dos colchetes!) por conta do fator de correção de Bessel, presente no cálculo do desvio-padrão (e variância) amostral. Agora ficou fácil enxergar que teremos de calcular a Variância da variável transformada Zi para, em seguida, percorrermos o caminho de volta da transformação e chegarmos à resposta procurada! O cálculo do Desvio-Padrão de Zi será dado por:
SZ =
2 ( Zi. fi ) ⎤ 1 ⎡ ∑ 2 ⎥ ⎢ ∑ Zi . fi − n (n − 1) ⎢ ⎥⎦ ⎣
(
)
Ora, desta fórmula já conhecemos o valor do n (=50) e da parcela ∑ Zi 2 . fi = 15,6250 , ambos fornecidos pelo enunciado. Resta encontrarmos o quê? Apenas o valor de
(∑ Zi. fi )
2
e só!
Aqui vale a atenção do aluno! O enunciado forneceu mais algum dado adicional? SIM! Forneceu a Média da variável Xi! Ora, se quiséssemos saber a Média da variável transformada Zi, como faríamos para calculá-la?
Z=
Sabemos que a fórmula da Média é a seguinte: Percebamos
que,
para
chegarmos
ao
valor
do
∑ Zi. fi n
∑ Zi. fi ,
numerador
teríamos que conhecer o n e o Z . Aquele já sabemos quem é; esse ainda não! Mas podemos chegar ao valor do Z , trabalhando com a variável transformada! Teremos apenas que percorrer o Caminho de Ida da transformação, e teremos o seguinte: Partindo do X =85,0 Æ 1o) 85-75=10 e 2o) 10:20=0,5 Æ Z =0,5 Agora, podemos fazer o seguinte:
Z=
∑ Zi. fi n
Æ
∑ Zi. fi = Z .n
Æ
∑ Zi. fi = 0,5 x50
Æ
∑ Zi. fi = 25,00
Daí, retornaremos à fórmula do Sz, e chegaremos ao seguinte:
Página 7 de 9
ESTATÍSTICA
SZ =
*** Ponto 32 – RESOLUÇÃO DO SIMULADO 04 ***
2 ( Zi. fi ) ⎤ 1 ⎡ ∑ 2 ⎢ ∑ Zi . fi − ⎥ Æ SZ = (n − 1) ⎢ n ⎥⎦ ⎣
(
)
Pág. 8 de 9
2 ( 25) ⎤ 1 ⎡ ⎢(15,6250 ) − ⎥ Æ Sz=0,2525 50 ⎦ 49 ⎣
Finalmente, agora só teremos que percorrer o caminho de volta da transformação, para chegarmos ao Desvio-Padrão do X! Teremos: Partindo do Sz=0,2525 Æ 1o)0,2525x20=5,05 Æ 2o)A soma não influencia o valor do Desvio-Padrão! Æ Logo: Sx=5,05 Æ Resposta!
5. Aplicando a transformação z = (x - 14)/4 aos pontos médios das classes (x) obteve-se o desvio padrão de 1,10 salários mínimos. Assinale a opção que corresponde ao desvio padrão dos salários não transformados. a) 6,20 b) 4,40 c) 5,00 d) 7,20 e) 3,90 Sol.: Essa aqui é bem mais simples! Basta construirmos os caminhos de transformação e nos lembrarmos das propriedades do desvio padrão! Teremos que:
Caminho de Ida 1º) (-14)
Sx = ?
Æ
2º)(÷4)
Xi
Zi
(Variável Original)
3º)(+14)
Sz = 1,10
(Variável Transformada)
←
1º)(x4)
Caminho de Volta
Daí, percorrendo o Caminho de Volta, faremos: 1o)1,10x4=4,40
e
2o)Soma não altera o desvio-padrão!
Chegamos, finalmente a: Sx=4,40 Æ
Resposta!!
Pronto, amigos! Lá se foi mais esse simulado. Espero que estejam se saindo bem. Espero, mais ainda, que estejam aprendendo com eventuais erros cometidos! Na seqüência, deixo com vocês o “SIMULADO 5”. Este é bem diferente. Apenas teórico! Contém assertivas extraídas de provas anteriores do
Página 8 de 9
AFRF, e nosso trabalho será apenas dizer se são verdadeiras (V) ou falsas (F).
ESTATÍSTICA
*** Ponto 32 – RESOLUÇÃO DO SIMULADO 04 ***
Pág. 9 de 9
Na verdade, estou aproveitando um e-mail de um aluno virtual, o Edson Luiz, um paraense que anda batalhando na capital maranhense. Ele me mandou esta relação e achei-a apropriada a se tornar um pequeno simulado! Obrigado ao Edson, um forte abraço! Dedico esta aula de hoje aos meus muitos e bons amigos – os Técnicos da Receita Federal de todo o País – dos quais recebo e-mails quase que diariamente. É uma categoria da qual me orgulho profundamente em dizer que já fiz parte, e que admiro sinceramente. Um forte abraço aos colegas TRF! Sem mais delongas, deixo-os com o nosso SIMULADO 05. Até a próxima!
SIMULADO 05 1)
A média aritmética é uma medida de posição, cuja representatividade independe da variação da variável, mas depende do grau de assimetria da distribuição de freqüências.
2)
Em qualquer distribuição de freqüências, a média aritmética é mais representativa do que a média harmônica.
3)
A soma dos quadrados dos resíduos em relação à média aritmética é nula.
4)
A moda, a mediana e a média aritmética são medidas de posição com valores expressos em reais que pertencem ao domínio da variável a que se referem.
5)
Toda medida de posição ou de assimetria é um momento de uma variável aleatória.
6)
O coeficiente de assimetria, em qualquer distribuição de freqüência, é menor do que o coeficiente de curtose.
7)
O coeficiente de assimetria, em uma distribuição de freqüência, é um real no intervalo [-3,3].
8)
O coeficiente de curtose, em uma distribuição de freqüência, é igual a três vezes o quadrado da variância da distribuição.
9)
O coeficiente de curtose distribuição normal padrão.
é
igual
a
três
em
uma
10) Em uma distribuição simétrica, o coeficiente de curtose é nulo.
Boa sorte! Página 9 de 9
ESTATÍSTICA
*** Ponto 33 – NÚMEROS ÍNDICES – Parte 01 ***
Pág. 1 de 23
Números Índices – Parte 01 Olá, amigos! Começaremos esta aula de hoje comentando o “Simulado 05”, que ficou da última aula. Depois, iniciaremos as explicações acerca dos Números Índices – último tópico do programa do AFRF. Sem mais demora... Resolução do Simulado 05 1)
A média aritmética é uma medida de posição, cuja representatividade independe da variação da variável, mas depende do grau de assimetria da distribuição de freqüências. Sol.: Falso! Esta assertiva já se torna falsa quando afirma que a média aritmética não depende da variação da variável. Ora, sabemos perfeitamente que se apenas um dos elementos do conjunto for alterado, isso já irá – necessariamente – modificar a média. 2)
Em qualquer distribuição de freqüências, a média aritmética é mais representativa do que a média harmônica. Sol.: Falso! Quero desculpar-me com vocês por ter colocado – indevidamente – este item no simulado. Por uma razão muito simples: ainda não ensinei nada sobre média harmônica. Mas, para não dar viagem totalmente perdida, vale ressaltar sobre o cuidado extremo que devemos ter com assertivas que tragam palavras do tipo: “qualquer”, “sempre”, “nunca”, “jamais”, “necessariamente”, “obrigatoriamente”, e outras do gênero! São palavras perigosíssimas, uma vez que excluem a possibilidade de haver exceções, na situação a ser analisada. Neste nosso caso, por exemplo: a palavra “qualquer” está amarrando o enunciado. Se houver ao menos uma distribuição de freqüências para a qual a média harmônica seja mais representativa que a média aritmética, o item já se torna falso! Aproveitando o ensejo, vamos aprender como se calcula a Média Harmônica para um conjunto de elementos: Æ Média Harmônica para o rol! É dado por:
Xh =
n 1
∑ Xi
Exemplo: Para o conjunto {1,2,3,4}, calcular a média harmônica. Teremos:
Xh =
n 1
∑ Xi
Æ
Xh =
4 1 1 1 1 + + + 1 2 3 4
Página 1 de 23
ESTATÍSTICA *** Ponto 33 – NÚMEROS ÍNDICES – Parte 01 *** Pág. 2 de 23 Aí, é só tirar o mmc do denominador, e concluir as contas! Æ Média Harmônica para Dados Tabulados: É dada por: n Xh = fi ∑ Xi Observemos que aqui, mais uma vez, ocorre aquela transição com a qual já estamos acostumados! Só que o fi vai surgir multiplicando no “numerador do denominador”! Uma dica muito útil para memorizarmos o local onde o fi surgirá na fórmula dos dados tabulados é essa: lembraremos que o fi estará sempre onde também estiver o sinal do somatório (Σ)! Senão, vejamos:
Média Aritmética para o rol: X =
∑ Xi n
Média Aritmética p/ dados tabulados: X = Outro exemplo:
∑ Xi. fi n
∑ (Xi − X ) =
2
Variância para o rol: S
2
n
∑ (Xi − X ) . fi = 2
Variância p/ dados tabulados: S 2
n Æ Média Harmônica para Distribuição de Freqüências: Essa é fácil! Repetiremos a fórmula dos dados tabulados, lembrando-nos de trocar o Xi (elemento individualizado) por PM (ponto médio)! Apenas isso. Teremos: Xh =
n fi
∑ PM
3) A soma dos quadrados dos resíduos em relação à média aritmética é nula. Sol.: Falso! Este item versou sobre uma das propriedades da média aritmética, só que maneira equivocada! Na verdade, há duas propriedades da média que são muito parecidas, muito próximas uma
Página 2 de 23
ESTATÍSTICA
*** Ponto 33 – NÚMEROS ÍNDICES – Parte 01 ***
Pág. 3 de 23
a outra, quase irmãs. Os enunciados destas propriedades são os seguintes: Æ A soma dos desvios dos elementos de um conjunto em relação à média aritmética é igual a zero! Quer dizer o quê? Tomemos um exemplo: Seja o conjunto: {1, 2, 3, 4, 5}, cuja média é X = 3 . Se construirmos agora o conjunto dos desvios, ou seja, da diferença entre cada elemento Xi e a média X , teremos o seguinte: Xi- X ={(1-3), (2-3), (3-3), (4-3), (5-3)} Daí: Xi- X ={-2, -1, 0, 1, 2} Fazendo o somatório deste conjunto, chegamos ao seguinte: ∑(Xi- X )= 0 E isto é exatamente a tradução da nossa primeira propriedade! Vamos à segunda: Æ A soma dos quadrados dos desvios dos elementos de um conjunto em relação à média aritmética é um valor mínimo! O que quer dizer isso? Vejamos com um exemplo! Consideremos o mesmo conjunto do exemplo anterior. Encontramos para ele que: Xi- X ={-2, -1, 0, 1, 2} Æ Este é o conjunto dos desvios em relação à média! Se construirmos agora teremos o seguinte:
o
conjunto
dos
quadrados
dos
desvios,
(Xi- X )2 ={(-2)2, (-1)2, (0)2, (1)2, (2)2} = {4, 1, 0, 1, 4} Fazendo o somatório deste último conjunto, acharemos que: Σ(Xi- X )2 ={4+1+0+1+4}=10 Æ Este “10” é um valor mínimo! Isso significa dizer que, se construirmos, a partir do conjunto original, um outro conjunto de desvios (ou diferenças), só que não mais em relação à média, mas em relação a uma constante qualquer e, após isso, concluirmos o mesmo procedimento feito acima, acharemos um resultado final maior que 10! Senão, vejamos:
Página 3 de 23
ESTATÍSTICA
*** Ponto 33 – NÚMEROS ÍNDICES – Parte 01 ***
Pág. 4 de 23
Consideremos a constante k=2. Observemos que a média do conjunto é 3, diferente da constante k, portanto! Construamos o conjunto dos desvios relação à constante k. Teremos:
dos
elementos
Xi
do
conjunto
em
Conjunto Original: {1, 2, 3, 4, 5} Conjunto dos desvios em relação a K: (Xi-k)={(1-2),(2-2),(3-2),(4-2),(5-2)} = {-1, 0, 1, 2, 3} Agora, elevemos este conjunto ao quadrado. Teremos: (Xi-k)2 = {(-1)2,(0)2,(1)2,(2)2,(3)2}={1, 0, 1, 4, 9} Finalmente, somando este conjunto, teremos: ∑(Xi-k)2 = 15 (>10!!) Æ Ou seja, “10 é o mínimo!” Voltando à nossa questão, percebamos que o enunciado misturou as duas propriedades, tornando a assertiva falsa! 4)
A moda, a mediana e a média aritmética são medidas de posição com valores expressos em reais que pertencem ao domínio da variável a que se referem. Sol.: Falso! Aqui precisaríamos saber apenas que o domínio da variável significa o grupo de todos os elementos do conjunto. Se temos o conjunto: {1, 2, 3, 4, 5}, então o domínio deste conjunto serão os próprios elementos 1, 2, 3, 4 e 5. Sabemos, perfeitamente, que é inteiramente possível encontrarmos, por exemplo, uma mediana de um conjunto que não seja um de seus elementos. Consideremos o conjunto {1, 2, 3, 4}. Quem é a mediana? Espero que estejam todos bem lembrados de como se determina a mediana para um rol! Estão? Ainda bem! Neste caso, nossa mediana é Md=2,5. E podemos ver que 2,5 não é elemento do conjunto, logo, não pertence ao seu domínio! Com a média, sabemos que pode ocorrer o mesmo. Tomando o mesmo conjunto acima, qual seria a média? Média=(1+2+3+4)/4=10/4=2,5 , que também não pertence ao domínio!
5) Toda medida de posição ou de assimetria é um momento de uma variável aleatória. Sol.: Falso! Quando estudamos momentos estatísticos, vimos que há dois tipos de momentos que se identificam com medidas outras estudadas por nós! Estão lembrados de quais seriam essas medidas?
Página 4 de 23
ESTATÍSTICA
*** Ponto 33 – NÚMEROS ÍNDICES – Parte 01 ***
Pág. 5 de 23
Bem! O momento simples de primeira ordem confunde-se com a média de um conjunto; e o momento de segunda ordem, centrado na média aritmética confunde-se com a variância de um conjunto! Vimos ainda que há uma forma de se calcular a assimetria que se utiliza do cálculo do terceiro momento centrado na média aritmética. Só isso! Então, não será toda medida de posição ou de assimetria que será um momento! 6) O coeficiente de assimetria, em qualquer distribuição de freqüência, é menor do que o coeficiente de curtose. Sol.: Falso! Sabemos que não há qualquer relação entre os valores dos coeficientes de assimetria e de curtose de um conjunto. São medidas que expressam características distintas de uma curva de freqüências. Vale ressaltar, ainda, a presença da palavra “qualquer” nesta assertiva! 7) O coeficiente de assimetria, em uma distribuição de freqüência, é um real no intervalo [-3,3]. Sol.: Falso! Esta assertiva merece uma análise mais precisa. Como sabemos, há quatro formas diferentes de se calcular a assimetria de um conjunto, quais sejam: Æ primeiro coeficiente de assimetria de Pearson; Æ segundo coeficiente de assimetria de Pearson; Æ coeficiente quartílico de assimetria; Æ índice momento de assimetria. O enunciado somente estaria correto se tivesse especificado esse coeficiente de assimetria como sendo o segundo de Pearson! Ou seja, para o segundo coeficiente de assimetria de Pearson, esta medida poderia assumir valores variando entre -3 e +3. Já no tocante aos demais índices de assimetria isso não ocorre! Para o coeficiente quartílico, por exemplo, a assimetria varia no intervalo entre -1 e +1. Vamos aproveitar o ensejo, e relembrar as quatro fórmulas, referentes às distintas maneiras de se calcular a assimetria: Æ primeiro coeficiente de assimetria de Pearson: X − Mo S Æ segundo coeficiente de assimetria de Pearson: A=
(
)
3 X − Md S Æ coeficiente quartílico de assimetria: A=
Página 5 de 23
ESTATÍSTICA
*** Ponto 33 – NÚMEROS ÍNDICES – Parte 01 *** A=
Q3 + Q1 − 2Md Q3 − Q1
ou
A=
Pág. 6 de 23
Q3 + Q1 − 2Q 2 Q3 − Q1
(Lembremos que a Mediana é sinônimo de Segundo Quartil!) Æ índice momento de assimetria: m A = 43 S 8) O coeficiente de curtose, em uma distribuição de freqüência, é igual a três vezes o quadrado da variância da distribuição. Sol.: Falso! A questão está perguntando, na linguagem estatística se: C = 3.S2 ??? Ora, basta nos lembrarmos da fórmula de curtose que envolve a variância! É o índice momento de curtose, ou, como conhecemos, a “fórmula do 4”, dada por:
C=
m4 S4
Onde, m4 é o momento de quarta ordem centrado na média aritmética, e S4 é o quadrado da variância. Inteiramente diferente do que foi proposto no enunciado! 9) O coeficiente de curtose é igual a três em uma distribuição normal padrão. Sol.: Verdadeiro! Aprendemos que há duas formas de se calcular a curtose de um conjunto. E que, para cada uma dessas formas, há uma maneira diferente de se interpretar o resultado! As duas formas de calcular curtose de um conjunto são: pelo índice momento de curtose, e pelo índice percentílico. Neste último, temos que: C=
(Q3 − Q1) 2(D9 − D1)
E o resultado é interpretado, tendo como padrão o valor 0,263! Vejamos: Se C0,263 Æ distribuição Platicúrtica. Já o índice momento de curtose é dada por: m C = 44 S
Página 6 de 23
ESTATÍSTICA
*** Ponto 33 – NÚMEROS ÍNDICES – Parte 01 ***
Pág. 7 de 23
E interpretado da seguinte forma: Se C>3 Æ distribuição leptocúrtica; Se C=3 Æ distribuição mesocúrtica; Se C
View more...
Comments