PDF Estatistica WeberCampos

July 27, 2018 | Author: Adalberto Campo | Category: Histogram, Statistics, Probability Distribution, Time, Data
Share Embed Donate


Short Description

Download PDF Estatistica WeberCampos...

Description

PC/DF ESTATÍSTICA Módulo 01: Conceitos Iniciais Módulo 02: Distribuição de Frequências Frequências Módulo 03: Gráficos Estatísticos Módulo 04: Medidas de Posição Módulo 05: Medidas de Dispersão Módulo 06: Diagrama de Caixa Módulo 07: Amostragem

Prof. Weber Campos ([email protected])

2012 Copyright. Curso Agora eu Passo - Todos os direitos reservados ao autor.

Estatística MÓDULO 01: CONCEITOS INICIAIS 1. Estatística: É um ramo da Matemática Aplicada, uma metodologia, uma técnica científica, adotada para se trabalhar com dados, ou seja, com elementos de pesquisa . Esta metodologia, este método, consiste em uma série de etapas, iniciando pela coleta  das informações (dos dados) que, após coletadas, passarão por uma organização e apresentação. Chegamos, daí, a uma fase complementar, na qual se dará a análise  daqueles dados (já organizados e descritos). Ora, esta análise dos dados coletados funcionará como um meio, pelo qual chegaremos a uma conclusão. Esta, por sua vez, ensejará uma tomada de decisão. A Estatística não é meramente coletar dados de pesquisa para dispô-los numa tabela. O alcance da Estatística é maior: os elementos servirão a uma análise, porque, ao final, queremos chegar a uma conclusão. Existe uma decisão a ser tomada, e o será com base na conclusão a qual a análise dos dados nos conduzir. Não há um só medicamento vendido nas farmácias que não tenha sido submetido a rigorosos controles estatísticos. Antes de virar “remédio”, aquela droga foi testada um  zilhão de vezes. Primeiro em animais e depois em pessoas. E foram anotados os efeitos colaterais causados pela droga, em cada uma das vezes que elas foram tomadas pelos pacientes. Esses dados foram analisados, para gerar uma conclusão. Aquela substância só se transforma em medicamento e chega às prateleiras se a conclusão for satisfatória e os riscos estiverem dentro de um padrão aceitável. 1.1. Estatística Descritiva ou Dedutiva: É aquela encarregada dos primeiros passos do processo estatístico, quais sejam, a coleta, a

organização e a descrição (ou apresentação) dos dados.

Estas três etapas iniciais: coleta, organização e descrição, podem ser resumidas em uma única palavra: síntese  dos dados. Portanto, se a questão de prova perguntar se a estatística descritiva é responsável pela síntese dos dados, isto estará correto. 1.2. Estatística Indutiva ou Inferencial: É a responsável pelas etapas finais do processo estatístico: a análise e a interpretação dos dados que culminará na tomada de decisão. 2. População: Também chamada de Conjunto Universo . É aquele conjunto do qual desejamos extrair a informação, e cujos elementos têm, pelo menos, uma característica comum, a qual está inserida no contexto daquilo que desejamos analisar. 3. Censo: É uma das formas de se processar um estudo estatístico. Suponhamos que uma colégio tenha precisamente duzentos estudantes. Se, em nossa pesquisa, resolvermos consultar todos os alunos, ou seja, todos os elementos da população, fazendo o questionamento a cada um deles, sem exceção, estaremos realizando um censo. Ou seja, o censo é o tipo de estudo estatístico que abrange todos os elementos da população. O exemplo clássico é o censo demográfico, que o IBGE realiza no país a cada dez anos, e em que pretensamente são consultados todos os lares brasileiros.

Prof. Weber Campos

2

Estatística MÓDULO 01: CONCEITOS INICIAIS 1. Estatística: É um ramo da Matemática Aplicada, uma metodologia, uma técnica científica, adotada para se trabalhar com dados, ou seja, com elementos de pesquisa . Esta metodologia, este método, consiste em uma série de etapas, iniciando pela coleta  das informações (dos dados) que, após coletadas, passarão por uma organização e apresentação. Chegamos, daí, a uma fase complementar, na qual se dará a análise  daqueles dados (já organizados e descritos). Ora, esta análise dos dados coletados funcionará como um meio, pelo qual chegaremos a uma conclusão. Esta, por sua vez, ensejará uma tomada de decisão. A Estatística não é meramente coletar dados de pesquisa para dispô-los numa tabela. O alcance da Estatística é maior: os elementos servirão a uma análise, porque, ao final, queremos chegar a uma conclusão. Existe uma decisão a ser tomada, e o será com base na conclusão a qual a análise dos dados nos conduzir. Não há um só medicamento vendido nas farmácias que não tenha sido submetido a rigorosos controles estatísticos. Antes de virar “remédio”, aquela droga foi testada um  zilhão de vezes. Primeiro em animais e depois em pessoas. E foram anotados os efeitos colaterais causados pela droga, em cada uma das vezes que elas foram tomadas pelos pacientes. Esses dados foram analisados, para gerar uma conclusão. Aquela substância só se transforma em medicamento e chega às prateleiras se a conclusão for satisfatória e os riscos estiverem dentro de um padrão aceitável. 1.1. Estatística Descritiva ou Dedutiva: É aquela encarregada dos primeiros passos do processo estatístico, quais sejam, a coleta, a

organização e a descrição (ou apresentação) dos dados.

Estas três etapas iniciais: coleta, organização e descrição, podem ser resumidas em uma única palavra: síntese  dos dados. Portanto, se a questão de prova perguntar se a estatística descritiva é responsável pela síntese dos dados, isto estará correto. 1.2. Estatística Indutiva ou Inferencial: É a responsável pelas etapas finais do processo estatístico: a análise e a interpretação dos dados que culminará na tomada de decisão. 2. População: Também chamada de Conjunto Universo . É aquele conjunto do qual desejamos extrair a informação, e cujos elementos têm, pelo menos, uma característica comum, a qual está inserida no contexto daquilo que desejamos analisar. 3. Censo: É uma das formas de se processar um estudo estatístico. Suponhamos que uma colégio tenha precisamente duzentos estudantes. Se, em nossa pesquisa, resolvermos consultar todos os alunos, ou seja, todos os elementos da população, fazendo o questionamento a cada um deles, sem exceção, estaremos realizando um censo. Ou seja, o censo é o tipo de estudo estatístico que abrange todos os elementos da população. O exemplo clássico é o censo demográfico, que o IBGE realiza no país a cada dez anos, e em que pretensamente são consultados todos os lares brasileiros.

Prof. Weber Campos

2

Estatística 4.  Amostragem: É o tipo de estudo estatístico que se contrapõe ao censo. Como o próprio nome sugere, aqui será utilizada uma amostra, ou seja, uma parte, um subconjunto da população, que terá o condão de representar o conjunto inteiro. Ou seja, para que se possa considerar uma parte da população como uma amostra, é preciso que esta parte seja representativa do todo. Se a questão de prova afirmar apenas que amostra é uma parte da população, e somente isso, então estará errada. É preciso frisar a característica essencial de uma amostra, que é a representatividade. representatividade. Assim, estaria correta a assertiva: amostra é uma parte da população (um subconjunto), a partir da qual se pode auferir conclusões acerca desta mesma população . Observamos, assim, o caráter de representatividade da amostra. Uma pergunta frequente em sala de aula versa sobre o número mínimo de elementos de um subconjunto da população, suficiente para caracterizá-lo como uma amostra, ou seja, o número de elementos capaz de conferir ao subconjunto aquela representatividade. Existem fórmulas capazes de determinar o número mínimo de elementos de uma amostra (para que assim seja considerada), conforme se deseje uma maior ou menor precisão nos resultados. Não existe uma porcentagem fixa do total para se obter a amostra! 5.  Algumas Razões para a Adoção da Amostragem: São todas elas intuitivas: Quando a população é muito grande . Ora, há situações em que a população é a) incomensuravelmente extensa, de forma que se torna inviável o uso do censo e, por outro lado, extremamente conveniente a adoção de uma amostra. Por exemplo, uma pesquisa eleitoral, realizada em um município com milhões de eleitores: Seria quase impossível entrevistar cada eleitor! Coleta-se, pois, uma amostra. Quando se deseja o resultado da pesquisa em curto espaço de tempo . Vale o mesmo b) exemplo da pesquisa eleitoral. Às vezes, se deseja atualizar o resultado destas pesquisas de dois em dois dias, ou mesmo diariamente. Não seria possível se entrevistar milhões de eleitores no intervalo de poucas horas. Quando se deseja gastar menos . Ora, o dispêndio de recursos financeiros é c) consideravelmente menor se o número de elementos da pesquisa também o for. Sai mais barato entrevistar algumas centenas ou mesmo milhares de pessoas, que entrevistar alguns milhões. Quando o objeto da pesquisa é destrutivo . Suponhamos que uma montadora de veículos d) quer testar a segurança do air-bag  de um determinado modelo. O que ela faz? Pega alguns exemplares daquele carro e os submete a colisões fortíssimas contra muros de concreto, filmando tudo em câmera lenta. O carro fica destruído para que a experiência seja realizada. Não faria sentido realizar uma pesquisa como esta para toda a frota produzida.

6. Variável: É o objeto da pesquisa. É aquilo que estamos investigando. Por exemplo, se perguntamos quantos livros alguém lê por ano, esta é a variável: número de livros lidos por ano ; se a pesquisa questiona qual a altura de um grupo de pessoas, então altura  será a variável; da mesma forma, podemos pesquisar uma infinidade de outras variáveis: nível de instrução, religião, cor dos olhos, peso, estado civil, nacionalidade, número de pessoas que moram na sua casa , etc. O objeto da pesquisa, do estudo estatístico, será, pois, a variável.

Prof. Weber Campos

3

Estatística 6.1. Classificação das Variáveis: Há, inicialmente, uma divisão principal para as variáveis estatísticas, que consiste em considerá-las como: Variáveis Quantitativas ou Variáveis Qualitativas. Esta divisão é de facílima compreensão: será quantitativa a variável para a qual se possa atribuir um valor numérico. Ou seja, se a resposta fornecida à pesquisa estiver expressa por um número, então a variável é quantitativa. Por exemplo: Quantos livros você lê por ano?   A resposta é um número? Então, variável quantitativa. Quantas pessoas moram em sua casa?  A  A resposta é um número? Então, novamente, variável quantitativa. Agora, se a pergunta é “qual a sua cor preferida?”, logicamente a resposta não será um número, daí estaremos tratando de uma Variável Qualitativa, ou seja, aquela

para a qual não se atribui a tribui um valor numérico.

Dentro desta classificação inicial, há uma outra: - Variáveis Quantitativas podem ser: discretas ou contínuas. - Variáveis Qualitativas podem ser: nominais ou ordinais. Variável Discreta  é a variável quantitativa que não pode assumir qualquer valor, dentro de um intervalo de resultados possíveis. Por exemplo, se eu pergunto quantos irmãos você tem, a resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8 irmãos”, ou seja, a resposta não

poderia assumir todos os valores de um intervalo. Ou ainda, as respostas possíveis seriam sempre

descontínuas.

Usando ainda outras palavras, se a variável quantitativa é discreta, existirá um vácuo, uma descontinuidade, entre um resultado possível e outro. A variável discreta em geral é aquela obtida por meio de uma contagem, ou seja: a variável discreta nós contamos!

Exemplos: Quantas pessoas moram na sua casa? Quantos livros você tem em sua estante? Quantos carros importados você tem na sua garagem?  Se,  Se, para responder à pergunta, recorremos a uma contagem, então estamos diante de uma variável quantitativa discreta (ou descontínua). Por sua vez, a Variável Contínua é aquela que pode assumir qualquer valor dentro de um intervalo de resultados possíveis. Se eu pergunto quantos quilos você pesa, a resposta pode ser 65,357kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta pode ser 27,35 C. Para facilitar a memorização, lembraremos que a variável contínua em geral pode ser obtida por uma medição, ou seja, a variável contínua nós medimos!  Exemplos: peso, altura, duração de tempo para resolução de uma prova, pressão, temperatura , etc. Já no tocante às variáveis qualitativas, serão consideradas ordinais  sempre que pudermos estabelecer uma ordem, uma hierarquia, entre as respostas obtidas. Por exemplo, se vamos a um quartel, pesquisar a patente militar dos que ali trabalham, para saber quantos são soldados, ou sargentos, ou tenentes, ou capitães , etc, a resposta à pergunta “qual a sua patente?” não será , obviamente, um valor numérico; logo, estaremos com uma variável qualitativa. Será que é possível determinar uma hierarquia dentre estas respostas? Claro que sim! Logo, estamos diante de uma variável qualitativa ordinal. Outro exemplo: se o prefeito de determinada cidade nos contrata para fazermos um estudo estatístico acerca do nível de instrução dos moradores daquele lugar, e as respostas possíveis a esta pesquisa são algo como “sem instrução escolar”, “nível fundamental incompleto”, “nível fundamental completo”, “nível médio incompleto”, “nível médio completo”, “nível superior” , etc. Ora, tais respostas não são números, logo, variável qualitativa. Podemos estabelecer

uma hierarquia entre estas respostas? Sim! Logo: variável ordinal.

Por outro lado, se a variável qualitativa é de tal forma que não possamos verificar uma ordem, uma hierarquia, então diremos que a variável é nominal . Por exemplo, uma pesquisa para saber a religião de um grupo de pessoas. As respostas não são numéricas, logo a variável é qualitativa; e entre estas respostas não se pode estabelecer qualquer hierarquia, daí, religião  praticada é uma variável qualitativa nominal. Outro exemplo: a sua cor preferida. Não é número, e não há hierarquia, logo, variável qualitativa nominal. Por exclusão, e de uma forma simplificada, podemos apenas dizer que variável qualitativa nominal é toda aquela que não é ordinal. Prof. Weber Campos

4

Estatística 7. Dados Brutos: Como o próprio nome indica, são os dados obtidos da pesquisa, dispostos da mesma forma como foram coletados, sem que tenha sido realizado com eles qualquer ordenamento. Em outras palavras, podemos dizer que são os resultados das variáveis dispostos aleatoriamente, isto é, sem nenhuma ordem de grandeza crescente ou decrescente. 8. Rol: Vimos que uma das etapas do processo estatístico consiste em organizar os dados. Inclusive,  já sabemos que organizar os dados é um dos passos da Estatística Descritiva ou Dedutiva . Daí, uma forma de organizar os dados brutos consiste em dispor estes dados em uma ordem. Daí, rol   nada mais é que a ordenação dos dados brutos, de um modo crescente ou decrescente. 9. Séries Estatísticas: São nada mais que tabelas, as quais expressam o resultado de um estudo estatístico. Se, olhando para esta tabela, pudermos identificar três elementos, quais sejam: o objeto do estudo , o local  e a época  da pesquisa, então estaremos diante de uma série estatística. É, portanto, uma maneira de apresentar os dados estatísticos, de uma forma tabulada. São três, pois, os elementos de uma série estatística: 1º) o fato: é o fenômeno que foi investigado, e cujos valores estão sendo apresentados na tabela; 2º) o local : indica o âmbito geográfico ou a região onde o fato aconteceu; 3º) a época: refere-se ao período, data ou tempo, quando a variável foi investigada. Logo, ao nos defrontarmos com uma série estatística, devemos apresentar respostas às seguintes perguntas: O quê? Quando? Onde? Tais perguntas serão respondidas, respectivamente, pelos elementos: descrição descrição do fato, época e local. Na série estatística haverá sempre um elemento que sofrerá variações, enquanto outros dois permanecerão constantes (inalterados). A partir deste elemento variável estabeleceremos uma classificação, apresentada a seguir. 9.1. Classificação das Séries Estatísticas: Dependendo do elemento que varia e dos elementos que permanecem fixos, as séries serão classificadas em: Históricas, Geográficas, Específicas e Distribuição de Frequências. 9.1.1. Séries Históricas: Serão chamadas Séries Históricas  aquelas cujo elemento que sofrerá variação é a época, permanecendo fixos o local e a descrição do fenômeno. Vejamos o exemplo abaixo: PRODUÇÃO DE MINÉRIO DE FERRO (BRASIL) Anos Quantidade (*) (toneladas) 1978 12.104.375 1979 13.072.942 1980 18.739.223 1981 16.435.838

(*) Valores hipotéticos.

Observemos que, olhando esta tabela acima, saberemos dizer qual foi o fenômeno estudado, qual o local e a época da pesquisa. Verificamos ainda que, destes elementos, o objeto do estudo é fixo (produção de ferro), o local é fixo (Brasil), porém a época da pesquisa varia de 1978 a 1981, determinando, por isso, que se trata de uma série histórica.

Prof. Weber Campos

5

Estatística Existem alguns sinônimos para este tipo de série estatística, e que devem ser cuidadosamente memorizados, para o caso de uma questão teórica. São eles: séries cronológicas, temporais ou de marcha.

9.1.2. Séries Geográficas: Serão chamadas Séries Geográficas  aquelas cujo elemento variável será o local, permanecendo fixos o tempo e a descrição do fenômeno. São igualmente chamadas de séries espaciais, territoriais ou  de localização.  Convém dedicarmos especial atenção a estes sinônimos. Vejamos o exemplo abaixo: PRODUTO INTERNO BRUTO - 1980

Países Holanda Itália França Portugal

US$ (bilhões) (*) 126,3 106,3 103,6 92,0

(*) valores hipotéticos.

Verificamos, facilmente, que são fixos o fenômeno estudado (produto interno bruto) e a época da pesquisa (1980). Todavia, o elemento local   sofre variação, caracterizando, por isso, esta série estatística como série geográfica. 9.1.3. Séries Específicas: Chamaremos de Séries Específicas aquelas cuja descrição do fenômeno   sofrerá variação, permanecendo fixos os elementos local e tempo. Recebem ainda os sinônimos de séries especificativas ou categóricas. Analisemos o exemplo abaixo: Número de alunos concludentes UFC  2007 Cursos n.º alunos (*) Direito 238 Medicina 125 Engenharia 74 Estatística 1 –

(*)valores hipotéticos

Observemos que permanecem fixos o local da pesquisa (UFC – Universidade Federal do Ceará) e a época (ano 2000). Todavia, o fenômeno estudado está sofrendo uma variação, em diversas categorias (daí, o nome séries categóricas ), dando ensejo a esta classificação das séries específicas . 9.1.4. Distribuição de Frequências: A quarta e última espécie de série estatística é, de longe, a mais importante delas. Trata-se da chamada Distribuição de Frequências. A maioria das provas de estatística trabalha as questões tomando por base dados apresentados sob esta forma, ou seja, dados dispostos na Distribuição de Frequências. Por este motivo, daremos redobrada ênfase a este tópico, reservando, inclusive, um módulo inteiro para tratarmos deste assunto. Na Distribuição de Frequências, os dados são ordenados segundo um critério de magnitude, em classes ou intervalos, permanecendo fixos o fato, o local e a época. Isto é, embora o fenômeno estudado seja único, este sofrerá uma subdivisão em classes. Vejamos o exemplo a seguir:

Prof. Weber Campos

6

Estatística Altura dos alunos do curso X, em 11/03/2007. Alturas (m) Nº de alunos 1,50 |   1,60 14 1,60 |   1,70 29 1,70 |   1,80 37 1,80 |   1,90 18 1,90 |   2,00 2 Observemos que o fenômeno estudado é único (altura dos alunos), todavia está se subdividindo em várias classes. Temos, pois, a classe dos alunos com altura variando entre 1,50m e 1,60m; a classe dos alunos com altura entre 1,60m e 1,70m, e assim por diante. Quando formos detalhar, em um próximo tópico, a Distribuição de Frequências, voltaremos a falar sobre as classes e sobre todos os demais elementos deste tipo de série estatística. 9.1.5. Séries Conjugadas (ou mistas ou compostas) Estas são séries que resultam de uma combinação de, pelo menos, duas das séries vistas anteriormente. Por exemplo:

Anos 1999 2000 2001 2002

Gastos da Empresa X 1999 - 2002 Gastos (R$) Material Pessoal 100.000,00 21.000,00 110.500,00 23.300,00 120.100,00 24.900,00 130.200,00 26.500,00

As informações variam em dois sentidos: por ano (verticalmente) e por especificação do fenômeno observado (horizontalmente: gastos com material e gastos com pessoal). 10. NORMAS PARA APRESENTAÇÃO DE DADOS ESTATÍSTICOS: Um dos objetivos da Estatística é resumir os dados ou valores que uma ou mais variáveis possam assumir, a fim de que se tenha uma síntese da variação dessas variáveis. Para isso, ela recorre aos Quadros ou Tabelas, que irão nos fornecer informações a respeito das variáveis em estudo. 10.1. Conceito de Tabela: Trata-se simplesmente de um quadro, que sintetiza um conjunto de observações, com o objetivo de uniformizá-las e racionalizá-las, de forma a tornar mais simples e fácil a sua percepção. Destarte, uma tabela deve ser construída de modo a fornecer o máximo de esclarecimentos, com o mínimo de espaço. 10.2. Elementos Fundamentais de uma Tabela Estatística: a) Título: é a indicação contida na parte superior da tabela, onde deve estar definido o fato observado, com a especificação de local e época, referentes a esse fato. Exemplo: NÚMERO DE ASSASSINATOS EM PERNAMBUCO  1999 –

b) Corpo: é constituído por linhas e colunas, que fornecem o conteúdo das informações prestadas.

Prof. Weber Campos

7

Estatística c) Cabeçalho: é a parte da tabela que apresenta a natureza do que contém cada coluna. Ou seja, apresenta o conteúdo das colunas. Exemplo: Locais

Quantidade de Ocorrências

d) Coluna Indicadora: é a que determina o que contêm as linhas. Ou seja, apresenta o conteúdo das linhas. Exemplo: Região Metropolitana de Recife Cidades Litorâneas de Pernambuco Cidades do Agreste de Pernambuco Cidades do Sertão de Pernambuco 10.3. Elementos Complementares de uma Tabela Estatística: a) etc.

Fonte: designa a entidade que forneceu os dados estatísticos. Ex.: Fonte: IBGE, Ibope,

b)

Notas: esclarecimentos de natureza geral.

c)

Chamadas: esclarecimentos de natureza específica.

Observação: Preferencialmente, as notas e chamadas devem ser colocadas no rodapé da tabela. 10.4. Observações sobre a construção de uma Tabela: São apenas recomendações acerca do aspecto formal que uma tabela deve apresentar: - A tabela não deverá ser fechada lateralmente. - As casas (células) não deverão ficar em branco, apresentando sempre um número ou sinal convencional. 10.5. Sinais Convencionais: São também convenções, concernentes ao aspecto formal de uma tabela estatística: a) Três Pontos (...): quando o dado existe, mas não o conhecemos, ou seja, não dispomos dele; b) Traço horizontal ( ): quando o valor é zero; c) Ponto de Interrogação (?): quando há dúvida quanto à exatidão de determinado dado; d) A letra “zê” (Z): quando o dado for rigorosamente zero; e) O “zero” (0): quando o valor é muito pequeno para ser expresso pela unidade adotada.

Prof. Weber Campos

8

Estatística 11. TIPOS DE TABELA: 11.1. Tabela Simples (unidimensional): São aquelas que apresentam dados ou informações relativas a uma única variável. Exemplo: Preferência por um time de futebol Flamengo Corinthians São Paulo Palmeiras Santos Total

% de torcedores 27 22 19 17 15 100

11.2. Tabela de Dupla Entrada ou Cruzada (bidimensional): São as que apresentam, por sua vez, dados ou informações relativas a mais de uma variável. Exemplo: Preferência por Programa de rádio Noticiário Musical Novela Esportivo Outros Total

Sexo Masculino 08 10 07 15 05 45

Feminino 05 10 15 06 03 39

Total 13 20 22 21 08 84

EXERCÍCIOS DOS CONCEITOS INICIAIS 01.(Estatistico CEASA/MG 2004 FUMARC) Os clientes da Distribuidora de Arroz ABC Ltda têm fichas de cadastro numeradas consecutivamente de 261 a 973. Deve-se selecionar uma amostra aleatória de 25 pacientes para serem pesquisados quanto à “satisfação de atendimento por parte da Distribuidora”. O número de elementos dessa população é:

a)

712

b) 710

c) 973

d) 713

02.(TCU 93) Assinale a opção correta: a) Estatística Inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos. b) O processo utilizado para se medir as características de todos os membros de uma dada população recebe o nome de censo. c) A Estatística Descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma população com base na observação de uma amostra. d) Uma população só pode ser caracterizada se forem observados todos os seus componentes. e) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória. 03.(TCDF 95) Assinale a opção correta: a) Em Estatística, entende-se por população um conjunto de pessoas. b) A variável é discreta quando pode assumir qualquer valor dentro de determinado intervalo. c) Frequência relativa de uma variável aleatória é o número de repetições dessa variável. d) A série estatística é cronológica quando o elemento variável é o tempo. e) Amplitude total é a diferença entre dois valores quaisquer do atributo.

Prof. Weber Campos

9

Estatística 04.(Fiscal de Rendas RJ 2003 FJG) Os dados de um determinado estudo representam muitas variáveis para cada uma das pessoas que se submeteram ao estudo. Uma variável considerada qualitativa é a seguinte: A) idade B) altura C) sexo D) peso 05.Considerando a tabela a seguir indicada, pode-se concluir que seus dados refletem uma série: PRODUTOS QUANTIDADE (ton) ARROZ 300.000 AÇÚCAR 250.000 MILHO 120.000 FEIJÃO 30.000 a) especificativa ou específica. b) Geográfica. c) Temporal. d) Distribuição de frequência 06.(TCDF 2002 CESPE) Julgue os itens seguintes. 1. Por Estatística Descritiva entende-se um conjunto de ferramentas, tais como gráficos e tabelas, cujo objetivo é apresentar, de forma resumida, um conjunto de observações. 2. Quando aplicada em uma população de pessoas formada pelo mesmo número de homens e de mulheres, uma amostra aleatória simples também apresenta o mesmo número de homens e de mulheres. 07.(FTE-Alagoas 2002 CESPE) Julgue os seguintes itens. 1. Um censo consiste no estudo de todos os indivíduos da população considerada. 2. Como a realização de um censo tipicamente é muito onerosa e(ou) demorada, muitas vezes é conveniente estudar um subconjunto próprio da população, denominado amostra. 3. Em uma distribuição de frequências para um conjunto de n indivíduos, pode-se calcular as frequências relativas, dividindo-se cada frequência absoluta pela amplitude da correspondente classe ou do intervalo.

GABARITO 01. 02. 03. 04. 05. 06. 07.

D B D C A 1.Certo 2.Errado 1.Certo 2.Certo 3.Errado

Prof. Weber Campos

10

Estatística MÓDULO 02: DISTRIBUIÇÃO DE FREQUÊNCIAS  As distribuições de frequências (ou tabelas de frequências) são muito importantes na Estatística. Basicamente são utilizadas para se ter uma idéia quantitativa sobre a distribuição dos dados, ou seja, como os dados se manifestam.  Assim como existem dois tipos de dados quantitativos (discretos e contínuos) existem também dois tipos de distribuições de frequências. 1.

DISTRIB UIÇÃ O DE FREQUÊNCIAS PARA DA DOS DISCRETOS

Neste caso a distribuição de frequências se compõe basicamente de duas informações: as possíveis ocorrências e a quantidade de vezes que cada uma ocorreu de fato. Ex.: Imagine que você lança um dado 20 vezes e anota, em cada lançamento, o valor da face voltada para cima. Suponha que temos os seguintes resultados: 1 3

5 1

3 2

1 5

4 2

6 3

2 3

1 4

3 1

1 5

Para este exemplo temos a seguinte tabela de frequências:

Valores Observados (Xi) 1 2 3 4 5 6 Total

Frequência Observada (fi) 6 3 5 2 3 1 20

OBS.:  

2.

Na primeira coluna temos os valores das faces do dado e na segunda coluna temos o número de vezes que cada face ocorreu no experimento.  A soma total da coluna das frequências tem valor igual ao total de observações do experimento.

DISTRIB UIÇÃ O DE FREQUÊNCIAS PARA DA DOS CONTÍNUOS

Para um melhor entendimento sobre o conceito de distribuição de frequências para dados contínuos usaremos o seguinte exemplo: “Um professor, ao aplicar um teste em uma turma, deseja fazer uma pesquisa completa sobre o desempenho dos seus 50 alunos.”

 A lista dos resultados obtidos foi a seguinte (dados brutos): 5,5 2,4 5,0 3,0 0,0

7,8 3,5 5,3 1,9 0,5

7,0 4,0 5,5 1,5 2,2

4,4 4,0 4,0 7,5 3,6

3,0 1,5 4,5 5,0 0,5

2,0 1,0 6,5 5,1 9,5

0,5 6,0 2,5 4,0 5,0

0,0 2,5 1,0 4,5 3,7

9,5 8,0 4,8 5,5 4,0

5,0 3,2 5,0 5,5 2,0

 Agrupando os resultados por classes ou intervalos, obteremos a seguinte distribuição de frequências:

Prof. Weber Campos

11

Estatística

0 2 4 6 8

Notas |   |   |   |   |   Total

2 4 6 8 10

Frequências 10 12 20 5 3 50

O arranjo ou organização dos dados brutos por classe, junto com as frequências correspondentes, é chamado de Distribuição de Frequências com intervalos de classe (ou Dados . tabulados agrupados em classes) 

IMPORTANTE: Somente utilizaremos a distribuição de frequência com intervalos de classe, em duas situações: a) b)

3.

Quando os dados da amostra forem dados contínuos! (Lembrando: dados obtidos por medição!) Quando os dados da amostra forem dados discretos (lembrando: obtidos por contagem), porém em número acima de 30 (trinta) elementos.

ELEMENTO S DE UMA DISTRIBUIÇÃ O DE FREQUÊNCIA:

a) Classes: são os intervalos de variação da variável. São representados por i = 1, 2, 3, ..., k; onde k é o número total de classes da distribuição. Cada classe é representada por um intervalo onde são indicados apenas os valores limites. Vejamos quais são os tipos de intervalos de classe existentes: i) 3 |    5 ou [3 ; 5) : fechado à esquerda e aberto à direita. Inclui o limite inferior e exclui o limite superior. ii) 3   | 5 ou (3 ; 5] : aberto à esquerda e fechado à direita. Exclui o limite inferior e inclui o limite superior. iii) 3 |  | 5 ou [3 ; 5]: fechado à esquerda e à direita. Inclui os dois limites. iv) 3    5 ou (3 ; 5): aberto à esquerda e à direita. Exclui os dois limites. b) Limites de Classe: são os extremos de uma classe. linf = limite inferior lsup = limite superior c) Amplitude de Classe: é a medida do intervalo que define a classe. É obtida pela diferença entre os limites superior e inferior dessa classe. É indicada por h. h  l sup l inf  d) Ponto Médio de uma Classe: é aquele que divide o intervalo de classe em duas partes iguais. Chamaremos Ponto Médio de PM, e o calcularemos do seguinte modo: l sup l inf   h  ou  PM   l inf     PM   2  2  IMPORTANTE: O Ponto Médio de uma classe é o seu representante legítimo. Outras Relações: 1) O limite superior de uma classe é o ponto médio do intervalo dessa classe somado   com a metade da amplitude de classe.  h  l sup   PM      2  2) O limite inferior de uma classe é o ponto médio do intervalo dessa classe subtraído da metade da amplitude de classe.

Prof. Weber Campos

12

Estatística

 h  l inf    PM      2  IMPORTANTE: Quando todas as classes de uma distribuição possuem mesmas amplitudes de classe, teremos que: - A diferença entre os pontos médios é constante e igual à amplitude de classe. Portanto, para calcular todos os pontos médios de uma distribuição, calcule o primeiro ponto médio pela fórmula e depois vá somando a amplitude de classe para encontrar os outros pontos médios. e) Amplitude Total da Distribuição: é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo). É designada por At.  At    L max L min Obs.:  A Amplitude Total para o Rol e Dados brutos também é chamada de Amplitude Amostral (Aa), e é definida como a diferença entre o maior e o menor elemento da amostra. Teremos que:  Aa   xmax  xmin f)

4.

Frequência: existem vários tipos de frequências usadas em uma Distribuição de Frequências com e sem intervalos de classe, veja abaixo quais são elas. TIPOS DE FREQUÊNCIAS:

 As frequências mencionadas abaixo estão definidas para uma distribuição de frequência com intervalos de classe. As definições dessas frequências para uma distribuição sem intervalos de classe são feitas de maneira análoga.

4.1. FREQUÊNCIA ABSOLUTA  fi  Indica quantos elementos pertencem a cada classe.

4.2. FREQUÊNCIA ABSOLUTA ACUMULADA CRESCENTE   fac  Indica a quantidade de elementos que é menor ou igual ao limite superior da  classe.

É conhecida

também, como frequência “abaixo de”.

4.3. FREQUÊNCIA RELATIVA  Fi  Indica a proporção de elementos em cada classe com relação ao total de elementos.

4.4. FREQUÊNCIA RELATIVA ACUMULADA CRESCENTE  Fac  Indica a proporção de elementos, em relação ao total de elementos, que é menor ou igual ao limite superior da classe. É conhecida também, como frequência relativa “abaixo de”.

Prof. Weber Campos

13

Estatística MÓDULO 03: REPRESENTAÇÃO GRÁFICA DOS DADOS ESTATÍSTICOS 1. INTRODUÇÃO: Gráfico estatístico nada mais é do que uma forma de apresentação dos dados estatísticos. Tem como objetivo produzir, em quem o analisa, uma informação direta e objetiva do fenômeno em análise. É claro que nenhuma prova de concurso pedirá para você desenhar o gráfico, então como será medido o nosso conhecimento sobre os gráficos estatísticos? Poderá ser feito de dois modos: 1º) uma questão teórica para medir o conhecimento sobre os tipos de gráficos estatísticos; e 2º) a questão fornece um determinado gráfico pronto e pede que calculemos uma medida estatística baseada nele. Esse último modo é o mais frequente em provas, e para resolver as questões deste tipo, temos que saber ler e retirar as informações que são fornecidas no gráfico. Passemos agora a conhecer os principais tipos de gráficos estatísticos. Dê uma atenção especial aos gráficos usados para a representação de uma Distribuição de Frequências. E para esses gráficos, procure saber como montar a tabela de frequências correspondente. 2. GRAFICOS ESTATÍSTICOS PARA SÉRIES GEOGRÁFICAS, TEMPORAIS E ESPECÍFICAS: Convém ressaltar que o mais relevante não é que o aluno saiba desenhar os gráficos que veremos a seguir, e sim que ele saiba interpretá-lo e, se for o caso, reconhecer no gráfico algumas medidas estatísticas que possam, eventualmente, ser requeridas pela questão. 2.1. GRÁFICO DE COLUNAS: É a representação de uma série estatística por meio de retângulos não contíguos, dispostos verticalmente. Os retângulos possuem a mesma base e as suas alturas são proporcionais aos respectivos dados. É usado para séries temporais, séries específicas  ou séries geográficas. Exemplo 01: Produção de Veículos no Brasil (1992  1996) (em milhares de unidades) –

1000 900 800 700 600

92

Prof. Weber Campos

93

94

95

96

14

Estatística Exemplo 02: Alunos Formados na UFPE em 1999

200 160 100

Advogados Médicos Engenheiros

Exemplo 03: 15

Legenda

a - Noticiário b - Musical c - Novela d- Esportivo e - Outros

10 8 7 6 5 3 a b

c d

e

a b c

Masculino

d

e

Feminino 

Sexo

2.2. GRÁFICO EM BARRAS: Exemplo 04: PRODUÇÃO DE CEBOLA BRASIL  1992 –

São Paulo R. G. do Sul Sta Catarina Pernambuco Minas Gerais 0 40 80 120 160 200 240 280

(mil toneladas)

É a representação de uma série estatística por meio de retângulos dispostos horizontalmente. Os retângulos possuem mesma altura e os seus comprimentos são proporcionais aos respectivos dados. É normalmente usado para séries geográficas ou também na representação de séries específicas.

Prof. Weber Campos

15

Estatística 2.3. GRÁFICO EM LINHAS São usados sobretudo na representação de séries temporais. Exemplo: Estudando a população de um determinado país, obtêm-se os seguintes dados: Exemplo 05:  Ano

 População

População (em milhões)

85

1995

50

1996

55

70

65

65

1997 1998

70

1999

85

55 50 1995 1996

1997

1998

1999 Anos

2.4. GRÁFICO EM SETORES: É designado por meio de um círculo, onde cada classe é representada por um setor circular, cujo ângulo é proporcional ao tamanho da amostra. É utilizado quando se deseja mostrar as partes de um todo, ou seja, quando se deseja comparar

 proporções.

Exemplo o6: Empresas

Produção (unidades)

 A B C D Total

100 30 60 10 200

Produção (percentagem do total) 50% 15% 30% 5% 100%

As áreas dos setores são proporcionais aos dados da série, e são obtidas por meio de uma regra de três simples, na qual consideraremos que a área total da circunferência –  100% –  corresponde a 360º. Daí, como no exemplo a empresa A representa 50% do total da produção, faremos a seguinte regra de três: 360º --- 100% XA --- 50% Daí, 10 X  A  36  50



 X  A  180



Logo, encontraremos que este setor deverá cobrir um ângulo de 180º. De forma semelhante, encontraremos os ângulos para o restante das empresas: empresa B:  X  B  54 

empresa C:  X C   108



empresa D:  X  D  18



Prof. Weber Campos

16

Estatística Com esse dados, marcamos num círculo, com um transferidor, os ângulos correspondentes a cada setor, obtendo o gráfico de setores: 50%

A

5%

D

B

C

15%

30%

3. GRAFICOS ESTATÍSTICOS PARA DISTRIBUIÇÕES DE FREQUÊNCIAS Nesta seção, veremos os gráficos utilizados para representar distribuições de frequências. O mais importante que se deve aprender aqui é como montar a tabela de frequências a partir do gráfico dado na questão, conhecimento este já exigido em algumas questões de prova. Os gráficos a seguir apresentados somente serão compreendidos em sua totalidade pelo leitor depois que estudarmos, no próximo capítulo deste Curso, quais são, o que significam e como se constroem as frequências de uma distribuição. 3.1. GRÁFICO DE HASTES OU BASTÕES: Bastante utilizado para representar dados não agrupados em classes, o que normalmente ocorre com dados discretos. (Lembrando: aqueles normalmente obtidos por contagem). Neste caso, não há perda de informação, pois os valores da variável aparecem individualmente, como constam da amostra. Observação: O Gráfico de Hastes pode ser construído utilizando-se, indistintamente, as frequências simples absolutas ou relativas de cada elemento. Exemplo 07: Num lançamento de um dado 30 vezes tivemos o seguinte resultado: Xi fi 1 6 2 5 3 8 4 2 5 4 6 5 O gráfico de hastes correspondente a tabela é o seguinte: fi 8 6 5 4 2 1

2

3

4

5

6

Xi

Tente fazer a volta, ou seja, a partir do gráfico monte a tabela.

Prof. Weber Campos

17

Estatística 3.2. GRÁFICO EM ESCADA: A representação das frequências acumuladas para uma variável discreta é feita mediante o uso de um gráfico em escada. Exemplo 08: As notas de Matemática de 40 alunos de uma sala de aula foram os seguintes: Xi 2 4 5 7 8 10

fi 5 7 8 10 6 4

fac 5 12 20 30 36 40

O gráfico de escada correspondente a essa tabela de frequências acumuladas é o seguinte: fac 40 36 30 20 12 5 1 2 3 4 5 6 7 8 9 10 Xi No gráfico, um ponto representa um intervalo fechado e um círculo, um intervalo aberto. Novamente, tente a partir do gráfico chegar na tabela de frequências acumuladas. 3.3. HISTOGRAMA: Podemos afirmar seguramente que, entre todos os gráficos estatísticos, este é o de maior relevância na esfera dos concursos públicos. O Histograma é destinado à representação de Distribuições de Frequências. Qualquer questão, portanto, que tente relacioná-lo com outros tipos de Séries Estatísticas (séries geográficas, temporais , etc.) restará sumariamente equivocada. Repetindo: utilizaremos o Histograma para representar dados agrupados em classes. Neste caso, verificaremos que haverá uma certa perda de informação, tendo em vista que na Distribuição de Frequências trabalharemos com classes de elementos, e não com elementos dispostos individualmente. Observação: O Histograma pode ser construído utilizando-se, indistintamente, as frequências simples absolutas ou relativas de um intervalo de classe. No Histograma, as classes estarão representadas por retângulos –  um para cada classe – dispostos vertical e contiguamente (sem espaço entre eles), cujas bases serão margeadas pelos limites destas classes (limites inferior e superior) e cujas alturas serão determinadas pelas frequências – absolutas ou relativas – de cada classe. Trataremos novamente do Histograma no Capítulo seguinte deste Curso.

Prof. Weber Campos

18

Estatística

fi

Exemplo 08: Notas 2 |   4 4 |   6 6 |   8 8 |   10 Total

7

fi 5 7 4 2 18

5 4 2 2

4

6

8

10 Classes

3.4. POLIGONAL CARACTERÍSTICA: É o gráfico construído a partir do Histograma, utilizando-se apenas dos contornos deste. fi 7 5 4 2

2

4

6

8

10 Classes

3.5. POLÍGONO DE FREQUÊNCIAS: É o gráfico construído unindo-se por linhas retas os pontos médios  das bases superiores dos retângulos de um Histograma. Estes pontos médios, conforme veremos no próximo capítulo, são os elementos que estão exatamente no meio de cada classe, dividindo-as em duas metades. Exemplo 09: fi 7Notas fi 52 |   4 5 4 |   6 7 44 6 |   8 2 8 |   10 2Total 18 0

2

4

6 Classes

8

10

3.6. CURVA DE FREQUÊNCIAS: A partir do Polígono de Frequências podemos representar contornos mais suaves (polígono de frequência polido), utilizando-se curvas  para chegarmos a uma das representações de grande utilidade para a Estatística, a qual chamaremos de Curva de Frequências. Usando-nos destas Curvas, poderemos entender com mais facilidade algumas relações e algumas propriedades presentes no estudo das Medidas de Posição e das Medidas de Dispersão, conforme veremos em capítulos posteriores. Para o exemplo apresentado no item anterior, a respectiva curva de frequência é dada por:

Prof. Weber Campos

19

Estatística

fi 7542-

0

2

4

6

8

10

Classes

3.6.1. As Formas das Curvas de Frequências: delas:

As curvas de frequências podem assumir certas formas características. Citamos algumas

Curva em foma de sino: estas apresentam um formato assemelhando-se ao contorno de um sino, evidenciando uma forte concentração dos valores em torno do centro da distribuição. São muitos os fenômenos que oferecem distribuições em forma de sino: a estatura dos adultos, o peso dos adultos, a inteligência medida em testes de Q.I., os preços de um produto, etc. Na prática, é bem provável que a curva apresente uma certa assimetria à esquerda (cauda mais alongada à esquerda) ou à direita (cauda mais alongada à direita) . Então, é possível distinguir três configurações para as curvas em forma de sino: f

Curva Simétrica f

f

Curva Assimétrica à Direita

Curva Assimétrica à Esquerda

Por hora, ninguém se preocupe em memorizar esta nomenclatura de curvas assimétricas. Sequer falamos ainda em simetria ou assimetria de um conjunto. Em momento oportuno, trataremos exaustivamente destas configurações das Curvas de Frequências.

Curvas em foma de Jota: apresentam ponto de ordenada máxima em um das extremidades. São curvas comuns aos fenômenos econômicos e financeiros: distribuição de vencimentos ou rendas pessoais.

Prof. Weber Campos

20

Estatística f

f

Curva em J

Curva em J invertido

Curvas em foma de U: são caracterizadas por apresentarem ordenadas máximas em ambas as extremidades. Como exemplo de distribuição que dá origem a esse tipo de curva podemos citar a de mortalidade por idade. f

Curva em foma de U 3.7. POLÍGONO DE FREQUÊNCIAS ACUMULADAS (ou OGIVA): São gráficos construídos a partir das frequências acumuladas crescentes, podendo ser absolutas ou relativas. 3.7.1. Ogiva com as frequências acumuladas crescentes Depois de se desenhar, para cada classe, os retângulos com alturas correspondentes ao valor da frequência acumulada crescente , construiremos a curva da Ogiva interligando-se os pontos das bases superiores dos retângulos, que correspondem aos limites superiores de cada classe. Exemplo 10: 2 4 6 8

Notas |   4 |   6 |   8 |   10 Total

fac

fi 5 7 4 2 18

fac 5 12 16 18

18 16 12 5 0

Prof. Weber Campos

2

4

6

8

10  Classes

21

Estatística EXERCÍCIOS DE REPRESENTAÇÃO GRÁFICA DOS DADOS ESTATÍSTICOS 01.(IRB 2006 ESAF) No campo estatístico, ogivas são: a) polígonos de frequência acumulada. b) polígonos de frequência acumulada relativa ou percentual. c) histograma de distribuição de frequência. d) histograma de distribuição de frequência relativa ou percentual. e) o equivalente à amplitude do intervalo. 02.(IRB 2006 ESAF) Histograma e Polígono de frequência são a) a mesma representação gráfica (idênticas) de uma distribuição de frequência. b) um texto descritivo e uma representação gráfica de uma distribuição de frequência. c) um texto descritivo e uma função gráfica de uma distribuição de frequência. d) duas representações gráficas de uma distribuição de frequência. e) duas representações gráficas de uma distribuição de frequência, porém com sentidos opostos. 03.(Analista SUSEP 2006 ESAF) Considerando V = Verdadeiro e F = Falso e o contido em cada item abaixo, qual é a opção que indica as respostas com as alternativas adequadas (para cada item e com base em todo o texto do respectivo item): ( ) Nas curvas de frequência simétrica ou em forma de sino caracterizam-se pelo fato das observações equidistantes do ponto central máximo terem a mesma frequência. ( ) Nas curvas de moderadamente assimétrica ou desviadas, a cauda da curva de um lado da ordenada máxima é mais longa do que do outro lado. Se o ramo mais alongado fi ca à direita, a curva é dita desviada para a direita ou de assimetria negativa, enquanto que, se ocorrer o inverso, diz-se que a curva é desviada para a esquerda ou de assimetria positiva. ( ) Nas curvas em forma de J (letra jota ou anzol) ou J invertido, o ponto de ordenada máxima ocorre em uma das extremidades. a) V, F, F c) V, F, V e) F, F, V b) V, V, F d) F, V, F 04.(TCU 93) Gráficos são instrumentos úteis na análise estatística. Assinale a afirmação incorreta: a) Um histograma representa uma distribuição de frequências para variáveis do tipo contínuo. b) O gráfico de barras representa, por meio de uma série de barras, quantidades ou frequências para variáveis categóricas. c) O gráfico de setores é apropriado, quando se quer representar as divisões de um montante total. d) Um histograma pode ser construído utilizando-se, indistintamente, as frequências absolutas ou relativas de um intervalo de classe. e) Uma ogiva pode ser obtida ligando-se os pontos médios dos topos dos retângulos de um histograma. 05.(AFTN 94 ESAF) Assinale a opção correta: a) A utilização de gráficos de barras ou de colunas exige amplitude de classe constante na distribuição de frequência. b) O histograma é um gráfico construído com frequências de uma distribuição de frequências ou de uma série temporal. c) O polígono de frequência é um indicador gráfico da distribuição de probabilidade que se ajusta à distribuição empírica a que ele se refere. d) O histograma pode ser construído para a distribuição de uma variável discreta ou contínua. e) O polígono de frequência é construído unindo-se os pontos correspondentes aos limites inferiores dos intervalos de classe da distribuição de frequência. GABARITO

1.A 2.D 3.C 4.E 5.C 6.E

Prof. Weber Campos

22

Estatística

MÓDULO 04 - MEDIDAS DE POSIÇÃO 1. MÉDIA ARITMÉTICA : 

X

Para um conjunto de valores

Média Aritmética Simples:  X   

 xi



n

Média Aritmética Ponderada:  X   

 x1   x2     xn

 p1 x1   p 2 x 2     p n x n

, p = peso de cada elemento no conjunto.

 p1   p 2     p n

Para Dados Tabulados Não Agrupados em Classes

Média Aritmética Ponderada:  X   

  f  i  xi



, n = nº de elementos

n

n



  f  1 x1   f  2 x2     f  k  xk    f  1   f  2     f  k 

, k = nº de linhas da tabela de frequências

Para Dados Tabulados Agrupados em Classes

Média Aritmética Ponderada:  X   

  f  i  xi n



  f  1 x1   f  2 x2     f  k  xk    f  1   f  2     f  k 

, k = nº de linhas da tabela de frequências

Obs.: Em uma distribuição com classes, os  x i são geralmente representados pelos pontos médios   das classes.



Propriedades da Média Aritmética 1) A Média Aritmética é afetada por valores extremos. 2) Se n1 valores têm média  X 1 , se n2 valores têm média  X 2 , ..., se nm valores têm média  X m , então a média do conjunto formado por todos os valores é dada pela relação:  X  

n1   X 1  n 2   X  2  ...  n m   X  m n1  n2  ...  nm



“A Média das Médias!”

3) A soma dos desvios de um conjunto de números tomados em relação à média aritmética é zero. Simbolicamente:  Para um conjunto de valores  Para Dados Tabulados:

  Xi  X   0

  fi. Xi  X   0

4) Propriedade da Soma e Subtração: "Ao somarmos (ou subtrairmos) um valor constante (c) a cada um dos elementos de um conjunto de números (conj.  A)". Resultado: A média do novo conjunto (conj. B) fica somada (ou subtraída) dessa constante.  B   A  c   X  B   X  A  c

5) Propriedade do Produto e Divisão: "Ao multiplicarmos (ou dividirmos) um valor constante (c) a cada um dos elementos de um conjunto de números (conj.  A)". Prof. Weber Campos

23

Estatística

Resultado: A média do novo conjunto (conj. B) fica multiplicada (ou dividida) por essa constante.  B   A  c   X  B   X  A  c

e

 B   A  c   X  B   X  A  c

CÁLCULO SIMPLIFICADO DA MÉDIA ARITMÉTICA Muitas vezes as contas que somos obrigados a fazer na construção da coluna ( fi.Xi) para o cálculo da média Aritmética são trabalhosas e poderiam vir a ser bastante demoradas, sobretudo se as classes tiverem como Pontos Médios valores não- inteiros, ou seja, valores “quebrados”, o que ocorre com frequência nas provas de concursos. A saída inteligente para resolver este problema, é transformar a variável original Xi em uma outra variável, através de uma operação de subtração e depois uma divisão, de forma que não calcularemos os produtos fi.Xi, mas sim, os produtos fi.Yi que são mais fáceis de obter. Poderemos simbolizar a nova variável (a variável transformada) por uma outra letra, Yi por exemplo. Ou Wi, ou Zi... fica a seu critério. Iremos, portanto, no cálculo da Média construir uma nova coluna, que será chamada Coluna da Variável Transformada. Vejamos um exemplo retirado da prova AFRF 2002.2:



Classes

fi

29,5 |— 39,5 39,5 |— 49,5 49,5 |— 59,5 59,5 |— 69,5 69,5 |— 79,5 79,5 |— 89,5 89,5 |— 99,5

4 8 14 20 26 18 10 n=100

Xi (pontos médios) 34,5 44,5 54,5 64,5 74,5 84,5 94,5

Yi = Xi – 64,5_ 10 -3 -2 -1 0 1 2 3

fi .Yi -12 -16 -14 0 +26 +36 +30 +50

Os passos deste método são os seguintes (Para distribuições com amplitudes de classes iguais): Xi Yi Y X

1) Construir a coluna da variável transformada (aqui chamada Yi), seguindo a sugestão: i) Subtrairemos os Xi pelo ponto médio de uma das classes da distribuição. Sugiro a classe central da distribuição. Se a distribuição tiver um número par de classes, escolha a classe central com maior frequência. No exemplo acima escolhemos o PM da 4ª Classe. ii) Dividiremos o resultado pela Amplitude da Classe, o “h” (no exemplo: h=10). IMPORTANTE: Sempre que construirmos a coluna da variável transformada por meio da sugestão apresentada acima, teremos como resultado uma sequencia de números inteiros, iniciando por zero na classe escolhida no item "i" acima e incrementando de +1 para baixo e de 1 para cima. (Veja a tabela acima).

Prof. Weber Campos

24

Estatística

2) Construir a coluna (fi.Yi) e calcular o seu somatório; 3) Encontrar o valor da Média da Variável Transformada, usando a fórmula da média:

  fi  Yi 

    

Y   

n

Neste exemplo: Y  

  

50 100

 0,5

4) O Cálculo da Média: A relação entre X e Y é dada por: Y = X  – 64,5_ , 10 e ao isolarmos X obtemos: X = 10.Y + 64,5 . Pelas propriedades da Média, sabemos que ao somar, subtrair, multiplicar ou dividir uma constante por uma variável, a média desta variável se altera de forma igual. Portanto, como  X   10  Y   64,5 , então  X   10  Y   64,5 Substituindo o valor de Y  igual a 0,5 , calculado no item 3, obtemos a média da variável X:  X  = 10 . 0,5 + 64,5 = 69,5 2. MODA : Mo 

Para um conjunto de valores É o elemento do conjunto que mais se repete. Ex.: {2, 3, 3, 3, 4, 4}  Mo = 3 Em relação a Moda, classifica-se um conjunto em:  Amodal: Quando não possuir moda. Ex.: {3, 6, 7, 9}  Unimodal: Quando possuir um única moda. Ex.: {3, 3, 3, 7, 9}  Bimodal: Quando possuir duas modas. Ex.: {3, 3, 6, 9, 9}  Multimodal: Quando possuir mais de duas modas. Ex.: {3, 3, 6, 6, 7, 9, 9}



Para Dados Tabulados Não Agrupados em Classes É o elemento da tabela que possui maior frequência simples (absoluta ou relativa).



Para Dados Tabulados Agrupados em Classes 1º Passo: Encontre a Classe Modal (é a classe que apresenta maior frequência absoluta simples). 2º Passo: Aplique a fórmula de Czuber :   a     h    a  p    

 Mo  l inf  

linf  = limite inferior da classe modal. h = amplitude da classe modal. a = diferença entre a frequência absoluta simples da classe modal e a da classe anterior. a   fi   fiant   p =

diferença entre a frequência absoluta simples da classe modal e a da classe posterior.

 p    fi    fi pos

Prof. Weber Campos

25

Estatística

Obs.: Se a distribuição apresenta amplitudes de classes diferentes, então antes de executar o 1º passo descrito acima, normalize as frequências absolutas simples (dividir as  f  i  por suas amplitudes de classe). Estas frequências normalizadas serão as novas frequências absolutas simples para efeito do cálculo da moda. 

Propriedades da Moda 1) Propriedade da Soma e Subtração: Ao somarmos (ou subtrairmos) um valor constante a cada um dos elementos de um conjunto de números, a moda fica somada (ou subtraída) dessa constante. 2) Propriedade do Produto e Divisão: Ao multiplicarmos (ou dividirmos) um valor constante por cada um dos elementos de um conjunto de números, a moda fica multiplicada (ou dividida) por essa constante.

3. MEDIANA : Md 

Para um conjunto de valores (coloque em ordem crescente!) Se n é ímpar :  1o Passo: "Posição do elemento central" =   n  1  a Daí, obtemos o elemento   2  

central. 2  Passo: "Determinação da Mediana" A Mediana é o próprio elemento central. o

Se n é par : 1o Passo: "Posições dos elementos centrais" Posição do 1o elemento central =   n  a  Daí, obtemos o 1º elemento central.  2 

o

Posição do 2  elemento central = é a posição seguinte.  Daí, temos o 2º elemento central. 2o Passo: "Determinação da Mediana " A Mediana é obtida pela média aritmética dos 2 elementos centrais. 

Para Dados Tabulados Não Agrupados em Classes (coloque em ordem crescente!) 1o Passo: "Encontrar a(s) Posição(ões) do(s) Elemento(s) Central (is)" Proceder da mesma forma que foi feita no conjunto de valores. o 2  Passo: "Encontrar o(s) Elemento(s) Central(is)" Procurar na tabela o elemento cuja  fac  seja imediatamente maior ou igual à posição do elemento central, que foi obtida no 1 o passo. (Se n é par teremos 2 elementos a serem encontrados). o 3  Passo: "Determinação da Mediana" Se n é ímpar : a Mediana é o elemento central encontrado no 2 o passo. Se n é par : a Mediana é a média aritmética dos 2 elementos centrais encontrados no 2o passo.

Prof. Weber Campos

26

Estatística



Para Dados Tabulados Agrupados em Classes

1o Passo: Número de elementos acumulados abaixo da Mediana: n/2 (ou 50%). 2o  Passo: "Determinação da Classe Mediana" A Classe Mediana é a classe da distribuição de frequências que primeiro apresentar fac (ou Fac) maior ou igual a n/2 (ou 50%). 3o  Passo: "Interpolação linear para o cálculo da Mediana" linf   facin

M d 

lsup

n/2 (ou

 fac sup

50%)

linf  = limite inferior da classe mediana lsup = limite superior da classe mediana  facinf  = frequência acumulada de elementos abaixo do linf .  facsup = frequência acumulada de elementos abaixo do lsup.



Propriedades da Mediana 1) Propriedade da Soma e Subtração: Ao somarmos (ou subtrairmos) um valor constante a cada um dos elementos de um conjunto de números, a mediana fica somada (ou subtraída) dessa constante. 2) Propriedade do Produto e Divisão: Ao multiplicarmos (ou dividirmos) um valor constante por cada um dos elementos de um conjunto de números, a mediana fica multiplicada (ou dividida) por essa constante.

6. SEPARATRIZES 6.1. QUARTIL O quartil divide a distribuição em quatro partes iguais. Temos, portanto, 3  quartis. Os quartis serão representados por Q j   , para j = 1, 2 e 3. (1o quartil:  j=1; 2o quartil:  j=2; 3o quartil:  j=3) 

Para um conjunto de valores (coloque em ordem crescente!) O método mais prático para obter os 3 quartis é utilizar o  princípio do cálculo da mediana. Na realidade serão calculadas “3 medianas” para um mesmo conjunto.

Ex.1: Calcule os quartis (Q1 , Q2 e Q3 ) do conjunto: {3, 8, 1, 0, 9, 6, 4} 1. O primeiro passo a ser dado é o da ordenação (crescente) dos valores: {0, 1, 3, 4, 6, 8, 9} Prof. Weber Campos

27

Estatística

2. Cálculo do 2º quartil: O 2º quartil será a mediana do conjunto {0, 1, 3, 4, 6, 8, 9}. A Md = 4 , ou seja, o 2º quartil: Q2 = 4 . 3. Cálculo do 1º quartil: Grupo de valores à esquerda do 2º Quartil: {0, 1, 3} O 1º quartil será a mediana desse grupo de valores. Em {0, 1, 3} a mediana é Md = 1. Ou seja, o 1º quartil: Q1 = 1 4. Cálculo do 3º quartil: Grupo de valores à direita do 2º Quartil: {6, 8, 9} O 3º quartil será a mediana desse grupo de valores. Em {6, 8, 9} a mediana é Md = 8. Ou seja, o 3º quartil: Q3 = 8 Ex. 2: Calcule os quartis (Q1 , Q2 e Q3) do conjunto: {1, 1, 3, 5, 6, 6, 7, 7, 7, 9, 9, 9} . 1. A série já está em ordem crescente. 2. Cálculo do 2º quartil: O 2º quartil será a mediana do conjunto {1, 1, 3, 5, 6, 6, 7, 7, 7, 9, 9, 9} . A Md = (6+7)/2 = 6,5 , ou seja, o 2º quartil: Q2 = 6,5 . 3. Cálculo do 1º quartil: Grupo de valores à esquerda do 2º Quartil: {1, 1, 3, 5, 6, 6} . O 1º quartil será a mediana desse grupo de valores. Em {1, 1, 3, 5, 6, 6} a mediana é Md = (3+5)/2 = 4. Ou seja, o 1º quartil: Q1 = 4 . 4. Cálculo do 3º quartil: Grupo de valores à direita do 2º Quartil: {7, 7, 7, 9, 9, 9} O 3º quartil será a mediana desse grupo de valores. Em {7, 7, 7, 9, 9, 9} a mediana é Md = (7+9)/2 = 8. Ou seja, o 3º quartil: Q3 = 8 

Para Dados Tabulados Agrupados em Classes 1º Passo: "Número de elementos acumulados abaixo do Q  j" é igual a:  j  n  (ou j.25%). 4

2º Passo: "Encontrar a classe do Q  j" : Será a classe que primeiro apresentar fac (ou Fac ) maior ou igual a  j  n  (ou j.25%). 4

3º Passo: "Interpolação linear para o cálculo do Q  j" linf   finf 

Q

lsup

n/2 (ou

 fsup

 j.25%)

linf  = limite inferior da classe do Q  j. lsup = limite superior da classe do Q  j.  finf  = frequência acumulada de elementos abaixo do linf .  fsup = frequência acumulada de elementos abaixo do lsup. Prof. Weber Campos

28

Estatística

MÓDULO 05 - MEDIDAS DE DISPERSÃO 1. Conceito: Dispersão é a maior ou menor diversificação dos valores de uma variável, em torno de um valor de tendência central tomado como ponto de comparação. Para qualificar os valores de uma variável, mostrando a maior ou menor concentração ou dispersão entre seus valores e a medida de posição tomada como referência, no caso a média aritmética, recorre-se às medidas de dispersão ou de variabilidade. Portanto, a finalidade das medidas de dispersão é verificar a representatividade do grau de concentração ou dispersão dos dados em torno da média. 2. AMPLITUDE TOTAL: AT É a diferença entre o maior valor e o menor valor dos dados apresentados. 

Exemplo para um conjunto: Seja o conjunto: X = {1, 2, 3, 5, 7, 9}



Teremos que: AT= 9  – 1



AT = 8

Exemplo de Dados Tabulados não agrupados em classes: Seja: Xi fi 2 5 4 10 6 15 8 12 10 5 13 3 Total 50 Teremos que: AT = 13  – 2  AT = 11 

Exemplo de Dados tabulados agrupados em classes: Seja: classes fi 2 |— 4 3 4 |— 6 5 6 |— 8 7 8 |— 10 4 10 |— 12 1 Total 20 Teremos que: AT = 12  – 2  AT = 10 

Obs.: Note que a Amplitude Total também pode ser determinada pela diferença entre o Ponto Médio da última classe e o Ponto Médio da primeira classe! Obs.: Essa medida tem aplicações muito limitadas, pois só capta o que acontece com os valores extremos, sendo completamente insensível aos valores intermediários. Prof. Weber Campos

29

Estatística

3. DESVIO MÉDIO: DM É a média dos valores absolutos dos desvios calculados em relação à média aritmética do conjunto. 3.1. Para um conjunto:  Xi   X    DM   n

Exemplo: Seja X = {1, 3, 5, 7, 9} Daí: Xi 1 3 5 7 9 Total Logo: DM = 12 / 5



Teremos que: X = 5 Xi –  X  1 – 5 = -4 3 – 5 = -2 5 – 5 = 0 7 – 5 = 2 9 – 5 = 4

| Xi –  X  | 4 2 0 2 4 12

DM = 2,4



3.2. Para Dados tabulados não agrupados: Teremos que:   fi. Xi   X    DM   n

Exemplo: Calcule o desvio médio da distribuição: Xi 2 4 6 8 10 13 Total

fi 5 10 15 12 5 3 50

Acharemos as colunas Xi –  X  , |Xi  –  X  | e  fi.|Xi  –  X  | . Calculando a média, encontraremos:  X  =6,5. Logo: Xi 2 4 6 8 10 13 Total

Prof. Weber Campos

fi 5 10 15 12 5 3 50

Xi –  X    2-6,5=-4,5 4-6,5=-2,5 6-6,5=-0,5 8-6,5=1,5 10-6,5=3,5 13-6,5=6,5

|Xi –  X  | 4,5 2,5 0,5 1,5 3,5 6,5

fi. |Xi –  X  | 4,5x5=22,5 2,5x10=25 0,5x15=7,5 1,5x12=18 3,5x5=17,5 6,5x3=19,5 110

30

Estatística

Daí: DM = 110 / 50

DM = 2,20



3.3. Para Dados tabulados agrupados em classes: Teremos também que:

 DM  

  fi. Xi   X  n

A única diferença para o DMA nos dados tabulados não agrupados é que agora a coluna Xi  – X  será encontrada pela diferença entre o Ponto Médio de cada classe e a Média Aritmética da distribuição! Portanto, devemos aqui encontrar primeiramente a coluna dos Pontos Médios (Xi)! 4. VARIÂNCIA: V ou S2 É a média dos quadrados dos desvios dos elementos tomados em relação à média aritmética. 

Para um conjunto de valores: Para a População:

 ( Xi   X ) V  

 

2

ou

n

V  

1 n 

 Xi   2

 Xi

2



  

n

 

Para a Amostra: ( Xi   X )    V  n 1



 

2

ou

1  V   n  1 

 Xi   2

 Xi

2



  

n

 

Para a Distribuição de Frequências: Para a População:

  fi  ( Xi   X ) V  

 

2

n

1

  fiXi   2

  fiXi

ou

V  

ou

  1  V   n  1   

n   

2



  

n

Para a Amostra:   fi  ( Xi   X )  V   n 1



2

  fiXi

  fiXi   2

2



n

  

Lembre-se que em uma distribuição de frequência com classes, os elementos  Xi   não são conhecidos, e que estes são representados geralmente pelos pontos médios das classes.

Prof. Weber Campos

31

Estatística IMPORTANTE: Na fórmula da Variância aparece o termo ( Xi)  para um conjunto de valores e o termo (  fiXi)   para os Dados Tabulados. É importante saber que há uma relação entre os termos acima e o valor da média aritmética  X  . Temos as seguintes relações: - Para o Rol ou Dados Brutos: - Para Dados Tabulados:

 Xi  n. X    fiXi  n. X 

Deste modo, se forem fornecidos os valores de  X    e de n, consequentemente teremos o valor do termo que aparece na fórmula da variância.

Exemplo: Seja X = {1, 3, 5, 7, 9} Daí: Xi 1 3 5 7 9 Total Logo: V =

40

  Teremos

que:  X  = 5

Xi –  X  1 – 5 = -4 3 – 5 = -2 5 – 5 = 0 7 – 5 = 2 9 – 5 = 4

(Xi –  X  )2 16 4 0 4 16 40

V=8



5

Exemplo: Calcule a variância a partir da distribuição populacional a seguir: Xi 2 4 6 8 10 13 Total

fi 5 10 15 12 5 3 50

Acharemos as colunas Xi – X  , (Xi  – X  )2 e  fi.( Xi – X  )2 . Calculando a média, encontraremos:  X  =6,5. Logo: Xi 2 4 6 8 10 13 Total Prof. Weber Campos

fi 5 10 15 12 5 3 50

Xi  – X  2-6,5=-4,5 4-6,5=-2,5 6-6,5=-0,5 8-6,5=1,5 10-6,5=3,5 13-6,5=6,5

(Xi –  X  )2 20,25 6,25 0,25 2,25 12,25 42,25

fi. (Xi –  X  )2 20,25x5 = 101,25 6,25x10 = 62,5 0,25x15 = 3,75 2,25x12 = 27 12,25x5 = 61,25 42,25x3 = 126,75 382,50 32

Estatística

Daí: V  

382,50

V = 7,65



50

Cálculo Simplificado da Variância Da mesma forma que usamos uma variável transformada no Cálculo Simplificado da Média Aritmética, também usaremos no Cálculo Simplificado da Variância com a finalidade de facilitar a obtenção da variância que dependendo dos dados fornecidos na questão pode ser bastante trabalhosa. Assim, transformaremos a variável original X  em uma outra variável, por meio de uma operação de subtração e depois de uma divisão. Poderemos simbolizar a nova variável (a variável transformada) por uma outra letra, Z por exemplo. Ou W, ou Y... fica a seu critério. Iremos, portanto, no cálculo simplificado da variância construir uma nova coluna, que será chamada Coluna da Variável Transformada. Vejamos um exemplo:



Classes

fi

29,5 |— 39,5 39,5 |— 49,5 49,5 |— 59,5 59,5 |— 69,5 69,5 |— 79,5 79,5 |— 89,5 89,5 |— 99,5

4 8 14 20 26 18 10 n=100

Xi (pontos médios) 34,5 44,5 54,5 64,5 74,5 84,5 94,5

Zi = Xi – 64,5 10 -3 -2 -1 0 1 2 3

fi .Zi

fi .Zi2

-12 -16 -14 0 +26 +36 +30 +50

36 32 14 0 26 72 90 +270

Os passos deste método são os seguintes (Para distribuições com amplitudes de classes iguais):

5) Construir a coluna da variável transformada (aqui chamada Z), seguindo a sugestão: i) Subtrairemos os  Xi   pelo ponto médio de uma das classes da distribuição. A escolha mais adequada é uma classe central da distribuição. Se a distribuição tiver um número par de classes, escolha a classe central com maior frequência. No exemplo acima, escolhemos o PM da 4ª Classe. ii) Dividiremos o resultado pela Amplitude da Classe, o “h” (no exemplo: h=10). IMPORTANTE: Sempre que construirmos a coluna da variável transformada por meio da sugestão apresentada acima, teremos como resultado uma sequência de números inteiros, iniciando por zero na classe escolhida anteriormente e incrementando de +1 para baixo e de -1 para cima. (Veja a tabela.)

Prof. Weber Campos

33

Estatística

6) Construir a coluna (fi .Zi) e calcular o seu somatório; 7) Construir a coluna (fi .Zi2) e calcular o seu somatório; 8) Encontrar o valor da Variância da Variável Transformada, usando a fórmula da variância: 2       fi .  Zi 1    2  . - Para a população: V  Z     fi. Zi   n n     2 1   (50)    270    2,45 Substituindo os dados, teremos: V  Z   100   100   9) Cálculo da Variância A relação entre X e Z é dada por: Z = X – 64,5_ , 10 e ao isolarmos X, obteremos: X = 10.Z + 64,5 . Pelas propriedades da variância, sabemos que ao somar ou subtrair uma constante a uma variável, a variância não se altera, e que ao multiplicar (ou dividir) uma variável por uma constante, a variância fica multiplicada ou dividida pelo quadrado da constante. Portanto, como  X   10  Z   64,5   , então: V  (10) 2 V  .  X  





 Z 

Substituindo o valor de V  Z  = 2,45 , calculado no item 4, obtemos a variância da variável X: V  X  = (10)2 . 2,45 = 245 . Propriedades da Variância:  A variância de dados constantes é zero;  A variância utiliza o quadrado dos desvios em relação à média, portanto terá o quadrado da unidade dos dados, ou seja, m 2, kg2, ...  Quanto a Propriedade da Soma e da Subtração:  Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma constante arbitrária, a variância não se altera.  Quanto a Propriedade do Produto e da Divisão:   Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por um valor constante, arbitrário e diferente de zero, a variância ficará multiplicada (ou dividida) pelo quadrado desta constante. Obs.: Veja nos resumos, ao final da apostila, o cálculo simplificado da variância!

5. DESVIO PADRÃO: dp ou S É a raiz quadrada da média dos quadrados dos desvios em relação à média aritmética, ou seja, é a raiz quadrada da variância: S   V  . Caso uma questão peça o valor do desvio padrão, primeiramente calcule a variância e em seguida tire a raiz quadrada. Prof. Weber Campos

34

Estatística

5.4. Propriedades do Desvio Padrão:  O desvio padrão de dados constantes é zero;  O desvio padrão é uma medida que utiliza a mesma unidade dos dados.  Quanto a Propriedade da Soma e da Subtração: Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma constante arbitrária, o desvio padrão não se altera.  Quanto a Propriedade do Produto e da Divisão: Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por um valor constante, arbitrário e diferente de zero, o desvio padrão ficará multiplicado (ou dividido) por esta constante.

6. AMPLITUDE SEMI-INTERQUARTÍLICA (DESVIO QUARTÍLICO): Dq É a metade da diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1). Ou seja:

 Dq 

Q3  Q1  2

Atenção: → O intervalo interquartílico é definido por: Q1 ; Q3  → A distância ou amplitude interquartílica é definida como: Q3  Q1

 Q1 Q3  ;  2 2 

→ O intervalo semi -interquartílico é definido por: 

→ A distância ou amplitude semi-interquartílica é definida como:

Q3  Q1 2

7. COEFICIENTE DE VARIAÇÃO: CV (A Dispersão Relativa) Também conhecido por Coeficiente de Variação de Pearson. É utilizada para fazer comparação da dispersão de duas séries distintas em torno de suas respectivas médias. É definida como o quociente entre o Desvio Padrão e a Média Aritmética do conjunto de dados. Ou seja: CV  

S   X 

Exemplo: Considere que tenhamos duas distribuições. A primeira com média 4 e desvio padrão 1,5 e a outra com média 3 e desvio padrão 1,3. Neste caso temos os seguintes CV's: CV 1 

1.5 4

 0.375

CV 2 

1.3 3

 0.43

logo conclui-se que, como CV 2 é maior que CV 1 , a segunda distribuição tem uma dispersão relativa maior que a primeira. Obs.: Quanto menor for o valor do CV, mais homogêneo será o conjunto de dados. Portanto, no exemplo acima, a primeira distribuição é mais homogênea do que a segunda.

Prof. Weber Campos

35

Estatística

Obs.: Em geral CV maior ou igual a 50% é considerado alto, sendo a média pouco representativa. Valores menores que 50% implicam CV baixo e a média é tão mais representativa quanto menor for o valor do CV. 8. VARIÂNCIA RELATIVA : VR A variância relativa também é uma medida de dispersão relativa que é obtida como a razão entre a variância e o quadrado da média aritmética. VR 

S 2  X 

2

A variância relativa pode ser definida como o quadrado do coeficiente de variação, vejamos: 2

S    S   VR  CV      2   X    X  2

2

RESUMO DAS PROPRIEDADES DA SOMA, SUBTRAÇÃO, PRODUTO E DIVISÃO: Se tomarmos todos os elementos de um conjunto e os... ...somarmos ...subtrairmos ...multiplicarmos ...dividirmos por a uma de uma por uma constante uma constante constante constante As medidas: Média, Mediana, Moda, Quartil, Decil e Percentil estarão: O Desvio Padrão e o Desvio Médio ficarão: A Variância ficará:

O Coeficiente de Variação ficará:

Prof. Weber Campos

Também somada a esta constante

Também subtraída desta constante

Inalterado

Inalterado

Inalterada

Inalterada

alterado

alterado

(calcular

S   X 

)

(calcular

S   X 

)

Também multiplicada por esta constante

Também dividida por esta constante

Multiplicado pelo módulo desta constante

Dividido pelo módulo desta constante

Multiplicada pelo quadrado desta constante

Dividida pelo quadrado desta constante

Inalterado

Inalterado

36

Estatística

MÓDULO 06 - DIAGRAMA DE CAIXA (OU BOX-SPLOT) O diagrama de caixa (ou Box-Splot) é um tipo de representação gráfica dos dados estatísticos. Para sua construção é necessário cinco números, três dos quais calculados a partir dos dados e os outros dois resultantes de uma simples observação dos dados. Esta é uma representação muito esclarecedora sobre a forma como os dados se distribuem, quanto a: - maior ou menor concentração; - simetria; - existência de val ores “extremos”. Os cinco números, a partir dos quais se constrói o diagrama de caixa, são os seguintes: mínimo, máximo, primeiro quartil (Q 1), mediana (Md) e terceiro quartil (Q 3). O diagrama de caixas pode ser construído horizontalmente ou verticalmente. Exemplo 01: Os dados seguintes representam as pontuações obtidas por 48 estudantes, num determinado teste. Apresente-os num diagrama de caixa.

37, 42, 49, 53, 55, 57, 58, 59, 60, 62, 62, 63, 64, 65, 66, 68, 69, 70, 71, 72, 74, 75, 75, 76, 77, 77, 78, 78, 79, 79, 80, 80, 81, 83, 84, 84, 85, 86, 87, 88, 89, 90, 90, 92, 93, 95, 98, 99. Solução: Mediana = 76 + 77 = 76,5 2 1º quartil = 63 + 64 = 63,5 2 3º quartil = 84 + 85 = 84,5 2 Quanto ao mínimo e ao máximo, são, respectivamente, 37 e 99. Para construir o diagrama de caixa, desenha-se um retângulo com comprimento igual à amplitude entre os quartis e com altura qualquer (a altura do retângulo não tem qualquer significado). Dentro do retângulo desenha-se um segmento de reta que assinala a posição da mediana. Dos lados do retângulo determinados pelo 1º quartil e pelo 3º quartil saem dois segmentos de reta, até ao mínimo e até ao máximo, respectivamente:

Prof. Weber Campos

37

Estatística

Da representação anterior ressalta imediatamente que: - 25% das notas são menores ou iguais a 63 pontos (as notas estão dadas em números inteiros); - 25% das notas são superiores ou iguais a 85 pontos; - 50% das notas estão compreendidas entre 64 e 84 pontos; Existem fundamentalmente duas características do diagrama de caixa que nos dão ideia da simetria ou enviesamento dos dados e que são: - Distância entre a linha indicadora da mediana e os lados do retângulo; - Comprimento das linhas que saem dos lados do retângulo. Apresentamos a seguir três exemplos de diagramas de caixa correspondentes a tipos diferentes de distribuição dos dados: Simétrica

Assimétrica à esquerda

Assimétrica à direita

BARREIRAS DE OUTLIERS Consideram-se seguidamente duas linhas que unem os meios dos lados dos retângulos com o menor e maior elementos da amostra que estão dentro das barreiras de outliers (extremos), definidas a seguir. Os outros elementos que não estão no intervalo constituído pelas barreiras de outliers são assinalados com o símbolo *.

Define-se barreira inferior como sendo o valor: Q 1 – 1,5 x (Q 3 – Q 1) Define-se barreira superior como sendo o valor: Q 3 + 1,5 x (Q 3 – Q 1) Quando é que consideramos um valor como outlier? Dizemos que um valor é outlier quando não está compreendido no intervalo: [barreira inferior, barreira superior]. Numa representação em caixa-com-bigodes, os outliers assinalam-se com o símbolo “*”.

Prof. Weber Campos

38

Estatística

MÓDULO 07 - AMOSTRAGEM 1. INTRODUÇÃO  A inferência estatística envolve a formulação de certos julgamentos sobre um todo após examinar apenas uma parte  – ou amostra  – dele. E em nosso dia-a-dia, muitas vezes nós usamos uma amostra para  julgar um todo, mas nem percebemos que fazemos isso. Quando queremos verificar se certo alimento é saboroso, comemos apenas um pequeno pedaço; a cozinheira prova a sopa para verificar se precisa de um pouco mais de sal; quando passamos os olhos sobre um novo livro ou uma revista para ver se vamos comprar; quando assistimos um programa de TV por uns poucos segundos ou minutos para decidir se mudamos ou não um canal,...  A amostragem estatística é semelhante a cada um dos exemplos acima, embora seus métodos sejam mais formais. Mas, para as inferências serem corretas, é necessário garantir que a amostra seja representativa da população, isto é, a amostra deve possuir as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar. E para tanto, ela deve ser retirada segundo determinadas té cn ic as de am os trag em .

2. TÉCNICAS (OU PROCESSOS) DE AMOSTRAGEM  Ao coletarmos uma amostra podemos fazê-la com reposição ou sem reposição, caso a amostragem seja realizada com reposição, um mesmo indivíduo tem chance de pertencer mais de uma vez a amostra, o que não acontece, no caso da amostragem ser sem reposição. Independentemente da maneira como a amostra é coletada (com ou sem reposição) o importante é que os indivíduos que comporão a amostra deverão ser selecionados através de uma técnica de amostragem adequada. Para a escolha do processo de amostragem, o pesquisador deve levar em conta o tipo de pesquisa, a acessibilidade aos elementos da população, a disponibilidade ou não de ter os elementos da população, a representatividade desejada ou necessária, a oportunidade apresentada pela ocorrência de fatos ou eventos, a disponibilidade de tempo, recursos financeiros e humanos etc.  As técnicas de amostragem são divididas em dois grupos: Amostragem Probabilística e Amostragem Não-Probabilística.

2.1. Amostragem Probabilística (ou Aleatória ou Casual): é aquela em que cada elemento da população tem uma chance conhecida e diferente de zero de ser selecionado para compor a amostra. Em outras palavras: todas as fases necessárias para a escolha dos elementos que constituirão a amostra são baseadas em “sorteios”.

 As amostragens probabilísticas geram amostras probabilísticas (com distribuição normal, ou binomial, ...). Dentre as amostragens probabilísticas se destacam: - Amostragem Aleatória Simples - Amostragem Sistemática - Amostragem Estratificada - Amostragem por Conglomerado

2.2. Amostragem Não-Probabilística (ou Não-Aleatória ou Não-Casual): é aquela em que a seleção dos elementos da população para compor a amostra depende ao menos em parte do julgamento do pesquisador ou do entrevistador no campo. Dentre estas se destacam: - Amostragem por Conveniência - Amostragem por Julgamento - Amostragem por Quotas

Prof. Weber Campos

39

Estatística 3. PRINCIPAIS TÉCNICAS DE AMOSTRAGEM PROBABILÍSTICA o

Amostragem Aleatória Simples Este tipo de amostragem é equivalente a um sorteio lotérico.

Na prática, a amostragem aleatória simples pode ser realizada enumerando-se todos os indivíduos da população (por exemplo, de 1 a n) e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, uma quantidade (digamos k) de números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra.

Exemplo: Deseja-se pesquisar a estatura dos 80 alunos que estudam em uma escola, para isso resolveu-se retirar uma amostra de 10% do total de alunos. Usando a amostragem aleatória simples, mostre como pode ser feita a seleção da amostra. Solução:  A população é formada pelos 80 alunos da escola. E a amostra será formada pelos alunos sort eados. Sendo o tamanho da amostra de 10% do total de 80 alunos, ou seja, 8 alunos. 1º passo: Numeramos os alunos de 01 a 80. Podemos elaborar uma lista com o número ao lado do nome do aluno. 2º passo: Escrevemos os números de 01 a 80 em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos a caixa para misturar bem os pedaços de papel. 3º passo: Retiramos, um a um, oito números que formarão a amostra. Pronto! Medindo as alturas dos alunos correspondentes aos números sorteados, obteremos uma amostra das estaturas dos noventa alunos. Para evitar o trabalho de escrever os números em pedaços de papel, sobretudo se a população é muito grande, foi elaborada uma tabela  – Tabela de Números Aleatórios  – construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. Então, para compor uma amostra de 8 números, só é preciso selecionar 8 números que estejam dispostos em uma coluna ou linha ou diagonal da tabela. Esse grupo de 8 números selecionados equivale ao sorteio dos 8 papeizinhos. Não vou expor a tabela de números aleatórios, porque ela não virá na prova. A minha intenção é somente dar conhecimento da existência dessa tabela.

o

Amostragem Sistemática

Quando os elementos da população já se acham ordenados, não há necessidade de construir um sistema de referência. São exemplos: os prontuários médicos de um hospital, as casas de uma rua, uma linha de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos Sistemática. Ela é uma simplificação do processo anterior. Neste caso, apenas o primeiro elemento da amostra será sorteado, e os demais serão retirados em uma progressão aritmética, com razão k, em que: k  

 N  n

 ,

Onde: N = tamanho da população e n = tamanho da amostra até se completar o tamanho da amostra desejado.

Exemplo: Suponhamos uma rua contendo 600 prédios, dos quais desejamos obter uma amostra formada de 50 prédios. Podemos, neste caso, usar o seguinte procedimento: como 600/50=12, escolhemos por sorteio um número de 1 a 12 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 12 em 12. Assim, se o número sorteado fosse o número 10, tomaríamos, pelo lado direito da rua, o 10º prédio, o 22º, o 34º, o 46º etc., e ao terminar o lado direito voltamos ao início da rua, pelo lado esquerdo, para continuar a contagem, a fim de completar a amostra dos 50 prédios. Prof. Weber Campos

40

Estatística

o

Amostragem Estratificada

Muitas vezes a população se divide em subpopulações  – estratos. Exemplos: Numa escola podemos separar os alunos em dois estratos: meninos e meninas; numa pesquisa podemos separar as pessoas por faixas (estratos) de idade; ou separar as pessoas de acordo com a formação escolar: nível secundário, nível médio e nível superior; para as propriedades rurais criar estratos de acordo com o tamanho: 0|--10, 10|--20, 20|--30 hectares. Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem estratificada. Quanto à forma de retirar os elementos dos estratos para compor a amostra, é classificada em: 

Uniforme

Quando é retirado o mesmo número de elementos em cada estrato, independentemente do tamanho do estrato. 

Proporcional

Quando o número de elementos retirado em cada estrato é proporcional ao tamanho do estrato. Para exemplificar os dois tipos de amostragem estratificada descritos, consideremos o seguinte exemplo.

Exemplo: Supondo, no exemplo feito na amostragem aleatória simples, que, dos 80 alunos da escola, 50 são meninas e 30 são meninos, vamos realizar uma amostragem estratificada uniforme e proporcional para um tamanho de amostra de 10%. Temos dois estratos na população considerada: meninos e meninas. Por primeiro, analisaremos a amostragem estratificada uniforme. Neste tipo, o número de meninos e de meninas que vão compor a amostra deve ser igual. Como a amostra é de 8 alunos (10% de 80), então vamos selecionar (de forma aleatória) 4 meninos e 4 meninas. Só isso! E, agora, a amostragem estratificada proporcional.  A determinação do tamanho de cada estrato é mostrada na tabela abaixo.

Sexo

População porcentagem da amostra tamanho da amostra (10%) 5 menina 50 10% de 50 menino

30

10% de 30

3

Total

80

10% de 80

8

Ficou definido na tabela que a amostra de 8 alunos será formada por 5 meninas e 3 meninos. E o processo de seleção dessas crianças deve ser feito de maneira aleatória, por exemplo, através da amostragem aleatória simples.

Prof. Weber Campos

41

Estatística

o

Amostragem por Conglomerados

 A amostragem por Conglomerado pressupõe a disposição dos itens de uma população em subgrupos (conglomerados) representativos da população global. Idealmente, cada conglomerado pode ser encarado como uma minipopulação. Em geral, os conglomerados são grupos de itens que se acham em estreito contato físico, como casas, quarteirões, bairros, municípios etc.  A amostragem por conglomerados tem duas vantagens muito distintas sobre a amostragem aleatória simples. Uma é que se os itens da população se acham muito dispersos, uma amostragem aleatória simples pode acarretar uma considerável despesa, viagens, estadias etc., para ser bem extraída, ao passo que os itens de cada conglomerado estão próximos uns dos outros. Suponhamos, por exemplo, que a população de interesse consistisse dos proprietários de automóveis do estado de Minas Gerais. Sem dúvida uma amostragem aleatória simples incluiria proprietários em localidades demasiadamente afastadas no estado, o que dificultaria a coordenação e a padronização na coleta dos dados. Por outro lado, os conglomerados de municípios ou cidades conteriam proprietários de carros em áreas concentradas, reduzindo o custo e facilitando a coordenação. Após selecionar aleatoriamente os conglomerados em todo o estado de Minas Gerais, dentro de cada conglomerado, a amostragem poderia ser aleatória simples, estratificada, novamente por conglomerados (por exemplo, bairros de uma cidade), ou ainda ser feito um censo para o caso do conglomerado selecionado não possua muitos indivíduos. Uma segunda vantagem da amostragem por conglomerado é que não é necessário uma listagem dos itens da população. Basta uma lista dos conglomerados. Assim, não é possível obter uma listagem de todos os proprietários de imóveis do Brasil, mas pode-se obter uma lista de estados, ou municípios, ou cidades. Ou então os conglomerados podem ser quarteirões. Embora não possamos obter uma listagem das casas de uma cidade, os quarteirões podem, em geral, ser identificados, fazendo-se a seleção por meio de mapas. Então os quarteirões escolhidos podem ser visitados, identificando-se as casa que comporão a amostra.

4. PRINCIPAIS TÉCNICAS DE AMOSTRAGEM NÃO-PROBABILÍSTICAS o

Amostragem por Conveniência

 A amostragem por conveniência é adequada e frequentemente utilizada para geração de ideias em pesquisas exploratórias, principalmente.  A amostra por conveniência é empregada quando se deseja obter informações de maneira rápida e barata. Uma vez que esse procedimento consiste em simplesmente contatar unidades convenientes da amostragem, é possível recrutar respondentes tais como estudantes em sala de aula, mulheres no shopping , alguns amigos e vizinhos, entre outros. Os autores comentam que este método também pode ser empregado em pré-testes de questionários.  Alguns exemplos de pesquisa com amostras por conveniência: 

Solicitar as pessoas que voluntariamente testem um produto e que em seguida respondam a uma entrevista.



Parar pessoas no supermercado e colher suas opiniões.



Colocar linhas de telefone adaptadas para que durante um programa de televisão os telespectadores possam dar suas opiniões.

o

Amostragem por Julgamento

O pesquisador escolhe deliberadamente certos elementos da população para formar a amostra, baseado num pré-julgamento.

Exemplo:   Pesquisa de mercado para lançar uma nova marca de leite longa vida tipo A. O pesquisador selecionará indivíduos com poder aquisitivo médio/alto, que são os principais consumidores deste produto (publico alvo), embora toda a população independentemente do poder aquisitivo possa ser consumidora deste produto.

Prof. Weber Campos

42

Estatística

o

Amostragem por Quotas

É também baseada em um julgamento e não em um processo aleatório. É frequentemente usada em pesquisas de opinião e pesquisa de mercado. Neste método deve-se conhecer as características da população de antemão e, então, usar uma amostra semelhante à população em termos de composição. O objetivo é obter-se uma amostra que seja representativa da população. A forma da população deve ser conhecida, pelo menos aproximadamente, à proporção que aparece uma certa quantidade, por exemplo, as proporções de pessoas de diferentes idades, sexo e grupos étnicos. A amostragem por quotas busca repetir esses percentuais na amostra. A amostragem por quotas pode ser comparada a uma amostragem estratificada. A população é estratificada por variáveis importantes, tais como idade, sexo e localidade e a quota necessária é obtida de cada estrato. Mas a diferença importante é que a amostragem por quotas não é selecionada por qualquer base aleatória.

EXERCÍCIOS 01. Para cada uma das seguintes situações diga qual o tipo de amostragem foi utilizada. a) Para compor a amostra foram sorteados aleatoriamente 10% de homens e 10% de mulheres de uma cidade. Tipo de Amostragem:________________ b) Numa escola precisa-se dividir 20 pessoas em dois grupos. Para o primeiro grupo ele seleciona aleatoriamente 10 pessoas, e considera os 10 restantes para o segundo grupo. Tipo de Amostragem:  ___________________________ c) Uma lista numerada contém 200 nomes, numerados consecutivamente a partir do número 1. Iniciando pelo 10º nome, uma amostra foi composta considerando sorteados os nomes referentes aos números 20, 30, 40, 50 e assim sucessivamente até que fossem escolhidos 10 nomes. Tipo de amostragem: Amostragem _______________

02. Complete: a) Na amostragem ______________ cada elemento da população tem a mesma chance de ser incluído na amostra. b) Na amostragem ______________a seleção dos itens da população que farão parte da amostra são escolhidos seguindo uma sequência fixa, isto é, são escolhidos os itens r, r+k, r+2k, r+3k, e assim por diante. c) A amostragem _______________pressupõe a divisão da população em subgrupos de itens similares, procedendo-se então a amostragem em cada subgrupo. d) A amostragem _______________pressupõe a disposição dos itens de uma população em subgrupos heterogêneos representativos da população global, procedendo-se a amostragem dos subgrupos. 03. (ESAF/AFPS/2002/Administração Tributária Previdênciária) Assinale a opção correta em referência ao significado do termo amostragem aleatória simples. a) Refere-se a um método de classificação da população. b) Refere-se à representatividade da amostra. c) É um método de escolha de amostras. d) Refere-se a amostras sistemáticas de populações infinitas. e) Refere-se à amostragem por quotas. 04. (Ministério da Integração Nacional 2012 Esaf) Para selecionar uma amostra aleatória de tamanho n de uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem, escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N/n e seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem denominase amostragem a) sistemática. b) por etapas. c) estratificada. d) por conglomerados. e) por quotas. Prof. Weber Campos

43

Estatística 05. (AFCE-TCDF-2002/CESPE) Julgue os itens seguintes. 1. Quando aplicada em uma população de pessoas formada pelo mesmo número de homens e de mulheres, uma amostra aleatória simples também apresenta o mesmo número de homens e de mulheres.

06. (FTE-Alagoas-2002/CESPE) Julgue os seguintes itens. 1. Quando a escolha dos elementos que farão parte de uma amostra é realizada usando-se um mecanismo probabilístico, diz-se que se trata de amostra por quotas.

07. (Auditor Fiscal SEFAZ/RJ 2011 FGV) A respeito das técnicas de amostragem probabilística, NÃO é correto afirmar que (A) na amostragem por conglomerado a população é dividida em diferentes grupos, extraindo-se uma amostra apenas dos conglomerados selecionados. (B) na amostragem estratificada, se a população pode ser dividida em subgrupos que consistem em indivíduos bastante semelhantes entre si, pode-se obter uma amostra aleatória em cada grupo. (C) na amostragem aleatória simples se sorteia um elemento da população, sendo que todos os elementos têm a mesma probabilidade de serem selecionados. (D) na amostragem por voluntários a população é selecionada de forma a estratificar aleatoriamente os grupos selecionados. (E) na amostragem sistemática os elementos da população se apresentam ordenados, e a retirada dos elementos da amostra é feita periodicamente.

08. (Agente Fiscal do RS 2006 FAURGS) Analise as seguintes informações sobre Amostragem Aleatória simples. I.

É o processo de retirada de uma amostra da população no qual cada unidade da população tem a mesma chance de ser retirada. II. É o processo de retirada de uma amostra da população no qual se conhecem as chances de retirada de cada unidade, ainda que não sejam idênticas entre si. III. Para realizar este processo de amostragem, é necessária a utilização de uma tabela de dígitos aleatórios ou pseudo-aleatórios. IV. É o único processo de amostragem que garante que a amostra resultante seja representativa da população. Quais estão corretas? a) Apenas I. c) Apenas III. e) Apenas IV. b) Apenas II. d) Apenas I e III.

09. (Ministério da Integração Nacional 2012 Esaf) Para selecionar uma amostra aleatória de tamanho n de uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem, escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N / n e seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem denominase amostragem a) sistemática. b) por etapas. c) estratificada. d) por conglomerados. e) por quotas.

Prof. Weber Campos

44

Estatística 10. (ESAF/AFPS/2002/Administração Tributária Previdênciária) Assinale a opção correta em referência ao significado do termo amostragem aleatória simples. a) Refere-se a um método de classificação da população. b) Refere-se à representatividade da amostra. c) É um método de escolha de amostras. d) Refere-se a amostras sistemáticas de populações infinitas. e) Refere-se à amostragem por quotas.

11. (Ministério da Integração Nacional 2012 Esaf) Para selecionar uma amostra aleatória de tamanho n de uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem, escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N/n e seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem denominase amostragem a) sistemática. b) por etapas. c) estratificada. d) por conglomerados. e) por quotas. 12. (CPRM 2013 Cespe)

Considere que um estudo estatístico tenha sido realizado para determinar a concentração média de uma substância em duas diferentes áreas (A e B). Considere, ainda, que as figuras acima apresentam os esquemas amostrais para essas áreas, que foram divididas em uma malha regular de três por cinco quadrados, e que os pontos mostrados nas figuras representam os locais em que os dados foram coletados. Com base nessas informações, julgue os próximos itens. 1. O esquema amostral para a área A caracteriza-se pela aplicação de uma malha regular com distribuição sistemática dos pontos de amostragem.

Prof. Weber Campos

45

Estatística

GABARITO: 01. a) Estratificada Proporcional b) Aleatória Simples c) Sistemática 02. a) aleatória simples b) sistemática c) estratificada d) por Conglomerados 03. c 04. a 05. E 06. E (A amostragem por quotas é uma técnica NÃO-PROBABILISTICA) 07. d 08. a 09. c 10. c 11. a 12. 1. C

Prof. Weber Campos

46

Estatística

EXERCÍCIOS DAS VIDEOAULAS 01. (PRF 2008 Cespe) Ficou pior para quem bebe O governo ainda espera a consolidação dos dados do primeiro mês de aplicação da Lei Seca para avaliar seu impacto sobre a cassação de CNHs. As primeiras projeções indicam, porém, que as apreensões subirão, no mínimo, 10%. Antes da vigência da Lei Seca, eram suspensas ou cassadas, em média, aproximadamente 155.000 CNHs por ano. Se as previsões estiverem corretas, a média anual deve subir para próximo de 170.000. A tabela a seguir mostra esses resultados nos últimos anos (fonte: DENATRAN).

Para que a média de CNHs suspensas ou cassadas, de 2003 a 2008, atinja o valor previsto de 170.000, será necessário que, em 2008, a quantidade de CNHs suspensas ou cassadas seja um número MEDIA A inferior a 180.000. B superior a 180.000 e inferior a 200.000. C superior a 200.000 e inferior a 220.000. D superior a 220.000 e inferior a 240.000. E superior a 240.000. 02. (CORREIOS 2005 CESPE) Julgue o item seguinte. 1. Considere que a média aritmética do faturamento mensal de uma agência dos Correios em 12 meses de determinado ano tenha sido igual a R$ 10.000,00. Supondo que a média aritmética do faturamento mensal dos últimos nove meses desse ano tenha sido de R$ 11.000,00, então a média aritmética do faturamento nos três primeiros meses desse ano deve ter sido um valor entre R$ 7.500,00 e R$ 8.000,00.

Prof. Weber Campos

47

Estatística

03. (Senado-2002/CESPE) Suponha que os gráficos I e II abaixo representem, respectivamente, as notas na prova de Língua Portuguesa, que tem um valor máximo de 10 pontos, obtidas por 10 candidatos a cada um dos cargos de Consultor Legislativo e Consultor de Orçamentos do Senado Federal. Nessa situação, é correto afirmar que I. o desvio-padrão da série de notas do gráfico I é maior que o da série de notas do gráfico II.

gráfico I

gráfico II

04. (Senado 1996 Cespe) A distribuição orçamentária em um órgão composto de 80 setores, apresenta média aritmética de R$ 50.000,00 e uma dispersão relativa de 10% em torno da média. Suponha que haja uma redução de 30% no orçamento de todos os 80 setores e julgue os itens seguintes. 1. O orçamento médio por setor assumirá o valor de R$ 32.500,00. 2. Em face da redução, a nova variância será igual a R$ 12.250.000,00. 3. O desvio padrão permanecerá inalterado. 4. A dispersão relativa em torno da média permanecerá inalterada. 5. Após a redução de 30% no orçamento dos 80 setores, será necessário um aumento de 30% para que o orçamento médio, por setor, apresente o valor de R$ 50.000,00. 05. (B. Brasil 2002/Cespe)

Prof. Weber Campos

48

Estatística

1. O desvio-padrão da série numérica formada pelos totais de toneladas movimentadas pelos países listados no gráfico I seria maior se dela fosse excluído o valor correspondente aos EUA. 2. No período mostrado no gráfico II, a mediana da série numérica formada pelos percentuais de cargas destinadas ao Brasil ou dele originadas, que passaram pelo canal do Panamá, é maior que a moda dessa série. 06. (Policial Rodoviário Federal 2004 CESPE)

O gráfico acima ilustra o número de acidentes de trânsito nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base nessas informações, julgue os itens seguintes. 1. A média aritmética de acidentes de trânsito nos cinco estados citados é superior a 7.000. 2. Se, no ano de 2004, com relação ao ano de 2001, o número de acidentes de trânsito em cada um dos estados considerados aumentasse de 150, então o desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2004 seria superior ao desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2001. 3. Se, no ano de 2004, com relação ao ano de 2001, o número de acidentes de trânsito no Acre passasse para 2.500, o número de acidentes de trânsito no Espírito Santo fosse reduzido para 10.000, o de Minas Gerais fosse reduzido para 13.000 e os demais permanecessem inalterados, então o desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2004 seria superior ao desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2001. 4. Se, no ano de 2004, com relação ao ano de 2001, o número de acidentes de trânsito no Acre crescesse 10%, o do Mato Grosso do Sul diminuísse 20%, o do Amazonas aumentasse 15% e os demais permanecessem inalterados, então a média aritmética da série numérica formada pelo número de acidentes de trânsito em cada estado, em 2004, seria maior que a mediana dessa mesma série.

Prof. Weber Campos

49

Estatística

07. (CPRM 2013 Cespe)

A tabela acima apresenta os resultados de um estudo estatístico realizado para avaliar o teor de óxidos de ferro ( X , em g/kg) no solo de determinada região. As amostras foram coletadas nos pontos de cruzamento de uma malha georreferenciada. Com base nessas informações, julgue os itens a seguir. 1. A moda da distribuição das amostras é igual a 100 g/kg. 2. A mediana amostral de X é igual a 90 g/kg. 3. A variância amostral de X é inferior ou igual a 130 g 2/kg2. 08. (TCE/ES 2012 Cespe) Em pesquisa realizada para se estimar o salário médio dos empregados de uma empresa, selecionou-se, aleatoriamente, uma amostra de nove empregados entre todos os empregados da empresa. Os dados de tempo de serviço, em anos, e salário, em quantidade de salários mínimos, dos indivíduos dessa amostra estão dispostos na tabela abaixo.

A partir dos dados da tabela, julgue os itens seguintes. 1. A estimativa não viciada da variância dos salários dos indivíduos da amostra com mais de 5 anos de serviço é igual a 2/3. 2. Excluindo-se da amostra um empregado qualquer, nem o menor salário nem a moda amostral sofreriam alterações com relação aos valores observados na amostra completa. 09. (SAEB/SEI 2012 Cespe) Determinado órgão precisa conceder licenças ambientais para a construção de edifícios residenciais. No entanto, o local possui diversos aspectos ambientais a serem solucionados. A tabela abaixo apresenta a frequência de empresas que precisam satisfazer certa quantidade de obrigações antes da liberação da licença ambiental.

Com base nessas informações, julgue os itens a seguir. 1. No total, mais de 15 empresas esperam licenças ambientais. 2. A mediana dos dados é maior ou igual a 3. 3. Em media, menos de 3 obrigações são devidas pelas empresas. 4. Se o desvio padrão amostral dos dados é 1,19, então o coeficiente de variação é menor que 50%.

Prof. Weber Campos

50

Estatística

10. (DPRF Agente Administrativo 2012 Cespe)

A tabela acima mostra a distribuição da quantidade Q de pessoas transportadas, incluindo o condutor, por veiculo de passeio circulando em determinado município, obtida como resultado de uma pesquisa feita nesse município para se avaliar o sistema de transporte local. Nessa tabela, P representa a porcentagem dos veículos de passeio circulando no município que transportam Q pessoas, para Q = 1, ..., 5. Com base nessas informações, julgue os seguintes itens. 1. Como a moda da distribuição descrita representa a maior frequência observada, seu valor é igual a 50%. 2. A quantidade de pessoas transportadas por veiculo de passeio circulando no município é distribuída em torno do valor 3, que representa a mediana da distribuição descrita. Como ocorre a concentração de muitos casos abaixo desse valor, essa distribuição possui assimetria negativa. 3. Como a tabela mostrada apresenta sequencia decrescente dos percentuais a medida que o valor da quantidade Q aumenta, a distribuição descrita apresenta curtose negativa. 11. (SAEB/SEI 2012 Cespe)

O estudo sobre a escolaridade dos habitantes de certa cidade produziu a tabela acima, que mostra a distribuição percentual do tempo de estudo (em anos). Com base nos dados apresentados na tabela, julgue os itens subsequentes. 1. O histograma padronizado da distribuicao dos tempos de estudo esta corretamente representado na figura abaixo.

Prof. Weber Campos

51

Estatística

12. (DPRF Agente Administrativo 2012 Cespe)

A tabela acima apresenta as estatísticas produzidas em um levantamento acerca do numero diário de acidentes que envolvem motocicletas em determinado local. Com base nessas informações,  julgue os próximos itens. 1. O coeficiente de variação da distribuição em questão é superior a 1 e inferior a 1,4. 2. A variância da distribuição do numero diário de acidentes com motocicletas no referido local é inferior a 100. 3. Segundo o coeficiente de assimetria de Pearson, a distribuição desse numero diário de acidentes apresenta assimetria negativa. 4. E correto inferir que a probabilidade de haver, em determinado dia, 10 ou mais acidentes que envolvam motocicletas no referido local é estritamente inferior a 0,5.

Prof. Weber Campos

52

Estatística

13. (DPRF Agente Administrativo 2012 Cespe)

M. M. B. Paolielo et al.. In: Saúde Pública, 1997 (com adaptações). Em decorrência do desenvolvimento urbano e tecnológico, tem-se a preocupação de monitorar os efeitos nocivos da poluição ambiental sobre a saúde da população urbana. A figura acima mostra o diagrama de caixa (box-plot) que descreve a distribuição da concentração de chumbo no sangue, em μg/dL, obtida com base em uma amostra aleatória de 200 pessoas do sexo masculino e de 100

pessoas do sexo feminino que trabalham em postos de combustível localizados em determinado município brasileiro. Com base nessas informações, julgue os itens de 1 a 3. 1. Com base nas linhas horizontais que cortam as caixas do diagrama apresentado, conclui-se corretamente que a média das concentrações de chumbo encontradas no sangue das pessoas do sexo feminino que trabalham em postos de combustível do referido município brasileiro é inferior a media das concentrações dessa mesma substancia no sangue das pessoas do sexo masculino que trabalham nesses postos de combustível. 2. O diagrama esquemático referente ao sexo feminino, em comparação com o referente ao sexo masculino, possui uma caixa (box) menor e pernas mais curtas, sugerindo que a variabilidade dos valores de concentração de chumbo no sangue das pessoas que trabalham em postos de combustível do referido município brasileiro é menor para as pessoas do sexo feminino que para as do sexo masculino. 3. Ha informações suficientes no diagrama apresentado para se concluir corretamente que 25% das pessoas do sexo feminino que trabalham em postos de combustível do referido município brasileiro apresentam concentrações de chumbo iguais ou superiores a 10 μg /dL. Já o percentual de pessoas do sexo masculino que trabalha nesses postos e apresenta concentrações de chumbo iguais ou superiores a 10 μg /dL é maior que 25%.

Prof. Weber Campos

53

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF