Apostila 1 - Importância Da Estatística e Conceitos Básicos

March 24, 2024 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Apostila 1 - Importância Da Estatística e Conceitos Básicos...

Description

Universidade Federal do Piauí Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI Profa. Gisele

ESTATÍSTICA I - IMPORTÂNCIA DA ESTATÍSTICA E CONCEITOS BÁSICOS

1. INTRODUÇÃO: Origem e importância Há tempos o homem tem, muitas vezes, tomado notas de coisas e pessoas, não somente com o fim de acumular números, mas também visando utilizar os dados do passado para a resolução de problemas do presente. Todavia, somente no fim do século XIX e início do século XX, com a aplicação das probabilidades aos problemas sobre a interpretação dos dados, os números passaram a ser utilizados tanto para resolver os problemas do presente quanto prever os acontecimentos futuros. A palavra Estatística deriva do latim “status”, que significa ESTADO. Os primeiros usos da estatística envolviam a compilação de dados e gráficos que descreviam vários aspectos de um estado ou país, daí a origem da palavra estar relacionada a estado. O primeiro levantamento estatístico remonta a 3500 a.C no Egito, tendo como objetivo informar ao estado sobre os recursos humanos e econômicos. No século XVII d.C a disciplina estatística já era lecionada nas universidades alemãs, continuando com a finalidade de descrever as populações e as riquezas do estado. Ainda neste século, ocorreu a expansão da ciência em áreas como saúde pública, indústria, comércio e densidade demográfica. Alguns estudiosos contribuíram ao longo dos anos para o desenvolvimento da estatística como ciência, como Francis Galton (1822-1911) que apresentou as noções de regressão e correlação; Karl Pearson (1857-1936) que apresentou seus famosos coeficientes, hoje chamados de coeficientes de Pearson; e Fisher que apresentou estudos sobre inferência estatística, dentre outros. Porém, o grande avanço mesmo da ciência foi por volta de 1940, quando o tratamento dos dados deixou de ser manual para ser computadorizado e, com isso, a realização de procedimentos estatísticos que, geralmente eram de alto custo do ponto de vista humano, passaram a ser dinamizados pela aplicação da informática no tratamento dos dados.

1

A importância da estatística reside no esforço do homem para melhor compreender o mundo, tanto do ponto de vista físico como social. Na sociedade científica, da qual fazemos parte atualmente, a investigação é parte essencial do trabalho diário. O interesse por descobrir novos procedimentos por meio da experiência acumulada tem sido determinante para a necessidade de os profissionais se perceberem imersos na formação e aprendizado de técnicas básicas de metodologia da investigação e de algumas mais concretas como a análise de dados. Os profissionais que se apóiam na quantificação e no estudo do que se observa diariamente, e entendem e conhecem os conceitos básicos de estatística se aprofundam e compreendem melhor o fundamento de sua área de trabalho. 2. O QUE É ESTATÍSTICA? Segundo o Dicionário de Língua Portuguesa Aurélio: “1Parte da matemática em que se investigam processos de obtenção, organização e análise de dados sobre uma coleção de seres quaisquer, e métodos de tirar conclusões e fazer predições com base nesses dados. 2Conjunto de elementos numéricos relativos a um fato social.” Para muitas pessoas, a palavra “estatística” faz lembrar longas colunas de números, gráficos e diagramas que mostram de que forma o governo está gastando o dinheiro dos impostos. No passado, esta palavra referia-se exclusivamente à informações numéricas de que os governos necessitavam para planejar sua conduta. Os estatísticos eram pessoas que coletavam grandes quantidades de informações numéricas. Alguns estatísticos ainda realizam este tipo de trabalho, mas existem outros que auxiliam a conduzir e interpretar experimentos científicos e pesquisas profissionais. As mudanças no significado da palavra estatística acompanharam as mudanças ocorridas no tipo de trabalho realizado pelos estatísticos. A palavra estatística pode ser utilizada para designar dados numéricos, como, por exemplo, estatísticas esportivas ou estatísticas financeiras. Entretanto, a palavra pode também se referir à estatística como uma disciplina própria da mesma forma que a matemática ou a economia. Assim, conceituando temos que: A estatística é o ramo da matemática interessado nos métodos científicos para coleta, organização, resumo, apresentação e análise de dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais análises. Portanto, a estatística é uma ciência que se preocupa com o planejamento de uma pesquisa, envolvendo desde a forma de coleta das observações obtidas em experimentos ou levantamentos, até a maneira como será feita a organização, a descrição, o resumo dos dados e a avaliação e 2

afirmação sobre características de interesse do pesquisador. Tudo isso corresponde às fases do método estatístico. As fases do método estatístico são então: a) Definição do Problema Consiste na: - formulação correta do problema; - examinar outros levantamentos realizados no mesmo campo (revisão da literatura); - saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis, população, hipóteses, etc.) b) Planejamento Determinar o procedimento necessário para resolver o problema: - Como levantar informações; - Tipos de levantamentos: por censo (completo) ou por amostragem (parcial). - Cronograma, custos, etc. c) Coleta ou levantamento dos dados Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer. A coleta pode ser: Direta - diretamente da fonte; Indireta - feita através de outras fontes. Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros (secundários). d) Apuração dos Dados ou sumarização Consiste em resumir os dados, através de uma contagem e agrupamento. É um trabalho de coordenação e de tabulação. e) Apresentação dos dados É a fase em que são mostrados os resultados obtidos na coleta e na organização. f) Análise e interpretação dos dados É a fase mais importante e também a mais delicada. Obtêm-se conclusões que auxiliam o pesquisador nas tomadas de decisões.

3

OBS: As análises estatísticas dependem da forma de como os dados são coletados, e o planejamento estatístico da pesquisa indica o esquema sob o qual os dados serão obtidos. Portanto, o planejamento da pesquisa e a análise estatística dos dados estão intimamente ligados. PLANEJAMENTO DA PESQUISA ⇒ ANÁLISE ESTATÍSTICA Assim, o pesquisador deve possuir razoável conhecimento de estatística para desenvolver suas pesquisas, ou então consultar um estatístico para auxiliá-lo. Vale ressaltar que esta consulta deve ser feita antes do início da pesquisa, ainda durante a fase de elaboração do projeto.

3. SUBDIVISÕES DA ESTATÍSTICA A estatística pode ser dividida em duas áreas: Estatística Descritiva ou Análise Exploratória dos Dados  Estatística Indutiva ou Inferência Estatística A Estatística Descritiva ou Análise Exploratória de Dados é a parte da estatística que cuida da apresentação dos dados observados em certo grupo por meio de uso de tabelas, de gráficos e de medidas dentre as quais se destacam as medidas de posição e de dispersão, sem fazer inferências sobre um grupo maior. A Inferência Estatística ou Analise Confirmatória é a parte da estatística que trata das condições sob as quais faz-se inferências (ou pressuposições ou generalizações) sobre uma população. Se uma amostra é representativa de uma população, possui as mesmas características básicas da mesma, e conclusões importantes sobre a população podem ser inferidas de sua análise, assim, com a inferência estatística fazemos inferências além dos dados conhecidos. A inferência estatística envolve questões de dois tipos: a estimação de parâmetros populacionais e os testes de hipóteses. Nota: Mesmo sendo um importante instrumento auxiliar na pesquisa e na interpretação dos fenômenos, a estatística tem as suas limitações quanto ao uso: •

Não serve para corrigir erros grosseiros nem técnicas defeituosas. Como toda informação está contida nos dados, se esses são viciados, será falsa qualquer conclusão que deles se obtenha;



Não substitui o julgamento crítico. Ela fornece critérios que auxiliam na tomada de decisões, mas não dispensa a análise crítica do pesquisador.

4

4. CONCEITOS BÁSICOS a) POPULAÇÃO X AMOSTRA  População (N): Conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo menos uma característica em comum, a população é o conjunto Universo. Pode varia quanto à sua origem (conjunto de pessoas, de objetos, de acontecimentos, etc.), à sua natureza (existente ou real, hipotética ou não totalmente inexistente) e ainda pode ser finita ou infinita. Finita - apresenta um número limitado de observações, que é passível de contagem. Infinita - apresenta um número ilimitado de observações que é impossível de contar e 

geralmente esta associada a processos.

 Uma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma irá depender do tamanho da amostra. Se a freqüência relativa entre amostra e população for menor do que 5% ela é considerada infinita, se a freqüência relativa for maior do que 5% ela é considerada finita. Amostra (n): É um subconjunto da população e deverá ser considerada finita, a amostra deve ser selecionada seguindo certas regras e deve ser representativa da população, de modo que ela represente todas as características da população.

b) CENSO X AMOSTRAGEM  Censo: É a coleta exaustiva de informações das "N" unidades populacionais.  Amostragem: É o processo de retirada de informações dos "n" elementos amostrais.

OBS: Censo por amostragem

c) DADO X VARIÁVEL  Dado: qualquer característica que possa ser observada ou medida de alguma maneira. As matérias-primas da estatística são os dados observáveis. As características importantes dos dados são: •

Centro: um valor representativo ou médio, que indica onde está localizado o meio do conjunto de dados; 5



Variação: medida de quanto os valores dos dados variam entre eles;



Distribuição: a natureza ou forma de distribuição dos dados;



Tempo: características dos dados que mudam com o tempo.

 Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão. Os símbolos utilizados para representar estatisticamente as variáveis são as letras maiúsculas do alfabeto, tais como X, Y, Z, ..., que podem assumir qualquer valor de um conjunto de dados. As variáveis podem ser classificadas dos seguintes modos: •

Qualitativas (ou atributos ou categóricos): São características que não podem ser medidas, ou seja, são não-numéricas. Nominal : são utilizados nomes, rótulos ou símbolos para representar determinados tipos de dados, mostrando, assim, a qual grupo ou categoria eles pertencem. Ex.: cor da flor, que pode ser rosa, branca ou vermelha. Ordinal ou por postos: quando uma classificação for dividida em categorias ordenadas em graus convencionados, havendo uma relação entre as categorias do tipo “maior do que”, “menor do que”, “igual a”, os dados por postos consistem de valores relativos atribuídos para denotar a ordem de primeiro, segundo, terceiro e, assim, sucessivamente. Ex.: resistência a inseto, que pode ser suscetível, parcialmente resistente e resistente.



Quantitativas: São características que podem ser contadas ou medidas, sendo classificadas em discretas e contínuas. Discretas: são aquelas variáveis que podem assumir somente valores inteiros num conjunto de valores. É gerada pelo processo de contagem. Ex.: número de folhas por planta; número de carrapatos por animal; etc. Contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo de valores. É gerada pelo processo de medição ou mensuração. Ex.: volume de água em um reservatório; peso de raiz; diâmetro do caule; produção; produtividade; etc.

d) PARÂMETRO X ESTIMADOR X ESTIMATIVA  Parâmetro: é uma medida numérica que descreve alguma característica da população. É o resumo da variável observada na população. Por exemplo, média, variância e desvio padrão. 6

Cada parâmetro é representado por um símbolo ou letra. No exemplo tem-se que para a média, a variância e o desvio padrão as letras gregas µ (mi), σ2 (sigma ao quadrado) e σ (sigma). Não é possível fazer inferências baseada em parâmetro, uma vez que toda a população foi investigada.

  Estimador (também chamado de Estatística): é uma medida numérica que descreve alguma característica de uma amostra, ou seja, o estimador é obtido a partir do resumo da variável observada na amostra. Neste caso, é possível utilizarmos as teorias inferências para que, com base na amostra, possamos obter conclusões sobre a população. Cada estimador também é representado por um símbolo ou letra. Para a média, a variância e o desvio padrão as letras gregas µˆ ou X , σˆ 2 ou S2 e σˆ ou S. NOTE QUE O ESTIMADOR DO PARÂMETRO PODE SER REPRESENTADO PELO SÍMBOLO OU LETRA ACRESCIDO DO ACENTO CIRCUNFLEXO OU POR OUTRA LETRA OU SÍMBOLO. Parâmetro

Estimador

(valores reais)

(valores estimados)

Média (µ)

µˆ

X

Variância (σ2)

σˆ 2

S2

Desvio padrão (σ)

σˆ

S

Proporção (π)

-



 Estimativa: Valor numérico assumido pelo estimador, isto é, valor aproximado do parâmetro, calculado com base na amostra.

7

Exemplo: Consideremos uma população hipotética formada por 10 plantas de determinada espécie (N = 10). A variável em estudo foi altura das plantas em centímetros (variável X). Assim, tem-se que: X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

1,4

1,5

1,7

1,7

1,8

1,8

1,9

1,9

1,9

2,0

Podemos obter o parâmetro média desta população (µ), qual seja: N

∑X µ=

i =1

N

i

=

1,4 + 1,5 + 1,7 + 1,7 + 1,8 + 1,8 + 1,9 + 1,9 + 1,9 + 2,0 = 1,76 10

Suponhamos que retiramos aleatoriamente uma amostra representativa da população de tamanho n = 3: X1

X9

X10

1,4

1,9

2,0

Podemos agora obter o estimador da média da população ( X ), dado por: n

∑X X =

i =1

n

i

=

1,4 + 1,9 + 2,0 = 1,77 3

A estimativa é o resultado numérico dado pelo estimador, ou seja, 1,77.

6. ARREDONDAMENTO DE DADOS Regras: Portaria 36 de 06/07/1965 - INPM (Instituto Nacional de Pesos e Medidas). 1a) Se o primeiro algarismo após aquele que formos arredondar for de 0 a 4, conservamos o algarismo a ser arredondado e desprezamos os seguintes. Ex.: 7,34856 (para décimos) → 7,3 2a) Se o primeiro algarismo após aquele que formos arredondar for de 6 a 9, acrescenta-se uma unidade no algarismo a ser arredondado e desprezamos os seguintes. 8

Ex.: 1,2734 (para décimos) → 1,3 3a) Se o primeiro algarismo após aquele que formos arredondar for 5, seguido apenas de zeros, conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for ímpar, desprezando os seguintes. Ex.: 6,2500 (para décimos) → 6,2 12,350 (para décimos) → 12,4 Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero, aumentamos uma unidade no algarismo e desprezamos os seguintes. Ex.: 8,2502 (para décimos) → 8,3 8,4503 (para décimos) → 8,5 4a) Quando, arredondarmos uma série de parcelas, e a soma ficar alterada, devemos fazer um novo arredondamento (por falta ou por excesso), na maior parcela do conjunto, de modo que a soma fique inalterada. Ex.: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100% Arredondando para inteiro: 17% + 18% + 12% + 30% + 22% = 99% 17% + 18% + 12% + 31% + 22% = 100%

7. LITERATURA CONSULTADA ARA, A. B.; MUSETTI, A. V.; SHNEIDERMAN, B. Introdução à estatística. São Paulo: Egard Blucher: Instituto Mauá de Tecnologia, 2003.152p. CARVALHO, S. Estatística básica. Rio de Janeiro: Campus-Elsevier, 2006. 464p. FERREIRA, D. F. Estatística básica. Lavras: UFLA, 2005. 664p. REGAZZI, A. Curso de iniciação à estatística (Apostila). Universidade Federal de Viçosa, Viçosa – MG, 1997. 136p. TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005. 656p. Este conteúdo é resultado de pesquisas em vários livros e apostilas de estatística básica e aplicada,, portanto, ainda deve ser revisado. Qualquer erro de digitação (ou outro qualquer), sugestões, críticas, etc., por favor, me comuniquem. Obrigada, Profa. Gisele

9

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF