Download Apostila Fundamentos Da Estatística para Metrologia...
FUNDAMENTOS DA ESTATÍSTICA PARA METROLOGIA Prof. Pedro Paulo Novellino do Rosário, M.Sc. (021) 99948.6288
[email protected]
1. ESTATÍSTICA ESTATÍSTICA APLICADA A METROLOGIA
SUMÁRIO 1.1. Apresentaçãoaleatórios dos dados Experimentos Dados não agrupados Dados agrupados em rol Dados agrupados por valor Histograma 1.2. Medidas de tendência central e medidas de dispersão Média da população, média da amostra, mediana, moda Amplitude Variância da população e variância da amostra Desvio padrão da população e desvio padrão da amostra Coefciente de variação
1.3. Distribuições de probabilidades Distribuição discreta e connua Média, variância e desvio padrão de uma distribuição
de probabilidade Distribuição uniorme ou retangular Distribuição triangular Distribuição em orma de U Distribuição Distribuição normal normal padronizada Distribuição t-Student Fator de abrangência
1.4. Teorema central do limite Combinação de distribuições Teorema central do limite
1.5. Exemplos de aplicações de distribuições de probabilidade
Critério de Chauvenet: rejeição de uma leitura Incerteza da resolução de leitura: estudo de duas situações disntas Incerteza da histerese
1. Estasca Aplicada a Metrologia Neste curso você aprenderá os conceitos e as principais, e necessárias, erramentas estascas. Entretanto, nossa abordagem será na eeva eeva ulização destes conteúdos para as aplicações da Metrologia. Não discuremos, por exemplo, arranjos, permutações, combinações, espaço amostral, técnicas de amostragem ..., e sim ormas de apresentação e tratamento de dados mensurados, medidas de tendência central e de dispersão (tais como média, amplitude, variância, desvio padrão, coefciente de variação) e as principais distribuições de probabilidade adotadas no estudo da Metrologia (uniorme, triangular, normal, t -Student -Student e orma de U). E o mais importante, como aplicar corretamente essas erramentas!
3
Aqui caberia uma pergunta: mas por quê precisamos conhecer essas erramentas estascas para trabalhar na Metrologia? Bem, é sabido que toda medida realizada apresenta uma incerteza de medição associada e que, dependendo do po e da qualidade do instrumento ou do sistema ulizado, pode ser pequena, ou não, comparavamente alando com o resultado da medição propriamente dita. Desta orma, podemos afrmar que: RM = X + U onde RM = expressão do resultado fnal da medição, X = valor da medição (ou da média das medições) realizada e U = incerteza da medição.
4
No Vocabulário Internacional de Metrologia (também conhecido por VIM-2012) encontramos a seguinte defnição para a Incerteza de Medição: caracteriza a a dispersão dispersão dos valores “ parâmetro não negavo que caracteriz atribuídos a um mensurando ... ” O VIM-2012 cita, ainda, que “o parâmetro pode ser um desvio desvio padrão padrão (incerteza padrão) ou a metade da amplitude de um intervalo tendo uma probabilidade de abrangência determinada.”
Percebemos, então, que a incerteza de medição é um parâmetro avaliado por meio de algumas erramentas erramentas estascas.
5
1.1. Apresentação dos Dados
Em uma medição existem diversos atores metrológicos que podem inuenciar no seu resultado, uns mais, outros menos. Assim, utuações naturais podem implicar que medições repedas nem sempre apresentem valores iguais, ou seja, cada ator pode inuenciar dierentemente no sistema de medição, podendo inclusive ocasionar erros.
6
Medições são experimentos podem ser obteremos repedos indefnidamente, e uma vez aleatórios repedos, eprovavelmente resultados dieren dierentes. tes. Experimentos aleatórios estão associados a um espaço amostral, ou população. A população N é é defnida como todos os elementos que estão disponíveis para uma avaliação. Essa população pode ser um número fnito (por exemplo, o total de moradores de um prédio) ou infnito (por exemplo, o conjunto de números naturais). Uma amostra n representa uma parcela da população, mas que deve ser rerada de modo a apresentar as caracteríscas e representar adequadamente essa população de origem.
7
Exemplo: medição de um produto com uma balança Podemos considerar que a população N é infnita, pois não há um número fnito de medições possíveis de serem realizadas. Entretanto, quando estabelecemos um determinado número de medições (em uma calibração ou verifcação, por exemplo) estamos criando uma amostra n. Assim, se defníssemos 5 medições, teríamos n = 5; 10 medições, n = 10.
8
Finalizado esseuma processo de medição obtém-se da um medição. determinado valor que representará esmava do resultado A parr do resultado dessa amostra e atribuindo-se um determinado grau de confança, pode-se analisar o comportamento da balança como um todo. Conclusões obdas com base em uma amostra, ou quandade de dados, agilizam o processo de medição e reduzem cust custos. os. Por isso que a análise estasca é undamental para a Metrologia, pois possibilita a descrição dos dados a parr de medidas de tendência central, medidas de dispersão, distribuição de probabilidades, seguido da análise e interpretação interpret ação dos resultados obdos.
9
Dados não agrupados A norma ABNT NBR 14105, por exemplo, estabelece que a temperatura do local de calibração de manômetros po Bourdon deve estar compreendida entre (20 ± 2) °C. Foram realizadas 80 medições ao longo de um dia e os resultados obdos encontram-se a seguir. Pergunta: Todas as medições estão dentro do intervalo de tolerância estabelecido pela norma?
10
Vamos realizar outras perguntas. Qual oi o valor que preponderou p reponderou no conjunto de medições? As medições variaram muito ou pouco? Já pensaram se ao invés de 80 medições véssemos 8 000? Concordam que deve haver uma orma mais adequada de dispor esses dados para acilitar as respostas?
11
Dados agrupados: Rol O rol consiste rol em agrupar os colocar dados em de ordem orma crescente crescente,deou decrescente. Para o exemplo da temperatura vamos valores. 18 18 19
18 18 19
18 18 19
18 18 19
18 18 19
18 18 19
18 18 19
18 19 19
19 19 20 21 21 21
19 20 20 21 21 21
19 20 20 21 21 21
19 20 20 21 21 22
19 20 20 21 21 22
19 20 21 21 21 22
19 20 21 21 21 22
19 20 21 21 21 22
22
22
22
22
22
22
22
22
Com o rol fca ácil responder se os resultados estão dentro da tolerância. Basta olhar o primeiro (18 °C) e o úlmo (22 °C). Mas ainda não está tão imediato responder as outras perguntas!
12
Dados agrupados por valor Signifca ordenar semelhante com semelhante, ou seja, agrupar valores iguais em classes dispondo-os em uma tabela, que tem o nome de distribuição de requências. Existem quatro pos de requências: • requência absoluta simples ( a) • requência absoluta acumulada (Fa) • requência relava simples ( r) • requência relava acumulada (Fr)
13
• Frequência absoluta simples (f a):
Corresponde ao número de ocorrências de um valor dentro de uma classe. 18 18 19 19 19 20 21 21 21 22
18 18 19 19 20 20 21 21 21 22
18 18 19 19 20 20 21 21 21 22
18 18 19 19 20 20 21 21 22 22
18 18 19 19 20 20 21 21 22 22
18 18 19 19 20 21 21 21 22 22
18 18 19 19 20 21 21 21 22 22
18 19 19 19 20 21 21 21 22 22
Valor °C 18
f a 15
19 20 21 22
18 12 22 13 80
(soma)
Por essa tabela podemos observar que o valor preponderante oi 21 °C, que apareceu 22 vezes!
14
• Frequência absoluta acumulada (Fa):
Corresponde à soma das requências absolutas da classe atual com o somatório das requências imediatamente anteriores a ela. Valor °C
f a
Fa
18 19 20 21 22
15 18 12 22 13
15 33 45 67 80
Por essa tabela observa-se que mais da metade dos dados (45 de 80) está entre 18 e 20 °C!
15
• Frequência relava relava simples (f r):
É a razão entre a requência absoluta simples da classe e o tamanho da amostra(n). Valor °C 18
f a 15
f r 18,75 %
19 20 21 22
18 12 22 13 80
22,5 % 15 % 27,5 % 16,25 % 100%
f r =
Por essa tabela percebe-se que os valores de 19 e 21 °C juntos representam 50% dos valores. Os 50% restantes estão distribuídos por 18, 20 e 22 °C.
16
•
Frequência relava acumulada (Fr Corresponde à soma imediatamente das requênciasanterior. relavas da classe atual com o somatório das requências relavas Valor °C
f a
f r
Fr
18 19 20
15 18 12
18,75 % 22,5 % 15 %
18,75 % 41,25 % 56,25 %
21 22
2 12 3
1267,,255%%
8130,705%%
Por essa tabela observa-se que mais da metade dos dados (56,25 %) está entre 18 e 20 °C!
17
Histograma O histograma é um gráfco de barras retangulares que permite visualizar a distribuição das requências relavas, ou absolutas, do conjunto de dados. A base de um retângulo representa uma classe da tabela de requências. A altura da barra é proporcional ao valor da requência conda na classe. A escala horizontal do gráfco é quantava. A escala vercal indica a requência absoluta ou relava. Histograma No exemplo verifca-se que o valor 2,1 tem a maior requência (35). 40 30 Além de ser o valor mais recorrente é o 20 valor central do conjunto de dados. Os 10 demais valores estão dispersos no 0 entorno desse valor central. 1,1 1,4 1,6 1,8 2,1 2,3 2,5 2,7 M aaiis a i
n c ê u q e r f
intervalo
18
Como desenvolver um Histograma? Temperatura ((°C) °C) 49,63 49,64
49,59
49,60
49,66
49,68
Ex.: Considere o conjunto de dados como 60 valores de
49,59
49,61
49,63
49,65
49,67
49,68
49,59
49,62
49,63
49,65
49,67
49,68
temperatura de um orno de temperatura calibração, estabilizado em torno de 50,00 °C.
49,59
49,62
49,64
49,65
49,67
49,69
49,60
49,62
49,64
49,66
49,67
49,69
49,60
49,62
49,64
49,66
49,67
49,69
49,60
49,62
49,64
49,66
49,67
49,69
49,60
49,62
49,64
49,66
49,67
49,70
49,60
49,62
49,64
49,66
49,67
49,70
49,60
49,63
49,64
49,66
49,68
49,70
19
É possível obter um histograma ulizando o soware Excel. Como fazer isso?
20
1.2. Medidas de Tendência Central e Medidas de Dispersão MEDICÃO COLETA DE DADOS VALORES DISTINTOS DISTINTOS
VALORES AGRUPADOS AGRUPADOS ALEATORIAMENTE ALEATORIAMENTE EM TORNO DE UM VALOR MAIS PROVÁVEL
ESTATÍSTICA –medidas medidasdededispersão tendência central e
21
Medidas de Tendência Central Média da População (μ) Corresponde à soma de todos os valores pertencentes ao conjunto dividido pelo número de dados do conjunto.
A população n pode ser fnita (ex.: total de alunos de uma escola) ou infnita (ex.: número de medições eitas por um instrumento). Quando n → , usamos uma amostra com n fnito, e a média será representada pela média amostral (). 22
Média Amostral () A expressão é idênca à da média µ, entretanto, n é o tamanho da amostra e não da população:
43,0
32,0
45,0
Massa de um produto em kg 37,0 41,0 48,0 44,0 35,0
49,0
=
1
∑ =
1
39,0
39,0
52,0
23
Mediana É o número central de um grupo de números. Se houver uma quandade par de números, a mediana é a média dos dois números do meio. Massa de um produto em kg 43,0
43,0
32,0
32,0
45,0
45,0
37,0
37,0
41,0
48,0
44,0
35,0
49,0
Massa de um produto em kg 41,0 48,0 44,0 35,0 49,0
39,0
39,0
39,0
39,0
38,0
52,0
52,0
24
Moda É o número que ocorre comMassa mais requência em um grupo de números. de um produto em kg 43,0
32,0
45,0
37,0
41,0
48,0
44,0
18 18 19
17 20 19
18 18 19
18 18 19
21 18 19
18 18 19
18 19 19
18 19 19
19 19 20 21 21 21 22
19 20 20 21 23 21 22
20 20 18 21 21 21 22
19 20 20 21 21 22 22
19 20 20 20 19 20 20
19 20 21 20 20 22 22
19 20 21 21 23 21 22
19 20 21 21 21 22 22
35,0
49,0
39,0
39,0
52,0
25
Medidas de Dispersão As medidas de tendência central ornecem apenas o valor do centro dos dados. Elas não indicam como está a dispersão dos valores entorno do valor central. Exemplo: as fguras possuem o mesmo valor central, entretanto, a curva azul possui a menor dispersão de valores e a vermelha a maior.
26
Amplitude É a medida de dispersão mais simples, e corresponde a dierença entre o maior e o menor valor do conjunto de dados.
Valores em °C
18 18 19 19 19 20 21 21 21 22
18 18 19 19 20 20 21 21 21 22
18 18 19 19 20 20 21 21 21 22
18 18 19 19 20 20 21 21 22 22
18 18 19 19 20 20 21 21 22 22
18 18 19 19 20 21 21 21 22 22
18 18 19 19 20 21 21 21 22 22
18 19 19 19 20 21 21 21 22 22
A = Xmáximo - Xmínimo
A amplitude é usada na montagem de um histograma. 27
Apesar de ser uma medida de dispersão, a Amplitude não considera, e também não é inuenciada, pelos valores intermediários. Mesmo aumentando o número de dados a Amplitude nunca diminuirá. Ela poderá até aumentar. Por exemplo, se em três novas medições encontrarmos 18, 20 e 19 °C, a amplitude permanece 4 °C. Porém, se em uma nova medição encontrarmos 17 ou 23 °C, a amplitude aumenta para 5 °C (22-17 ou 2318).
28
Variância da população (2) A variância da população é o somatório dos desvios ao quadrado, que corresponde à dierença de cada valor do conjunto de dados em relação à média .
2= ( ) =
= ( ) = ( ) = ¿ 2
¿
29
Variância Amostral (s²) Como na metrologia trabalhamos com amostras, temos a média . Assim, iremos ulizar a variância amostral s². A unidade de medida da variância corresponde à unidade da grandez grandezaa ao quadrado, exceto quando se tratar de grandezas adimensionais, como por exemplo o pH ou o índice de reração. Veremos que a variância será úl na esmava da incerteza de medição, entretanto, ela é pouco práca na apresentação da dispersão pois sua unidade é ao quadrado. Dessa orma, precisamos recorrer ao desvio padrão.
30
Desvio Padrão Amostral (s) O desvio padrão amostral (s) descreve a variação do conjunto na unidade original da medida, a parr da raiz quadrada da variância.
Dessa orma, o desvio padrão torna-se muito úl para descrever a variabilidade do conjunto de dados quando comparado à amplitude e à variância. O desvio padrão amostral e a média aritméca são, sem dúvida, as medidas estascas mais ulizadas no conte contexto xto metrológico.
31
Coeciente de Variação (CV)
O coefciente de variação, ou desvio padrão relavo, trata-se de uma medida sem unidade e representa a relação entre o desvio padrão e a média aritméca.
=
.100
O CV é ulizado para comparar dispersões de resultados de medições provenientes de grandezas disntas, uma vez que o desvio padrão depende da grandeza que está sendo medida. O CV tem aplicação na propagação da incerteza de medição por meio de incertezas relavas.
32
Exemplo:: Considere o circuito ao lado. Exemplo Foram realizadas 5 medições da tensão e da corrente elétrica, e o resultado encontra-se na tabela abaixo. Grandeza Tensão (V) Corrente (A)
Medições Média s 1 2 3 4 5 200,21 200,22 200,10 199,99 199,90 200,08 0,139 1,992 2,020 1,986 1,990 1,989 1,995 0,0139
Pergunta: qual grandeza apresentou a maior variação, a tensão ou a corrente elétrica?
33
1.3. Distribuição de Probabilida Probabilidades des A distribuição de probabilidades descreve a probabilidade do valor de uma variável ocorrer dentro de um intervalo de valores especifcados. São unções que possuem um domínio x , correspondente aos valores da variável sob estudo, e uma imagem f(x), correspondente à probabilidade da variável assumir dierentes valores do domínio.
Probabilidade P(a