Matemática Superior para Engenharia - Volume 3 - Ed. 9 -Kreyszig, Erwin.pdf

June 19, 2018 | Author: Inacio Wanderley | Category: Numerical Analysis, Algorithms, Limit (Mathematics), Equations, Mathematical Concepts
Share Embed Donate


Short Description

Download Matemática Superior para Engenharia - Volume 3 - Ed. 9 -Kreyszig, Erwin.pdf...

Description

PARTE

E

Análise Numérica Programa Computacional C A PÍ TU L O 19 Métodos Numéricos em Geral CAPÍTULO 20 Métodos Numéricos de Álgebra Linear CAPÍTULO 21 Métodos Numéricos para EDOs e EDPs A análise numérica preocupa-se com os métodos numéricos, ou seja, os métodos para resolver problemas em termos de números ou de representações gráficas correspondentes. Ela também inclui a investigação da extensão da aplicabilidade, bem como a precisão e a estabilidade desses métodos. Tarefas usuais em análise numérica são o cálculo de valores de integrais definidas, a obtenção de solução de equações e sistemas lineares, a solução de equações diferenciais ou integrais para as quais inexistem fórmulas de solução e o cálculo de valores de dados experimentais para os quais desejamos obter, por exemplo, um polinômio de aproximação. Os métodos numéricos fornecem, portanto, uma transição de um modelo matemático para um algoritmo, ou seja, uma detalhada receita para se resolver um determinado problema a ser resolvido por programação em seu computador, utilizando um sistema de álgebra computacional (SAC) ou algum outro programa, ou mesmo uma calculadora programável. Neste e nos dois capítulos seguintes, explicamos e ilustramos os métodos numéricos fundamentais mais freqüentemente utilizados em forma algorítmica. O Capítulo 19 trata dos métodos numéricos em geral; o Capítulo 20, da álgebra linear numérica e, em particular, dos métodos empregados na solução de sistemas lineares e de problemas de autovalores de matrizes; e o Capítulo 21 trata dos métodos numéricos aplicados às EDOs e EDPs. Os algoritmos fornecidos modo mostrar da melhor forma possível o funcionamento de estão cada método. Sugerimos quesão você também de faça uso ados programas comerciais ou de domínio público que listados ao final deste texto ou que podem ser obtidos na Internet. Os métodos numéricos vêm cada vez mais ganhando importância em engenharia, mais do que em qualquer outro campo da matemática, em virtude do contínuo desenvolvimento de poderosas técnicas de programação resultantes de uma extensa atividade de pesquisa nessa área, através da invenção de novos métodos, do aperfeiçoamento e adaptação de métodos já existentes e também da redescoberta de outros métodos antigos, que não tinham praticidade na era pré-digital. Um dos principais objetivos dessas atividades é o

2

Parte E • Análise Numérica

desenvolvimento de programas bem estruturados de computador. E, em situações de trabalho de grande escala — com milhões de equações ou etapas de iteração — mesmo pequenos aperfeiçoamentos algorítmicos podem exercer um grande efeito no tempo de computação, da demanda de armazenamento, na precisão e na estabilidade. Em média, isto tem feito com que os algoritmos utilizados na prática venham ficando cada vez mais complicados. Entretanto, quanto mais sofisticados os modernos programas se tornam, maior fica a importância de termos uma compreensão básica dos conceitos e algoritmos, a fim de conhecermos idéias srcinais, motivadoras e de recente desenvolvimento.

Para evitar mal-entendidos: há diversos métodos clássicos e simples que ainda são bastante úteis em várias situações rotineiras e que produzem resultados satisfatórios. Em outras palavras, nem tudo tem-se tornado mais sofisticado.

Programa Computacional Veja também www.ltceditora.com.br A lista a seguir ser-lhe-á útil caso você deseje encontrar programas de computador. Também é possível obter informações sobre programas, tanto os novos como os já conhecidos, por meio de revistas, como a Byte Magazine ou a PC Magazine, de artigos publicados pela American Mathematical Society (veja também seu site na web em www.ams.org), pela Society for Industrial and Applied Mathematics(SIAM, em www. siam.org), Association for Computing Machinery (ACM, em www.acm.org) ou pelo Institute of Electrical and Electronics Engineers(IEEE, em www.ieee.org). Consulte também sua biblioteca, o departamento de ciências da computação ou ainda o departamento de matemática de sua instituição. Derive. Texas Instruments, Inc., Dallas, TX. Tel.: 1-800-842-2737 ou (972) 917-8324, site na web em www. derive.com ou www.education.ti.com. EISPACK. Veja LAPACK. GAMS (Guide to Available Mathematical Software). Site na web em http://www.gams.nist.gov. Índice cruzado on-line de desenvolvimento de programas da NIST, com links com o IMSL, NAG e NETLIB. IMSL (International Mathematical and Statistical Library). Visual Numerics, Inc., Houston, TX. Tel.: 1-800222-4675 ou (713) 784-3131, site na web em www.vni.com. Rotinas Fortran com gráficos para matemática e estatística. LAPACK. Rotinas de Fortran 77 para álgebra linear. Este pacote de programas é posterior ao LINPACK e ao EISPACK. Pode-se baixar as rotinas ou solicitá-los diretamente à NAG. Há um LAPACK User’s Guide disponível em http://netles.sandia.gov/master/readme.html LINPACK. Veja LAPACK. Maple. Waterloo Maple, Inc., Waterloo, ON, Canadá. Tel.: 1-800-267-6583 ou (519) 747-2373, site na web em www.maplesoft.com. Maple Computer Guide. Para este livro — Matemática Avançada para Engenharia —, 9a Ed., de E. Kreyszig e E. J. Norminton. J. Wiley and Sons, Inc., Hoboken, NJ. Tel.: 1-800-225-5945 ou (201)748-6000, site na web www.wiley.com/wileyCDA. MathCad. MathSoft, Inc., Cambridge, M.A., Tel.: 1-800-628-4223 ou (617) 444-8000, site na web em http://www.ptc.com/appserver/mkt/products/resource/mathcad/index.jsp? Mathematica. Wolfram Research, Inc., Champaign, IL. Tel.: 1-800-965-3726 ou (217) 398-0700, site na web em www.wolframresearch.com.

Capítulo 19: Métodos Numéricos em Geral

3

Mathematica Computer Guide. Para Matemática Avançada para Engenharia, 9 a edição, de E. Kreyszig e E. J. Norminton. J. Wiley and Sons, Inc., Hoboken, NJ. Tel.: 1-800-225-5945 ou (201) 748-6000, site na web em www.wiley.com/wileyCDA. Matlab. The Matlab Works, Inc., Natick, MA. Tel.: (508) 647-7000, site na web em www.mathworks. com. NAG. Numerical Algorithms Group, Inc., Downders Grove, IL. Tel.: (630) 971-2337, site na web em www. nag.com. Rotinas numéricas em Fortran 77, Fortran 90 e C. NETLIB. Extensa biblioteca de software de domínio público. Veja em www.netlib.org e http://netlib.sendia. gov/master/readme.html. NIST. National Institute of Standards and Technology, Gaithersburg, MD. Tel.: (301) 975-2000, site na web em www.nist.gov. Contatos com a Mathematical and Computational Science Division, tel.: (301) 975-3800. Veja também http://math.nist.gov. Numerical Recipes. Cambridge University Press, New York, NY. Tel.: (212) 924-3900, site na web em www.cambridge.org/us. Livros (e também códigos-fonte em CD-ROM) contendo rotinas numéricas em C, C++, Fortran 77 e Fortran 90. Pedidos no escritório de West Nyack, NY, em 1-800-872-7423 ou (845) 3537500 ou on-line em www.numerical-recipes.com. OUTROS PROGRAMAS COMPUTACIONAIS DE ESTATÍSTICA . Ver a Parte G.

CAPÍTULO

19

Métodos Numéricos em Geral O primeiro capítulo sobre métodos numéricos começa com uma explicação de alguns conceitos gerais, como ponto de flutuação, erros de arredondamento e erros numéricos em geral e sua propagação. Na Seção 19.2, discutiremos para A resolver Os métodos interpolação, dos splines, seguemse nas Seçõesmétodos 19.3 e 19.4. últimaequações. seção (19.5) refere-sede à integração e àincluindo derivaçãoo numéricas. O propósito deste capítulo é duplo. Primeiro, para todas estas tarefas, o aluno deverá familiarizar-se com os métodos numéricos de solução mais básicos (embora não por demais complicados). Eles são indispensáveis ao engenheiro porque, para muitos problemas, não existe uma fórmula de solução (imagine, por exemplo, uma integral complicada, ou um polinômio de alto grau ou a interpolação de valores obtidos através de medições). Em outros casos, uma fórmula complicada de solução pode existir, porém não pode ser utilizada na prática. O segundo propósito deste capítulo é fazer com que a aprendizagem dos alunos lhes permita compreender algumas idéias e conceitos básicos que se constituem em importantes métodos completos, como a forma prática de algoritmos, a estimativa de erros e a ordem de convergência. Pré-requisito: Cálculo elementar Referências e Respostas dos Problemas: Parte

E do Apêndice 1 e Apêndice 2

19.1 Introdução Os métodos numéricos são utilizados para resolver problemas em computadores e calculadoras através de cálculos numéricos, resultando em uma tabela de números e/ou representações gráficas (figuras). As fases que vão de uma dada situação (em engenharia, economia etc.) até a resposta final são geralmente as seguintes: 1. Modelagem. Estabelecemos um modelo matemático para nosso problema, como uma integral, um sistema de equações, ou uma equação diferencial. 2. Escolha de um método numérico e de parâmetros (p. ex., tamanho do passo de iteração), talvez com uma estimativa preliminar de erro. 3. Programação. Usamos o algoritmo para escrever um programa correspondente em um SAC, como Maple, Mathematica, Matlab ou Mathcad, ou, digamos, em Fortran, C, ou C++, selecionando rotinas compatíveis de um sistema de software conforme o necessário. 4. Realização do cálculo. 5. Interpretação dos resultados em termos físicos ou outros, também decidindo reexecutar o programa caso se necessitem de resultados posteriores.

As Etapas 1 e 2 estão relacionadas. Uma leve mudança do modelo pode muitas vezes permitir o uso de um método mais eficiente. Mas, para escolher os métodos, precisamos antes conhecê-los. Os Capítulos 19–21 contêm algoritmos eficientes para as classes mais importantes de problemas que ocorrem com freqüência na prática. Na Etapa 3, o programa consiste em dados fornecidos e em uma seqüência de instruções a serem executadas pelo computador em determinada ordem para produzir a resposta em forma numérica ou gráfica. Para criar uma boa compreensão da natureza do trabalho numérico, continuaremos nesta seção com algumas observações gerais simples.

Números em Forma de Ponto Flutuante Sabemos que, na notação decimal, cada número real é representado por uma seqüência finita ou infinita de dígitos decimais. Hoje, a maioria dos computadores tem duas maneiras de representar os números, chamadas de ponto fixo e ponto flutuante. Em um sistema de ponto fixo, todos os números são expressos com um número fixo de

Capítulo 19: Métodos Numéricos em Geral

5

decimais à direita da vírgula decimal; por exemplo: números expressos com 3 decimais são 62,358; 0,014; 1,000. Em um texto, escreveríamos, digamos, 3 decimais como 3D. As representações de ponto fixo não são práticas na maioria das computações científicas por causa de seu alcance limitado (explique!) e não nos interessarão. Em um sistema de ponto flutuante, escrevemos, por exemplo: 0,6247 10 3,

0,1735 10

6,247 10 2,

1,735 10





13

,

0,2000

,

2,000





10

1



ou, às vezes, também 



14





10 2. 

Vemos que, neste sistema, o número de dígitos significativos é mantido fixo, ao passo que a vírgula decimal é “flutuante”. Aqui, o dígito significativo de um número c é qualquer dígito dado de c, exceto, possivelmente, para zeros à esquerda do primeiro dígito não-zero; esses zeros servem apenas para fixar a posição da vírgula decimal. (Assim, qualquer outro zero é um dígito significativo de c.) Por exemplo: cada um dos números 1360, 1,360, 0,001360 tem 4 dígitos significativos. Em um texto, indicamos, por exemplo, 4 dígitos significativos por 4S. O uso de expoentes permite-nos representar números muito grandes e números muito pequenos. De fato, teoricamente qualquer número não-zero a pode ser escrito como (1)

a

 m



10 n,

0,1  m  1,

n

inteiro.

No computador, m limita-se a k dígitos (p. ex.: k = 8) e n é limitado, dando as representações (apenas para uma quantidade finita de números!) (2)

m dk, d1  0.  10 n,   0. d1d2 Esses números ā são freqüentemente chamados de números de máquina decimais de k dígitos. Sua parte fracionária m (ou m ) é chamada de mantissa. Isto nada tem a ver com a “mantissa” que se usa em logaritmos. n é chamado de expoente de ā. a

 m









Underflow e Overflow. O intervalo de expoentes com que um computador típico pode lidar é muito grande. O ponto flutuante padrão do IEEE (Institute of Electrical and Electronics Engineers) para a precisão simples (o

número usual debinárias dígitos ,nos é cerca de de –38base < n2).< [Para 38 (cerca de –125precisão < n* < dupla 125 para o expoente representações ou cálculos) seja, representações a chamada , é cerca de –308em< n < 308 (cerca de –1020 < n* < 1020 para representações binárias)]. Se, em um cálculo ocorrer um número fora desse intervalo faixa, isto é chamado de underflow quando o número é menor e de overflow quando ele é maior. No caso de underflow, o resultado é normalmente arredondado para zero e o cálculo prossegue. O overflow faz o computador parar. Os códigos-padrão (de IMSL, NAG etc.) são escritos de modo a se evitar o overflow. As mensagens de erro sobre overflow podem então indicar erros de programação (dados incorretos de entrada etc.).

Arredondamento Provocam-se erros por causa do corte (= o descarte de todos os números decimais de uma certa casa em diante) ou do arredondamento (aproximação). Esses erros são chamados de erros de arredondamento, independentemente de terem sido causados pelo corte ou pelo arredondamento propriamente dito. A regra para se arredondar um número para k decimais é a seguinte. (A regra de arredondamento para k dígitos significativos é a mesma, bastando-se substituir a expressão “decimal” por “dígito significativo”.) Regra de Arredondamento. Descarte o ( k + 1)-ésimo decimal e todos os decimais subseqüentes. (a) Se a parte assim descartada for inferior à metade da unidade situada na k-ésima casa, deixe o k-ésimo decimal inalterado (“arredondamento para baixo”). (b) Se a parte descartada for maior que a metade da unidade situada na k-ésima casa, aumente de uma unidade a k-ésima casa (“arredondamento para cima”). (c) Se a parte descartada for exatamente igual à meia unidade, arredonde para o decimal par mais próximo. (Exemplo: no arredondamento de 3,45 e 3,55 para uma casa decimal, obtemos 3,4 e 3,6, respectivamente.)

O propósito da última parte desta regra é garantir que, nos casos onde a parte descartada vale exatamente a metade de um decimal, os arredondamentos para mais e para menos venham, em média, a ser feitos com aproximadamente a mesma freqüência. Se arredondamos 1,2535 para 3, 2, 1 casas decimais, teremos 1,254; 1,25 e 1,3, mas se 1,25 for arredondado para uma casa decimal, sem informações adicionais, teremos 1,2.

6

Parte E • Análise Numérica

Simplesmente cortar os números à direita de uma certa casa não é recomendável, pois o erro correspondente pode ser maior do que o ocorrido no arredondamento, além de ser sistemático. (Não obstante, alguns computadores utilizam tal procedimento, pelo fato de ele ser mais simples e mais rápido. Por outro lado, alguns computadores e calculadoras aumentam a precisão de seus resultados fazendo cálculos intermediários que utilizam um ou mais dígitos extras, chamados de dígitos de guarda.) Erro de Arredondamento. Em (2), chamemos de a = fl(a) a aproximação de ponto flutuante que o computador faz de a em (1) utilizando o arredondamento, onde fl sugere flutuante. Então a aplicação da regra do arredondamento fornece (eliminando-se os expoentes) m  m   12 10 k. Como m  0,1, isto implica que (sendo a  0) 1 a  a mm   (3) 10 1 k.   2 a m 





  







O lado direito u  12 101 k desta equação é chamado de unidade de arredondamento. Se escrevermos a = a(1 + d), teremos, usando álgebra, que ( a  a)/a  d, logo, d  u por (3). Isto mostra que a unidade de arre

dondamento u é um limite de erro do arredondamento.

Os erros de arredondamento podem arruinar completamente um cálculo, mesmo quando ele for pequeno. Em geral, esses erros vão se tornando cada vez mais perigosos à medida que se aumenta o número de operações aritméticas a serem executadas (com esse número chegando às vezes a vários milhões!). Portanto, é importante que analisemos os programas computacionais com o propósito de descobrir erros esperados de arredondamento e de encontrar para os cálculos um arranjo que permita que os erros de arredondamento sejam os menores possíveis. Tampouco a aritmética dos computadores é exata e ela provoca outros erros; contudo, esses erros não serão relevantes à nossa discussão. Precisão nas Tabelas. Embora os programas disponíveis hoje em dia tenham tornado supérfluas diversas tabelas de valores de funções, algumas tabelas (de funções superiores, de coeficientes de fórmulas de integração etc.) ainda continuarão sendo de uso ocasional. Se uma tabela apresenta k dígitos significativos, presume-se, por convenção, que qualquer valor a na tabela se desvia do valor exato a por, no máximo,  12 unidade do k-ésimo dígito. 

Algoritmo. Estabilidade Os métodos numéricos podem ser formulados Um algoritmo é um processamento passo a passo que apresenta um método numérico sob umacomo formaalgoritmos. (um “pseudocódigo” ) compreensível aos seres humanos. (Vire algumas páginas para ver a aparência que tem um algoritmo.) Os algoritmos são então utilizados para se escreverem programas em uma linguagem de programação que seja compreendida pelo computador, de modo que este possa executar o método numérico. As seções a seguir apresentam alguns algoritmos importantes. Para as tarefas de rotina, pode ocorrer que seu sistema de álgebra computacional ou algum outro aplicativo contenha programas que você possa utilizar ou incluir como partes de programas que você mesmo criar. Estabilidade. Para ser útil, um algoritmo deve ser estável; ou seja, pequenas alterações nos dados iniciais devem causar apenas pequenas alterações nos resultados finais. Entretanto, se pequenas alterações nos dados iniciais provocarem grandes alterações nos resultados finais, chamaremos o algoritmo de instável. É preciso distinguir essa “instabilidade numérica”, que na maioria dos casos pode ser evitada com a escolha de um algoritmo melhor, da “instabilidade matemática” de um problema, a qual é também chamada de “mau condicionamento”, um conceito que discutiremos na próxima seção. Alguns algoritmos são estáveis somente para certos dados iniciais, de modo que é preciso que se tome cuidado em casos assim.

Erros de Resultados Numéricos Os resultados finais de cálculos de quantidades desconhecidas geralmente são aproximações; ou seja, não são exatos, mas envolvem erros, os quais podem resultar de uma combinação dos seguintes efeitos: os erros de arredondamento, resultantes dos procedimentos de arredondamento, conforme já discutimos; os erros experimentais, encontrados nos dados fornecidos (provavelmente surgindo das medições); os erros de truncamento, resultantes dos procedimentos de truncamento (interrupção prematura), por exemplo, quando substituímos uma série de Taylor pela soma de seus primeiros termos. Esses erros dependem do método computacional empregado e devem ser tratados individualmente, dependendo de cada método. [Às vezes, o termo “truncar” é usado como um sinônimo de “cortar” (ver o que já dissemos deste último), uma terminologia que não recomendamos.]

7

Capítulo 19: Métodos Numéricos em Geral

Fórmulas para Erros. Se a é um valor aproximado de uma quantidade cujo valor exato é a, chamamos a diferença 

e= a– a

(4)



de erro de a . Logo, 

(4*)

a



a





e,

Valor verdadeiro  Aproximação  Erro.

Por exemplo: se a = 10,5 for uma aproximação de a = 10,2, seu erro será e = –0,3. Já para uma aproximação a = 1,60 de a = 1,82, o erro é e = 0,22. 



CUIDADO! Na literatura, as expressões a – a  (“erro absoluto”) ou a – a também são às vezes utilizadas como definições de erro. O erro relativo er de a é definido como e Erro aa (a  0). (5) er     a Valor verdadeiro a 







 

Isso parece inútil, visto que a é desconhecido. Mas, se e for muito menor do que a , então podemos usar a em vez de a e obter 

(5)

er



e  a 



.

Isso ainda parece problemático, pois e é desconhecido — se conhecêssemos e, de (4) obteríamos a = a + e e o problema estaria resolvido. Mas o que podemos com freqüência obter na prática é um limite de erro para a , ou seja, um número b tal que 



e  b,

a  a   b.

logo,



Isto nos mostra o quanto o a desconhecido pode ficar longe do nosso a calculado. De modo semelhante, para o 

erro relativo, um limite de erro é um número br tal que er  br, logo,

  a



a

a





br .

Propagação de Erros Este é um assunto importante e refere-se à maneira como os erros ocorridos na etapa inicial e em etapas posteriores (os de arredondamento, por exemplo) vão se propagando pelos cálculos e afetando a exatidão, às vezes de modo bastante drástico. Podemos dizer que os limites de erro se somam na adição e na subtração, ao passo que os limites de erro relativo se somam na multiplicação e na divisão. É bastante aconselhável ter isso em mente. TEOREMA 1

Propagação de Erros

(a) Na adição e na subtração, um limite de erro para os resultados é dado pela soma dos limites de erro para os termos. (b) Na multiplicação e na divisão, um limite de erro para o erro relativo dos resultados é dado (aproximadamente) pela soma dos limites para os erros relativos dos números dados. PROVA

(a) Utilizemos as notaçõesx  x  e1, y  y  e2, e1  b1, e2  b2. Então, para o erroe da diferença, obtemos 



e  x  y  ( x  y ) 





x  x  ( y  y ) 



 e1  e2  e1  e2  b1  b2. A prova para a soma é semelhante e deixamo-la a cargo do aluno.

8

Parte E • Análise Numérica

(b) Para o erro relativo er de x y, obtemos dos erros relativos er1 e er2 de x, y e dos limites br1, br2 xy  ( x  e1)( y  e2) e 1y  e2x  e1e2 xy  x y er    





   .             

xy

xy

e1 y



xy

e2 x



e1

 x

e2





y

xy

er1



er2





br1



br2

Esta prova mostra o que o termo “aproximadamente” significa: desprezamos o produto e1e2 como tendo um pequeno valor absoluto comparado a e1 e e2. A prova para o quociente é semelhante, embora ligeiramente mais complicada (veja o Problema 15). 

Princípio Básicodevedoser Erro Todo método numérico acompanhado de uma estimativa de erro. Se uma fórmula para isto não estiver

disponível, for extremamente complicada ou não puder ter seu valor calculado por envolver informações não disponíveis (nas derivadas, por exemplo), o que se segue pode ajudar.

Estimativa de Erro por Comparação. Faça um mesmo cálculo duas vezes, porém com exatidões diferentes. Considere a diferença a2  a 1 dos resultados a1, a 2 como uma estimativa a (talvez grosseira) do erro e1 do resultado inferior a1. De fato, a 1  e1 = a 2  e2 pela fórmula (4*). Isto implica a 2  a 1  e1  e2  e1, visto que a 2 é geralmente um valor mais preciso do que a 1, de modo que e2 é pequeno em comparação com e1. 





















Perda de Dígitos Significativos Isto significa que o resultado de um cálculo tem menos dígitos corretos do que os números a partir dos quais ele foi obtido, por exemplo, 0,1439 – 0,1426 (“cancelamento subtrativo”). Ele pode ocorrer em problemas simples, mas pode ser evitado na maioria dos casos por meio de uma simples troca no algoritmo — desde que se esteja ciente disto! Ilustremos isto com o seguinte problema básico: EXEMPLO 1

Equação Quadrática. Perda de Dígitos Significativos Encontre as raízes da equação x2



40 x  2



0,

usando no cálculo 4 dígitos significativos (abreviados como 4S).

Solução. Uma fórmula para as raízes x1, x2 de uma equação quadrática ax2 + bx + c = 0 é (6)

x1





1  ( b  b2  4 ac ), 2a

x2





1 ).  ( b  b2  4 ac 2a

Além disso, como x1x2 = c/a, uma outra fórmula para essas raízes é (7)

x1 como antes,

x2



c

. ax 1

De (6), obtemos x  20  398   20,00  19,95. Isto fornece x1  20,00  19,95  39,95, o que não envolve qualquer dificuldade, ao passo que x2  20,00  19,95  0,05 é um resultado ruim porque envolve a perda de dígitos significativos. Por outro lado, (7) fornece x1  39,95, x2  2,000/39,95  0,05006, com o erro sendo menor que a unidade situada no último dígito, conforme um cálculo envolvendo mais dígitos pode mostrar. (O valor 10S é 0,05006265674.)

Comentário. Para evitar equívocos, usou-se 4S por conveniência; (7) é melhor do que (6), independentemente do número de dígitos usado. Por exemplo: por (6), o cálculo 8S é x1 = 39,949 937, x2 = 0,050 063, o que é um resultado ruim, ao passo que, em (7), x1 é como antes e x2 = 2/x1 = 0,050 062 657. Em uma equação quadrática com raízes reais, se x2 tiver um valor absoluto máximo (porque b > 0), use (6) no lugar de x2 e então x1 = c/(ax2). 

PROBLEMAS PROPOSTOS 19.1 1. (Ponto flutuante) Escreva 98,17; –100,987; 0,0057869; –13600 3. Pequenas diferenças entre números grandes podem ser basem forma de ponto flutuante e arredondando para 4S (4 dígitos tante afetadas particularmente por erros de arredondamento. significativos). Ilustre isso computando 0,36443/(17,862 – 17,798) conforme dado com 5S, e depois arredondando paulatinamente para 4S, 2. Escreva –0,0286403; 11,25845; –31681,55 em forma de ponto 3S e 2S, onde “paulatinamente” significa que se devem arreflutuante e arredondando para 6S.

Capítulo 19: Métodos Numéricos em Geral

dondar os números arredondados e não os números srcinalmente dados. 4. Repita o Problema 3 com números de sua própria escolha e que forneçam resultados com diferenças ainda mais drásticas. Como pode você evitar essas dificuldades? 5. O quociente do Problema 3 está na formaa/(b – c). Escreva-o como a(b + c)/(b2 – c2). Calcule-o primeiro com 5S, depois arredondando o numerador 12,996 e o denominador 2,28 paulatinamente como no Problema 3. Compare e comente. 6. (Equação quadrática) Resolva x2 – 20x + 1 = 0 por (6) e por (7), usando 6S no cálculo. Compare e comente. 7. Faça os cálculos do Problema 6 com 4S e 2S. 8. Resolva: x2 – 100x + 2 = 0 por (6) e (7) com 5S e compare. 9. Calcule: 1/e = 0,367879 (6S) usando as somas parciais de 5 a 10 termos da série de Maclaurin: (a) dee–x com x = 1, (b) de ex com x = 1 e calculando depois o recíproco. Qual é o resultado mais preciso? 10. A adição com um número fixo de dígitos significativos depende da ordem em que os números são somados. Ilustre esse fato com um exemplo. Descubra uma regra empírica para a melhor ordem. 11. As aproximações de = 3,141 592 653 589 79 são 22/7 e 355/113. Determine com 3 dígitos significativos os erros correspondentes e os erros relativos. 12. Compute p usando a aproximação de Machin 16 arctan (1/5) – 4 arctan (1/239) para 10S (que é um resultado correto). (Em 1986, D. H. Barley calculou quase 30 milhões de decimais de p em um CRAY-2 em menos de 30 horas. E a corrida para encontrar cada vez mais decimais ainda continua.) 13. (Arredondamento e soma). Consideremos que a1, , an sejam números com os aj arredondados corretamente atéDj decimais. Ao calcularmos a somaa1 + + an, retendo D = min Dj decimais, qual opção é essencial: primeiro somar e depois arredondar o resultado, ou primeiro arredondar cada número paraD decimais e depois somar? •

















9

14. (Teoremas sobre erros) Prove o Teorema 1(a) para a adição. 15. Prove o Teorema 1(b) para a divisão. 16. No Exemplo 1, mostre que o valor absoluto do erro dex2 = 2,000/39,95 = 0,05006 é inferior a 0,00001. 17. Overflowe underflowpodem às vezes ser evitados por meio de simples mudanças em uma fórmula. Explique isso em termos de x2  y2  x1  (y/ x)2 com x 2  y 2 e um x tão grande que x2 causaria overflow. Crie seus próprios exemplos. 18. (Forma aninhada) Calcule o valor de: ƒ(x)  x 3  7,5 x 2  11,2x  2,8  (( x  7,5)x  11,2)x  2,8 em x = 3,94 usando uma aritmética de 3S e arredondando, nas duas formas dadas. A última forma, chamada deaninhada, é geralmente preferível, visto que ela minimiza o número de operações e, conseqüentemente, o efeito do arredondamento. 19. EXPERIMENTO DE ÁLGEBRA COMPUTACIONAL. Corte e Arredondamento. (a) Considere x = 4/7 e y = 1/3. Encontre os erros ecorte, earred e os erros relativoser,cor, er,arred ocorridos devido aos cortes e aos arredondamentos para 5S emx  y, x  y, xy, x /y. Experimente com outras frações de sua escolha. (b) Represente em um mesmo gráficoecorte e earred (até 5S) de k/21 como funções de k = 1, 2, 21. A partir do gráfico, que valor médio se pode perceber paraecorte? E para earred? Experimente com outros números inteiros que forneçam gráficos similares. Idem para os que forneçam diferentes tipos de gráficos. Você poderia caracterizar os diferentes tipos em termos de fatores primos? (c) Como muda a situação em (b) se você escolher 4S em vez de 5S? (d) Escreva programas para os trabalhos em (a)–(c). 20. PROJETO ESCRITO. Métodos numéricos. Usando suas próprias palavras, escreva, sobre o papel geral dos métodos numéricos na matemática aplicada, o motivo pelo qual eles são importantes, onde e quando precisam ou podem ser usados, e como o uso do computador os influencia na engenharia e em outras áreas.











19.2 Solução de Equações por Iteração Daqui em diante, cada seção será dedicada a algum tipo básico de problema e aos métodos correspondentes de solução. Começaremos com os métodos que permitem encontrar soluções de uma equação única (1)

f(x) =

0

onde f é uma função dada. Para esta tarefa, praticamente não existem fórmulas (exceto em alguns casos simples), de modo que dependemos quase inteiramente dos algoritmos numéricos. Uma solução de (1) é um número x = s, tal que f(s) = 0. Aqui, s sugere “solução”, embora também utilizaremos outras letras. Exemplos de equações assim são x3 + x = 1, sen x = 0,5x, tan x = x, cosh x = sec x, cosh x cos x = –1, que podem todas escritas naé forma (1). O primeiro a uma que equaçãodealgébrica a funçãoserf correspondente um polinômio e, neste desses caso, asexemplos soluçõesrefere-se são também chamadas raízes da, visto equação. Os demais exemplos são equações transcendentais, pois envolvem funções transcendentais. Resolver as equações (1) é uma tarefa de fundamental importância, visto que elas são abundantes nas aplicações em engenharia: algumas ocorrem nos Capítulos 2, 4, 8 (equações características), 6 (frações parciais), 12 (autovalores, zeros das funções de Bessel) e 16 (integração), embora haja também muitas e muitas mais. Para resolvermos (1) quando não há nenhuma fórmula capaz de fornecer a solução exata, podemos usar um método de aproximação, em particular, um método de iteração, ou seja, um método em que partimos de um palpite inicial x0 (que pode ser ruim) e passo a passo calculamos aproximações x1, x 2, (que, de modo geral, •





10

Parte E • Análise Numérica

são progressivamente melhores) de uma solução desconhecida de (1). Discutiremos aqui três desses métodos que são particularmente importantes do ponto de vista prático e mencionaremos dois outros no conjunto de problemas propostos. Esses métodos e os princípios a eles subjacentes são fundamentais para a compreensão dos diversos métodos empregados nos aplicativos computacionais. De modo geral, os métodos iterativos são fáceis de programar porque as operações computacionais são as mesmas em cada etapa — apenas os dados mudam de uma etapa para outra — e, o que é mais importante, se em um caso concreto um método converge, ele geralmente é estável (veja a Seção 19.1).

Iteração de Ponto Fixo para a Resolução de Equações f(x) = 0 O uso que agora estamos fazendo da expressão “ponto fixo” não tem absolutamente nada a ver com o sentido adotado na última seção. De um modo qualquer, transformamos (1) algebricamente na forma (2) x = g(x). Então, escolhemos um x0 e calculamos x1 = g(x0), x2 = g(x1) e, de maneira geral, (3)



xn1

g(xn)

(n  0, 1,





),



Chamamos uma solução de (2) de um ponto fixo de g, o que justifica o nome do método. Esta é também uma solução de (1), visto que, de x = g(x), podemos retornar à forma srcinal f(x) = 0. A partir de (1), podemos obter diferentes formas de (2). O comportamento das seqüências iterativas correspondentes x0, x1, pode diferir, em particular, com respeito à sua velocidade de convergência. De fato, algumas delas podem simplesmente não convergir. Ilustremos esses fatos com um exemplo simples. •

EXEMPLO 1





Um Processo Iterativo (Iteração de Ponto Fixo) Monte um processo de iteração para a equação f(x) = x2 – 3x + 1 = 0. Como conhecemos as soluções x



1,5   1,25,

portanto,

2,618 034

e

0,381 966,

podemos observar o comportamento do erro à medida que a iteração prossegue.

Solução. A equação pode ser escrita como (4a) x  g1(x)  13 (x 2 1), 

portanto,

xn1



1 3

(xn2  1),

Se escolhermos x0 = 1, obteremos a seqüência (Fig. 423a; calculada com 6S e depois arredondada) x0



1,000,

x1



0,667,

x2



0,481,

x3



0,411,

x4



0,390,







que parece se aproximar da solução menor. Se escolhermosx0 = 2, a situação será semelhante. Se escolhermos x0 = 3, obteremos a seqüência (Fig. 423a; parte superior) x0



3,000,

x1



3,333,

x2



4,037,

x3



5,766,

x4



11,415,







que diverge. 5

5 g1(x)

g2(x)

0 0

5

x

0

0

(a)

Fig. 423. Exemplo 1, iterações (4a) e (4b)

x (b)

5

Capítulo 19: Métodos Numéricos em Geral

Nossa equação também pode ser escrita (dividindo-se por x) como 1 x  g2(x)  3   (4b) , portanto,

xn1

x



3



11

1 , xn

e, se escolhermos x0 = 1, obteremos a seqüência (Fig. 423b) x0

1,000,





x1

2,000,

2,500,



x2

2,600,



x3

2,615,



x4







que parece se aproximar da solução maior. De modo semelhante, se escolhermos x0 = 3, obteremos a seqüência (Fig. 423b) x0



3,000,

x1



2,667,

x2



2,625,

x3



2,619,

x4



2,618,







.

Nossos gráficos mostram o seguinte: na parte inferior da Fig. 423a, a inclinação de g1(x) é menor que a inclinação de y = x, a qual vale 1; portanto, g1(x)  1 e constatamos que há convergência. Na parte superior,g1(x) é mais inclinada (g1(x)  1) e ocorre divergência. Na Fig. 423b, a inclinação deg 2(x) é menor próxima ao ponto de intersecçãox( = 2,618, ponto fixo deg2, solução de f(x) = 0) e ambas as seqüências parecem convergir. De tudo isso, concluímos que a convergência parece depender do fato de a curva gde (x) ser menos inclinada que a retay = x na vizinhança de uma solução, e veremos agora que esta condição g(x) < 1 (= inclinação de y = x) é suficiente para a convergência. 

Dizemos que um processo de iteração definido por (3) é convergente para um x0 se a seqüência correspondente x0, x1, for convergente. Uma condição suficiente para a convergência é dada no seguinte teorema, que possui diversas aplicações práticas. •

TEOREMA 1





Convergência da Iteração de Ponto Fixo Consideremos que x = s seja uma solução de x = g(x) e suponhamos que g tenha uma derivada contínua em algum intervalo J contendo s. Então, se g(x)  K  1 em J, o processo de iteração definido por (3) converge para qualquer x0 em J e o limite da seqüência { xn} é s.

PROVA

Pelo teorema do valor médio no cálculo diferencial, existe um t entre x e s tal que g(x)

Como g(s) = s e x1 = g(x0), x2 = g(x1),





g(s)



g(t) ( x



s)

(x em J).

, obtemos disso e da condição para g(x) no teorema:





xn  s  g(xn 1)  g(s)  g(t)xn 1  s  K xn Aplicando esta desigualdade n vezes, para n, n – 1, , 1 obtemos 





xn  s  K xn Como K  1, temos K n



1



s



0; logo, xn  s





K2xn

2



0 quando n



1





s.



s.





s













K nx0

.



Mencionemos que uma função g que satisfaz à condição no Teorema 1 é chamada de contração, visto que g(x)  g(v)  Kx  v, onde K  1. Além disso, K fornece informações sobre a velocidade da convergência. Por exemplo, se K = 0,5, então em apenas 7 iterações a precisão aumenta pelo menos em 2 dígitos, pois 0,5 7 < 0,01. EXEMPLO 2

Um Processo Iterativo. Ilustração do Teorema 1 Encontre uma solução de f(x) = x3 + x = 0 por iteração.

Solução. Um esboço mostra que há uma solução próxima de x = 1. Podemos escrever a equação como (x2 + 1)x = 1 ou 1 2x 1 x  g1(x)  xn1  , de modo que . Também g 1(x)  1 1  xn2 (1  x 2)2 1  x2 x0. para qualquer x, pois 4x 2/(1  x 2)4  4x 2/(1  4x 2  )  1, de modo que, pelo Teorema 1, temos a convergência para qualquer Escolhendo x0 = 1, obtemos (Fig. 424) •

x1













0,500, x2  0,800, x3  0,610, x4  0,729, x5  0,653, x6  0,701,







.

A solução exata para 6S és = 0,682 328. A equação dada também pode ser escrita como x



g2(x)



1



x 3.

Então,

g 2(x)  3 x 2

e isso é maior do que 1 próximo da solução, de modo que não podemos aplicar o Teorema 1 e assegurar a convergência. Experimente com x0 = 1; x0 = 0,5; x0 = 2 e veja o que acontece. Este exemplo mostra que a transformação de uma dada f(x) = 0 para a forma x = g(x) com g satisfazendo a g(x)  K  1 pode precisar  de alguma experimentação.

12

Parte E • Análise Numérica

1,0

g1(x) x2

0,5

x1

0 0

0,5

1,0 x

Fig. 424. Iteração do Exemplo 2

Método de Newton para a Resolução de Equações f(x) = 0 O método de Newton, também conhecido como método de Newton–Raphson1, é outro método iterativo empregado na resolução de equações f(x) = 0, onde se supõe que f tenha uma derivada contínua f . Este método é bastante utilizado por causa de sua simplicidade e grande rapidez. Sua idéia subjacente é a obtenção de aproximações gráficas de f por meio de tangentes adequadas. Usando um valor aproximado x0 obtido do gráfico de f, fazemos x1 ser o ponto de interseção entre o eixo x e a tangente à curva de f em x0 (veja a Fig. 425). Então, ƒ(x0) ƒ(x0) tan b  ƒ (x0)  , logo, x1  x0   . x0  x1 ƒ(x0) Na segunda iteração, calculamos x2  x1  ƒ( x1)/ƒ(x1); na terceira iteração, calculamos x3 a partir de x2 usando de novo a mesma fórmula, e assim por diante. Temos então o algoritmo mostrado na Tabela 19.1. A fórmula (5) neste algoritmo também pode ser obtida se resolvermos algebricamente a fórmula de Taylor



(5*)

ƒ(xn 1)  ƒ( xn)  ( xn

1





xn)ƒ(xn)



0.

y y = f(x)

f(x0)

β x2

x1

x0

x

Fig. 425. Método de Newton

Tabela 19.1 Método de Newton para Resolver Equações f(x) = 0

ALGORITMO NEWTON (f, f , x0, e, N) Este algoritmo calcula uma solução de f(x) = 0 a partir de uma dada aproximação inicial x0 (valor inicial da iteração). Aqui, a função f(x) é contínua e tem uma derivada f (x) contínua. ENTRADA: f, f , aproximação inicial x0, tolerância e > 0, número máximo de iterações N. SAÍDA: Solução aproximada xn ( n  N) ou mensagem de erro. Para n = 0, 1, 2, , N – 1, faça: •





1 JOSEPH RAPHSON (1648–1715), matemático inglês que publicou um método semelhante ao de Newton. Sobre detalhes históricos, veja a Ref. [GR2] no Apêndice 1.

Capítulo 19: Métodos Numéricos em Geral

1 2 3

13

Calcule f (xn). Se f (xn) = 0 então SAÍDA “Erro”. Pare. [Procedimento concluído sem sucesso] Senão calcule (5)

xn1



xn



ƒ(x )  . ƒ(x ) n

n

4

Se xn+1 – xn  exn então SAÍDA xn+1. Pare. [Procedimento concluído com sucesso]

Fim SAÍDA “Erro”. Pare. [Procedimento concluído sem sucesso após N iterações] Fim NEWTON 5

Se acontecer que, para algum n, f (xn) = 0 (veja a linha 2 do algoritmo), tente então usar um outro valor inicial A linha 3 é o cerne do método de Newton. A desigualdade na linha 4 é um critério de terminação. Se a seqüência de xn convergir e o critério se verificar, teremos alcançado a precisão desejada e paramos. Nesta linha, o fator xn é necessário para o caso da ocorrência de pontos de zero de módulo muito pequeno (ou muito grande) devido à elevada densidade (ou escassez) de números de máquina para esses x. CUIDADO! O critério em si não implica convergência. Exemplo. A série harmônica diverge, embora suas somas parciais xn  nk 1 1/ k satisfaçam ao critério, porque lim ( xn 1  xn)  lim (1/(n  1))  0. A linha 5 fornece um outro critério de terminação e é necessária porque o método de Newton pode divergir ou, devido a uma escolha ruim de x0, pode não alcançar a precisão desejada com um número razoável de iterações. Em casos assim, podemos tentar um outro x0. Se f(x) = 0 tiver mais de uma solução, escolhas diferentes de

x0.





x0 podem produzir soluções diferentes. Além disso, uma seqüência iterativa pode às vezes convergir para uma solução diferente da esperada.

EXEMPLO 3

Raiz Quadrada Elabore uma iteração de Newton para calcular a raiz quadrada x de um dado número positivo c e aplique-a a c = 2.

c, logo, ƒ(x)  x 2  c  0, ƒ(x)  2 x e (5) assume a forma c xn2  c 1 xn1  xn    xn   . 2 xn 2 xn Para c = 2, escolhendo x0 = 1, obtemos

Solução. Temos que

x



x1 x4 é

EXEMPLO 4





1,500 000,

x2



1,416 667,

x3





1,414 216,



x4



1,414 214,

exato em 6D.







. 

Iteração para uma Equação Transcendental Encontre a solução positiva de 2 sen x = x.

Solução. Fazendo ƒ( x)  x  2 sen x, temos ƒ(x)  1  2 cos x e (5) fornece xn  2 sen xn 2(sen xn  xn cos xn) xn1  xn   1  2 cos xn 1  2 cos xn

 



N

n . Dn

Pelo gráfico de f, concluímos que a solução é próxima de x0 = 2. Calculamos: n

xn

Nn

Dn

xn1

0 1 2 3

2,00000 1,90100 1,89552 1,89550

3,48318 3,12470 3,10500 3,10493

1,83229 1,64847 1,63809 1,63806

1,90100 1,89552 1,89550 1,89549

x4 =

1,89549 é exato em 5D, visto que a solução em 6D é 1,895 494.



14

Parte E • Análise Numérica

EXEMPLO 5

Método de Newton Aplicado a uma Equação Algébrica Aplique o método de Newton à equação f(x) = x3 + x – 1 = 0.

Solução. De (5), temos xn1



xn



x x 1  3x 1 3 n 

n 

2 n 



2 1  , 3 1 xn3



xn2



Começando de x0 = 1, obtemos x1



0,750 000,

x2



0,686 047,

x3



0,682 340,

x4



0,682 328,







onde x4 tem o erro –1 10 –6. Uma comparação com o Exemplo 2 mostra que a convergência que temos agora é muito mais rápida. Isso pode motivar o conceito de ordem de um processo iterativo , que discutiremos a seguir.  

Ordem Método Iterativo. Rapidez dadaConvergência A qualidade de de umum método iterativo pode ser caracterizada pela rapidez convergência, como se segue. Consideremos que xn+1 = g(xn) defina um método de iteração e que xn seja uma aproximação da solução s de x = g(x). Então, xn = s – en, onde en é o erro de xn. Suponha que g seja derivável várias vezes, de modo que a fórmula de Taylor forneça xn 1  g(xn)  g(s)  g(s)(xn  s)  1 g (s)(xn  s)2  2 (6) .  g(s)  g(s)en  1 g (s)en2  2 













O expoente de en no primeiro termo após g(s) que não desaparece é chamado de ordem do processo iterativo definido por g. A ordem mede a velocidade da convergência. Para ver isso, subtraia g(s) = s de ambos os lados de (6). Então, no lado direito, faça xn+1 – s = –en+1, onde en+1 é o erro de xn+1, e, no lado direito, a expressão restante é aproximadamente igual ao seu primeiro termo não-nulo, visto que en é pequeno no caso de haver convergência. Portanto, (a) en 1  g(s)en

no caso de primeira ordem,

(b) en 1   12 g(s)en2

no caso de segunda ordem,



(7)



–k



etc. 

k 2



1 c (10 ) Assim, se en =de10dígitos em alguma iteração, então para a segunda ordem,emencada que o número significativos é aproximadamente duplicado iteração. 



c



2k



10 , de modo

Convergência do Método de Newton No método de Newton, g(x)  x  ƒ( x)/ƒ(x). Por derivação, ƒ(x)2  ƒ( x)ƒ (x) g(x)  1  ƒ(x)2 (8) 

 ƒ( )ƒ ( )  . ƒ() x x x

2

Como f(s) = 0, isto mostra que também g(s) = 0. Logo, o método de Newton é pelo menos de segunda ordem. Se derivarmos novamente e fizermos x = s, descobrimos que ƒ (s) (8*) g (s)   ƒ(s) que não será zero em geral. Isto prova o TEOREMA 2

Convergência de Segunda Ordem do Método de Newton Se f(x) é três vezes derivável e f  e f  não são nulas numa solução s de (fx) = 0, então, para x0 suficientemente próximo de s, o método de Newton é de segunda ordem.

Comentários. Para o método de Newton, (7b) torna-se, por (8*),

Capítulo 19: Métodos Numéricos em Geral

(9)

en1

15

ƒ (s)    en2. 2ƒ(s)

Para que o método indicado no Teorema 2 apresente uma rápida convergência, é importante que s seja um zero simples de f(x0) (assim, f (s)  0) e que x0 esteja próximo de s, visto que, na fórmula de Taylor, tomamos apenas o termo linear [veja (5*)], supondo que o termo quadrático seja desprezivelmente pequeno. (Com um valor ruim para x0, este método pode até mesmo divergir!) EXEMPLO 6

Estimativa a Priori do Erro para o Número de Etapas da Iteração de Newton Use x0 = 2 e x1 = 1,901 no Exemplo 4 para estimar quantas etapas de iteração são necessárias para se produzir uma solução com uma precisão de 5D. Esta é uma estimativa a priori ou uma estimativa prévia, porque só podemos calculá-la depois de uma iteração e antes das demais iterações.

Solução. Temos f(x) = x – 2 sen x = 0. Derivando, obtemos ƒ(x1) ƒ(s)   2ƒ(x1) 2ƒ(s) Logo, (9) fornece

2 sen x    0,57. 2(1 2 cos x ) 1





1

en1  0,57en2  0,57(0,57e2n 1)2  0,573e4n 

onde M  2

n



2

n1











2



1



2

n1



1









 0,57Me0M1  5 10 





6

1. Mostramos a seguir que e0 ≈ –0,11. Conseqüentemente, nossa condição passa a ser 0,57M0,11M1  5 10 6. 



Logo, segundo essa estimativa grosseira, n = 2 é o menor n possível, o que está em boa concordância com o Exemplo 4. O valor e0 ≈ –0,11 é obtido de e1  e0  ( e1  s)  ( e0  s)  x1  x0  0,10, donde e1  e0  0,10  0,57e02 ou 0,57e02  e0  0,10  0, que dá e0  0,11. 

Dificuldades no Método de Newton. As dificuldades podem surgir se f (x) for muito pequeno próximo a uma solução s de f(x) = 0, por exemplo, se s for um zero de f(x) de segunda ordem (ou de ordem mais elevada) (de modo que o método de Newton converge apenas linearmente, como se mostra aplicando-se a regra de l’Hôpital (8)). Geometricamente, um pequeno valor de f (x) significa que a tangente a f(x) próximo a s quase coincide com o eixo x (de modo que se possa precisar de uma precisão dupla para se obterem f(x) e f (x) com precisão suficiente). Então, para valores x  s afastados de s, ainda podemos ter pequenos valores de função 

R(s )

ƒ( s ). Neste caso, dizemos que a equação f(x) = 0 é mal-condicionada. R(s ) é chamado de resíduo de f(x) = 0 em s . Assim, um resíduo pequeno garante um erro pequeno de s somente se a equação não for mal-condicionada. 











EXEMPLO 7

Uma Equação Mal-condicionada ƒ(x)  x 5  10 4x  0 é mal-condicionada. x = 0 é uma solução. f (0) = 10–4 é pequeno. Em s = 0,1, o resíduo f(0,1) = 2 10 –5 é pequeno, porém o erro –0,1 é maior por um fator de 5000 em módulo; conceba você mesmo um exemplo ainda mais drástico.  





Método da Secante para a Resolução de f(x) = 0 O método de Newton é muito poderoso, mas tem a desvantagem de que a derivada f  pode às vezes ser uma expressão muito mais difícil do que a própria função f, tornando o cálculo do seu valor computacionalmente exigente. Essa situação sugere a idéia de se substituir a derivada pelo quociente de diferença ƒ(xn)  ƒ( xn 1) ƒ(xn)  .

 x x 

n



n1

Então, ao invés de (5), temos a fórmula do popular método da secante y

y = f(x)

Secante Pn –1

Pn

s

xn +1

xn

xn –1

Fig. 426. Método da secante

x

16

Parte E • Análise Numérica

(10)

xn1



xn



x x .  ƒ(x ) ƒ( x ) n

ƒ( xn)

n



n1



n1

Geometricamente, na Fig. 426, obtemos uma intersecção entre o eixo x em xn+1 e a secante a f(x) passando pelos pontos Pn–1 e Pn. Precisamos de valores iniciais, x0 e x1. Dessa forma, evitamos o cálculo de derivadas. Pode-se mostrar que a convergência é superlinear (ou seja, mais rápida do que a linear, en 1  const en1,62; veja [E5] no Apêndice 1]), sendo quase quadrática, como o método de Newton. O algoritmo é semelhante ao do método de Newton, como o aluno pode mostrar. 



CUIDADO! Não é bom escrever (10) como xn1



x ƒ(x ) x ƒ(x )  , n1

n

ƒ(xn)



n

n1

) pois isso pode causar uma perda de dígitos significativa se xn e xn-1 forem aproximadamente iguais entre si. (Você consegue ver isso a partir da fórmula?) EXEMPLO 8

ƒ( xn





1

Método da Secante Encontre a solução positiva de f(x) = x – 2 sen x = 0 pelo método da secante, começando de x0 = 2, x1 = 1,9.

Solução. Aqui, (10) é xn1



xn



( 2 sen )( )  2(sen sen ) xn

xn





xn



xn xn

1 

xn





xn

1 

1



xn



xn



N

n . Dn

Os valores numéricos são: n

xn

1 2 3

2,000000 1,900000 1,895747

x3

1



xn

1,900000 1,895747 1,895494



Nn

Dn

0,000

0,174

740 0,000 002 0

xn1

005 0,006 986 

= 1,895 494 é exato em 6D. Veja o Exemplo 4.



xn

0,004

253 0,000 252 0 

Resumo dos Métodos. Os métodos para calcular soluções s de f(x) = 0 com funções f(x) contínuas (ou deriváveis) dadas começam com uma aproximação inicial x0 de s e geram uma seqüência x1, x2, por iteração. Os métodos de ponto fixo resolvem f(x) = 0 escrita como x = g(x), de modo que s é um ponto fixo de g, ou seja, s = g(s). Para g(x) = x – f(x)/f (x), este é o método de Newton, o qual, para um bom valor de x0 e zeros simples da função, converge quadraticamente (e converge linearmente quando há múltiplos zeros). O método da secante decorre do de Newton substituindo-se f (x) por um quociente de diferenças. O método da bissecção e o método de falsa posição, apresentados em Problemas Propostos 19.2, sempre convergem, embora freqüentemente devagar. •





PROBLEMAS PROPOSTOS 19.2 1–7 ITERAÇÃO DE PONTO FIXO x = 2, f(x) = 0. Escrevaf(x) = 0 comox = g(x) (dividindof(x) por 14 x e passando o termo emx resultante para o outro lado). Encontre o Aplique a iteração de ponto fixo e responda às perguntas relacionadas zero. (Veja na Seção 12.9 a importância desses zeros.) quando indicado. Mostre os detalhes do que fizer. 8. PROJETO DE ÁLGEBRA COMPUTACIONAL. Iteraçãode 1. x = 1,4 sen x, x0 = 1,4 Ponto Fixo. (a) Existência. Prove que se g é contínua em um 2. Faça as iterações indicadas no final do Exemplo 2. Esboce uma intervalo fechadoI e seu intervalo de definição se situa emI, então figura semelhante à Fig. 424. a equação x = g(x) tem pelo menos uma solução emI. Ilustre o 3. Por que obtemos uma seqüência monótona no Exemplo 1, mas não fato de que ela pode ter mais de uma solução emI. no Exemplo 2? b) Convergência. Considere que ƒ(x)  x3  2x2  3x  4  0. 4. f = x4 – x + 0,2 = 0, raiz próxima de 1,x0 = 1 Escreva isto como x = g(x), escolhendo g como (1) ( x 3  ƒ) 1/3 , 5. f como no Problema 4, raiz próxima de 0,x0 = 0 (2) ( x 2  12 ƒ) 1/2 , (3) x  13 ƒ, (4) x (1  14 ƒ), (5) ( x 3  ƒ)/ x 2, 6. Encontre a menor solução positiva de senx = e–0,5x, x0 = 1. (6) (2 x 2  ƒ)/2 x , (7) x  ƒ/ ƒ  e, em cada caso, usandox0 = 1,5. 7. (Funções de Bessel, batida do tambor) Uma soma parcial da Investigue a convergência e a divergência, bem como o número série de Maclaurin de J0(x) (Seção 5.5) é ƒ( x )  1  14 x 2  de iterações necessárias para se alcançarem valores exatos em 6S 1 4 1 6 para raízes. 64 x  2304x . Conclua, a partir de um esboço, que, próximo de

Capítulo 19: Métodos Numéricos em Geral

9–18

MÉTODO DE NEWTON

Aplique o método de Newton (com uma precisão de 6D). Primeiro faça um esboço da(s) função(ões) para ver o que está acontecendo. 9. sen x = cot x, x0 = 1 10. x = cos x, x0 = 1 11. x3 – 5x + 3 = 0, x0 = 2 12. x + ln x = 2, x0 = 2 13. (Viga vibrando) Encontre a solução de cosx cosh x = 1 próximo de x = 32 p. (Isto determina uma freqüência de uma viga em vibração; veja em Problemas Propostos 12.3.) 14. (Aquecimento, resfriamento) Em que instante x (com uma exatidão de 4S apenas) os processos governados por 1ƒ(x)  100(1  e 0,2x) e ƒ2(x)  40 e 0,01x atingirão a mesma temperatura? Encontre também o valor desta. 15. (Funções associadas de Legendre) Descubra o menor zero positivo de P 42  (1  x 2) P 4  152 (  7 x 4  8 x 2  1) (Seção 5.3) (a) pelo método de Newton e (b) exatamente resolvendo uma equação quadrática. 16. (Polinômios de Legendre) Descubra a maior raiz do polinômio de Legendre P5(x) dado por P 5( x )  18 (63 x 5  70 x 3  15 x ) (Seção 5.3) (que será necessário na integração de Gauss a ser vista na Seção 19.5) (a) pelo método de Newton e (b) a partir de uma equação quadrática. 3 17. Elabore uma iteração de Newton para raízes cúbicas e calcule  7 (6D, x0 = 2). k 18. Elabore uma iteração de Newton parac (c > 0). Utilize-a para 3 4 5 calcular 2,  2,  2,  2 (6D, x0 = 1). 19. PROJETO DE EQUIPE. Método da Bissecção. Este método simples, porém de convergência lenta, para encontrar uma solução de f(x) = 0 com f contínua baseia-se noteorema do valor médio, que afirma que, se uma função contínuaf possui sinais opostos em algum x = a e x = b (> a), ou seja, ou f(a) < 0, f(b) > 0, ou f(a) > 0, f(b) < 0, então f deve valer 0 em algum ponto do intervalo a[, b]. A solução é encontrada bisseccionando-se repetidas vezes o intervalo e, em cada iteração, ficando-se com a metade do intervalo que também satisfaça à condição do sinal. (a) Algoritmo. Escreva um algoritmo para este método. (b) Comparação . Resolva x = cos x pelo método de Newton e pelo da bissecção. Compare. (c) Resolva e–x = ln x e também ex + x4 + x = 2, usando o método da bissecção. 



17

20. PROJETO DE EQUIPE. Método da Falsa Posição ( Regula falsi). A Fig. 427 mostra esta idéia. Supomos quef seja contínua. Calculamos a interseçãoc0 entre o eixo x e a reta passando pelos pontos (a0, f(a0)), (b0, f(b0)). Se f(c0) = 0, o problema está resolvido. Se f(a0)f(c0) < 0 (como na Fig. 427), fazemosa1 = a0, b1 = c0, e repetimos para obterc1 etc. Se f(a0)f(c0) > 0, então f(c0)f(b0) < 0 e fazemos a1 = c0, b1 = b0 etc. (a) Algoritmo. Mostre que 

c0

ƒ( ) ƒ( )  ƒ( ) ƒ( ) a0 b0



b0 a0

b0



a0

e escreva um algoritmo para este método. 3

x = 5método x + 6 pelo . Resolva método de Newton, (b)pelo Comparação método da secante e pelo da falsa posição. Compare-os. (c) Resolva x4 = 2, cos x = x e x + ln x = 2 pelo método da falsa posição.

y

y = f(x)

a0 c1

c0

b0

x

Fig. 427. Método da falsa posição

21–24 MÉTODO DA SECANTE Resolva, utilizandox0 e x1, conforme indicado. 21. Problema 11, x0 = 0,5; x1 = 2,0 22. e–x – tan x = 0; x0 = 1; x1 = 0,7 23. Problema 9, x0 = 1; x1 = 0,5 24. Problema 10, x0 = 0,5; x1 = 1 25. PROJETO ESCRITO. Solução de Equações. Compare os métodos vistos nesta seção e nos problemas propostos, discutindo suas vantagens e desvantagens e utilizando exemplos que você mesmo criar.

19.3 Interpolação Interpolar significa encontrar (por aproximação) valores de uma função f(x) para um x situado entre diferentes valores de x: x0, x1, , xn, nos quais os valores de f(x) são dados. Esses valores podem vir de uma função “matemática”, como um logaritmo ou uma função de Bessel, ou talvez, e com mais freqüência, podem ser •





medidos valores automaticamente uma função a resistência do ar à passagemoudeserem um automóvel ou de um avião aregistrados diferentes de velocidades, ou “empírica”, o rendimentocomo de um processo químico em temperaturas diferentes, ou ainda o tamanho da população dos Estados Unidos conforme aparece em censos realizados em intervalos de 10 anos. Escrevemos esses valores dados de uma função f na forma ƒ0  ƒ( x0),

ƒ1  ƒ( x1),

(x0, ƒ 0),

(x1, ƒ 1),







,

ƒn  ƒ( xn)

ou como pares ordenados •





,

(xn, ƒ n).

18

Parte E • Análise Numérica

Uma idéia-padrão da interpolação é agora encontrar um polinômio pn(x) de grau n (ou menor) que assuma os valores dados; assim, pn(x0)

(1)



ƒ 0,

pn(x1)



ƒ 1,







,

pn(xn)



ƒ n.

Chamamos este pn de polinômio de interpolação e x0,..., xn, de nós. E se f(x) for uma função matemática, dizemos que pn é uma aproximação de f (ou uma aproximação polinomial, visto existirem outros tipos de aproximação, como veremos mais tarde). Usamos pn para obter valores (aproximados) de f para os xs situados entre x0 e xn (“interpolação”) ou, às vezes, situados fora desse intervalo x0  x  xn ( “extrapolação”). Justificativa. É conveniente trabalhar com polinômios, pois eles são prontamente deriváveis e integráveis, e o resultado dessas operações fornece, de novo, polinômios. Além disso, eles constituem aproximações de funções contínuas com qualquer precisão que se deseje. Ou seja: para qualquer f(x) contínua em um intervalo J: a  x  b e um limite de erro b > 0), existe um polinômio pn ( x) (de grau n suficientemente alto), tal que

ƒ(x)  pn(x)  b para todo x em J. Este é o famoso teorema de aproximação de Weierstrass(para uma prova, veja a Ref. [RG7], no Apêndice 1). Existência e Unicidade. Existe pn que satisfaz a (1) para dados fornecidos e damos a seguir fórmulas para ele. pn é único. De fato, se outro polinômio qn também satisfizesse a qn(x0)  ƒ0, , qn(xn)  ƒn, então pn(x)  qn(x)  0 em x0, , xn, porém um polinômio pn – qn de grau n (ou menos) com n + 1 raízes deve ser identicamente nulo, conforme aprendemos na álgebra; portanto, pn(x) = qn(x) para todo x, o que significa unicidade.  •











Como Encontrar pn? Esta é a questão prática importante. Respondemos a ela explicando diversos métodospadrão. Para dados fornecidos, esses métodos dão o mesmo polinômio, devido à unicidade que acabamos de provar (a qual é, assim, de interesse prático!), embora tal resultado possa ser expresso de diversas formas adequadas a diferentes propósitos.

Interpolação de Lagrange Dados (x0, ƒ0), ( x1, ƒ1), , ( xn, ƒ n) com os xj arbitrariamente espaçados, Lagrange teve a idéia de multiplicar cada fj por um polinômio valendo 1 em xj e 0 nos outros n nós, fazendo depois a soma desses n + 1 polinômios. Obviamente, isso fornece o único polinômio de interpolação de grau n ou menos. Começando com o caso mais simples, vejamos como funciona: A interpolação linear é uma interpolação que usa a reta passando pelos pontos ( x0, f0), (x1, f1); veja a Fig. 428. Portanto, o polinômio linear de Lagrange p1 é uma soma p1 = L0f0 + L1f1, onde L0 é o polinômio linear valendo 1 em x0 e 0 em x1; similarmente, L1 vale 0 em x0 e 1 em x1. Obviamente, •





L0(x)

x x  , x x 



0



1

p1(x)



L0(x)ƒ0



L1(x)ƒ1

x x  x x 



0

y



1

Isso fornece o polinômio linear de Lagrange (2)

x x  . x x 

L1(x)

1



1



ƒ0 

1

0



0

x x  x x 

1



0



ƒ 1.

0

Erro f1

p1(x)

f

y = f(x)

0

x0

x

x1

x

Fig. 428. Interpolação linear

EXEMPLO 1

Interpolação Linear de Lagrange Calcule um valor em 4D de ln 9,2 a partir de ln 9,0 = 2,1972; ln 9,5 = 2,2513 pela interpolação linear de Lagrange e determine o erro usando ln 9,2 = 2,2192 (4D).

Solução.

x0



9,0; x1  9,5; ƒ0  ln 9,0; ƒ1  ln 9,5. Em (2), precisamos de

Capítulo 19: Métodos Numéricos em Geral

L0(x) L1(x)



x 9,5  0,5 x 9,0  0,5 

 2,0( x 









9,5),

L0(9,2)

2,0( x  9,0),

L1(9,2)

 2,0( 0,3) 



19

0,6

2 0,2  0,4 

(veja a Fig. 429) e obtemos a resposta ln 9,2

 p1(9,2)  L0(9,2)ƒ0  L1(9,2)ƒ1  0,6 2,1972  0,4 2,2513  2,2188. 



O erro é e  a  a  2,2192  2,2188  0,0004. Logo, a interpolação linear não é aqui suficiente para obtermos uma precisão de 4D; ela teria sido suficiente para uma precisão de 3D.  

y

L0

L1

1 0

9 9,2 9,5

x

10 1 1

Fig. 429. L0 e L1 do Exemplo 1

A interpolação quadrática é a calculada para os pontos dados: (x0, f0), (x1, f1), (x2, f2), usando-se um polinômio de segundo grau p2(x), o qual, pela idéia de Lagrange, corresponde a p2(x)

(3a)



L0(x)ƒ0



L1(x)ƒ1

L2(x)ƒ2



com L0 (x0)  1, L1 (x1)  1, L2 (x2)  1, e L0 (x1)  L0 (x2)  0 etc. Estabelecemos que (x  x1)(x  x2) l0(x) L0(x)    (x0  x1)(x0  x2) l0(x0) (3b)

L1(x)



l (x)   l (x ) 1

1

L2(x)



1

l (x)   l (x ) 2

2

2

 ( )( )  ( )( ) ( )( )  . ( )( ) x



x0 x

x1



x0 x1



x



x0 x

x2



x0 x2

x2





x2

x1



x1

Como obtivemos este resultado? Ora, o numerador faz Lk(xj) = 0 se j  k. E o denominador faz Lk(xk) = 1, porque é igual ao numerador em x = xk. EXEMPLO 2

Interpolação Quadrática de Lagrange Calcule ln 9,2 por (3), usando os dados fornecidos no Exemplo 1 e um terceiro valor adicional ln 11,0 = 2,3979.

Solução. Em (3), L0(x)



(x 9,5)(x 11,0)  (9,0 9,5)(9,0 11,0)



L1(x)



(x 9,0)(x 11,0)  (9,5 9,0)(9,5 11,0)

 

L2(x)



(x 9,0)(x 9,5)  (11,0 9,0)(11,0 9,5)











x2











20,5x  104,5,

L0(9,2)



0,5400,

1  ( x 2  20 x  99), 0,75

L1(9,2)

1 ( x 2  18,5x  85,5), 3

L2(9,2)







 



0,4800,

 0,0200,

(veja a Fig. 430), de modo que (3a) fornece, com um valor exato em 4D, ln 9,2

 p2(9,2)  0,5400 2,1972  0,4800 2,2513  0,0200 2,3979  2,2192. 

y





L0

L2

1 0

9

9,5

10

11

L1

Fig. 430. L0, L1, L2 do Exemplo 2

x



20

Parte E • Análise Numérica

Polinômio Geral de Interpolação de Lagrange. Para n geral, obtemos n

(4a)

n

k0

l (x)  ƒ l (x ) k

ƒ(x)  pn(x)   Lk(x)ƒk   k0

k

k

k

onde Lk(xk) = 1, Lk é 0 nos outros nós e os Lk são independentes da função f a ser interpolada. Obtemos (4a) se fizermos

(4b)

l0(x)



( x  x1)(x  x2)

lk(x)



( x  x0)

ln(x)



( x  x0)(x  x1)











( x  xn),



( x  xk 1)(x  xk 1) 















( x  xn),

0  k  n,

( x  xn 1). 

Podemos ver facilmente que pn(xk) = fk. De fato, inspecionando (4b), vemos que lk(xj) = 0 se j  k, de modo que, para x = xk, a soma em (4a) se reduz ao único termo (lk(xk)/lk(xk))fk = f k. Estimativa de Erro. Se a própria função f for um polinômio de grau n (ou menor), ela deve coincidir com pn, porque os n + 1 dados (x0, f0), , (xn, fn) determinam unicamente um polinômio, de modo que o erro é zero. Ora, a função especial f tem sua (n + 1)-ésima derivada identicamente nula. Isto torna plausível o fato de que, para uma função geral f, sua (n + 1)-ésima derivada f(n+1) deve medir o erro •





en(x)



ƒ( x)  pn(x).

Pode-se mostrar que isso é verdadeiro se f(n+1) existir e for contínua. Então, com um valor adequado para t situado entre x0 e xn (ou entre x0, xn e x se extrapolarmos), (5)

en(x)



ƒ( x)  pn(x)  ( x  x0)(x  x1)







( x  xn)

ƒ (t) .  (n 1)! (n1)



Portanto, e(x) é 0 nos nós e pequeno próximo a eles, por causa da continuidade. O produto ( x – x0) (x – xn) é grande para valores de x distantes dos nós. Isto torna a extrapolação arriscada. E a interpolação em um valor x •





n+1) em ambos os lados desse x. Além disso, obtemos os limites de erro tomando melhor escolhermos oserá menor e o se maior valores deosf(nós (t) em (5) no intervalo x0  t  xn (ou no intervalo que também contém x se extrapolarmos). O ponto mais importante é que, como pn é único, conforme mostramos, temos o

TEOREMA 1

Erro de Interpolação A fórmula (5) fornece o erro para qualquer método de interpolação polinomial se (fx) possui uma (n 1)-ésima derivada contínua.

+

Estimativa prática de erro. Se a derivada em (5) for difícil ou impossível de ser obtida, aplique o Princípio do Erro (Seção 19.1), ou seja, tome outro nó e o polinômio de Lagrange pn+1(x), e considere pn+1(x) – pn(x) como uma estimativa de erro (grosseira) de pn(x). EXEMPLO 3

Estimativa de Erro (5) da Interpolação Linear. Prejuízo por Arredondamento. Princípio do Erro Estime o erro no Exemplo 1, primeiro diretamente por (5) e depois pelo Princípio do Erro (Seção 19.1).

Solução.

(A) Estimativa por(5). Temos n



1, ƒ(t)  ln t, ƒ (t)  1/ t, ƒ (t)  1/t 2. Logo, 

e1(x)



( x  9,0)(x  9,5) ( 2t,1) 2

portanto,



t = 9,0 fornece o valor máximo 0,03/9 2 = 0,00037 e t = 9,5 fornece o e1(9,2)  0,00037, ou melhor, 0,00038, visto que 0,3/81 = 0,003 703

e1(9,2)



0,03 . t  2

valor mínimo 0,03/9,5 2 = 0,00033, de modo que obtemos 0,00033  . Entretanto, isto está em discordância com o Exemplo 1, para o qual o erro vale 0,0004, de modo que podemos aprender alguma coisa! Para este caso, a repetição do cálculo com 5D em vez de 4D fornece ln 9,2







 p1(9,2)  0,6 2,19722  0,4 2,25129  2,21885 



com um erro real e  2,21920  2,21885  0,00035 situado bem próximo do meio entre nossos dois limites de erro. Isto mostra que a discrepância (0,0004 versus 0,00035) foi causada pelo arredondamento, algo que não foi levado em conta em (5).

Capítulo 19: Métodos Numéricos em Geral

21

(B) Estimativa pelo Princípio do Erro. Calculamos p1(9,2) = 2,21885 como antes e depois p2(9,2) como no Exemplo 2, porém com 5D, obtendo p2(9,2)



0,54 2,19722  0,48 2,25129  0,02 2,39790  2,21916. 





A diferença p2(9,2) – p1(9,2) = 0,00031 é o erro aproximado de p1(9,2) que queríamos obter; esta é uma aproximação do verdadeiro erro 0,00035 dado anteriormente. 

Interpolação das Diferenças Divididas de Newton Para os dados fornecidos (x0, f0), , ( xn, fn), o polinômio de interpolação pn(x) que satisfaz a (1) é único, conforme já demonstramos. Porém, para diferentes propósitos, podemos usar pn(x) expresso em formas diferentes. A forma de Lagrange, recém-discutida, é útil para obter fórmulas de integração (Seção 19.5) e de derivação •





numéricas de aproximação derivadas). De maior(fórmulas importância prática são aspara formas de Newton para pn(x), que também usaremos para resolver EDOs (na Seção 21.2). Elas envolvem menos operações aritméticas que a forma de Lagrange. Além disso, freqüentemente ocorre que temos de aumentar o grau n para alcançarmos uma precisão exigida. Nesses casos, com as formas de Newton, podemos usar todo o trabalho que já desenvolvemos e apenas acrescentar um outro termo, uma possibilidade que não tem contraparte na forma de Lagrange. Isso também simplifica a aplicação do Princípio do Erro (utilizado no Exemplo 3 para Lagrange). Os detalhes dessas idéias são os seguintes: Consideremos que pn–1(x) seja o (n – 1)-ésimo polinômio de Newton (cuja forma determinaremos); assim, pn-1(x0) = f0, pn-1(x1) = f1, , pn-1(xn-1) = fn–1. Além disso, escrevamos o n-ésimo polinômio de Newton como •





(6)

pn(x)



pn

(x)  gn(x);

gn(x)



pn(x)

1



donde (6)

pn



(x),

1



Aqui, gn(x) deve ser determinado de modo que pn(x0)  ƒ 0, pn(x1)  ƒ 1, , pn(xn)  ƒ n. Como pn e pn-1 concordam em x0, , xn-1, vemos que gn é zero aí. Além disso, em geral gn será um polinômio de grau, no máximo, igual a n – 1. Logo, gn deve ter a forma •



(6 )









gn(x)



an(x

x0)(x



an.



x1)







( x  xn 1). 

x = xn

Determinemos a constante Para isto, façamos e resolvamos algebricamente (6) para an. Substituindo gn(xn) de acordo com (6) e usando pn(xn) = fn, vemos que isso resulta em ƒn  pn 1(xn) (7) . an  (xn  x0)(xn  x1) ( xn  xn 1) Escrevamos ak em vez de an e mostremos que ak é igual à k-ésima diferença dividida, que é recursivamente denotada e definida do seguinte modo: ƒ1  ƒ 0 a1  ƒ[ x0, x1] 

 









 x x 1

a2



ƒ[ x0, x1, x2] 



 x x 

2

e, em geral, (8)

ak



ƒ[ x0,







, xk] 

0

ƒ[x , , x ] ƒ[ x , ,x ] .  x x 1







k



k

PROVA

0

ƒ[x1, x2]  ƒ[ x0, x1]



0







k1

0

Se n = 1, então pn 1(xn)  p0(x1)  ƒ 0, pois p0(x) é constante e igual af0, o valor de f(x) em x0. Logo, (7) fornece 

a1



ƒ ( )  ƒ ƒ  ƒ[ x , x ], x x x x   1



p0 x1

1

1



1

0

0

0

1

0

com (6) e (6) fornecendo o polinômio de interpolação de Newton do primeiro grau p1(x)

Se n = 2, então este p1 e (7) dão ƒ2  p1(x2) a2  (x2  x0)(x2  x1)



ƒ 0  ( x  x0)ƒ[x0, x1].

ƒ ƒ ( )ƒ[ , ]   ( )( ) 

2



0

x2







x0

x0 x2

x2



x0 x1

x1



ƒ[ x0, x1, x2]

22

Parte E • Análise Numérica

onde a última igualdade é obtida por cálculo direto e pela comparação com a definição do lado direito. (Seja paciente, verificando isso.) De (6) e (6 ), obtemos portanto o segundo polinômio de Newton: p2(x)



ƒ 0  ( x  x0)ƒ[x0, x1]  ( x  x0)(x  x1)ƒ[x0, x1, x2].

Para n = k, a fórmula (6) dá (9)

pk(x)

pk



(x)  ( x  x0)(x  x1)

1



Com p0(x) = f0 pela aplicação repetida com k = 1, diferenças divididas de Newton











( x  xk 1)ƒ[x0, 







, xk].

, n, isto finalmente fornece a fórmula de interpolação das



ƒ(x)  ƒ 0  ( x  x0)ƒ[x0, x1]  ( x  x0)(x  x1)ƒ[x0, x1, x2]

(10)







( x  x0)(x  x1)











( x  xn 1)ƒ[x0, 







, xn].

A Tabela 19.2 mostra um algoritmo para isso. O primeiro laço computa as diferenças divididas, e o segundo, o valor desejado pn(x ). O Exemplo 4 mostra como arranjar diferenças próximo aos valores a partir dos quais elas foram obtidas; as últimas sempre se situam meia linha acima e meia linha abaixo na coluna precedente. Esse arranjo é chamado de  tabela de diferenças (divididas). ˆ

Tabela 19.2 Interpolação de Diferenças Divididas de Newton

ALGORITMO INTERPOL (x0, , xn; ƒ 0, , ƒn; x ) Este algoritmo calcula uma aproximação pn(x) de f(x) em x . ENTRADA: Dados (x0, ƒ 0), ( x1, ƒ 1), , (xn, ƒ n); x SAÍDA: Aproximação pn(x) de f(x ) Faça ƒ[ xj]  ƒ j ( j  0, , n). Para m = 1, , n – 1 faça: •









ˆ



ˆ



ˆ









ˆ



ˆ

ˆ



ˆ











Para j = 0, , n – m faça: ƒ[x , j 1 ƒ[xj, , xj m] 

, x ] ƒ[ x , ,x ]  x x 















jm



jm

Fim Fim Faça p0(x) = f0. Para k = 1, , n faça: pk(x)  pk 1(x )  ( x  x0) Fim SAÍDA pn(x) Fim INTERPOL •



j









jm1

j



ˆ



ˆ

ˆ







( x  xk 1)ƒ[x0, ˆ









, xk]

ˆ

EXEMPLO 4

Fórmula da Interpolação das Diferenças Divididas de Newton Calcule f(9,2) a partir dos valores mostrados nas duas primeiras colunas da tabela a seguir:

8,0

ƒj  ƒ( xj) 2,079442

9,0

2,197225

xj

ƒ[xj, xj 1] 

ƒ[xj, xj 1, xj 2] 



ƒ[xj,





0,117 783 0,006

433

0,005

200

0,108 134 9,5

2,251292

11,0

2,397895

0,097 735

0,000 411



, xj 3] 

23

Capítulo 19: Métodos Numéricos em Geral

Solução. Calculamos as diferenças divididas do seguinte modo; eis uma amostra: (0,097 735



0,108 134)/(11  9)

 0,005

200.

Os valores de que precisamos em (10) estão circulados na última tabela. Temos ƒ(x)  p3(x)  2,079 442  0,117 783(x  8,0)  0,006 433(x  8,0)(x  9,0)  0,000 411(x  8,0)(x  9,0)(x  9,5). Em x = 9,2, ƒ(9,2)  2,079 442  0,141 340  0,001 544  0,000 030  2,219 208. O valor exato com 6D é ƒ(9,2)  ln 9,2  2,219 203. Note que podemos ver bem como a precisão aumenta termo a termo: p1(9,2)



2,220 782,

p2(9,2)

2,219 238,



p3(9,2)



2,219 208.



Espaçamento Igual: Fórmula das Diferenças Progressivas de Newton A fórmula de Newton (10) é válida para nós arbitrariamente espaçados, que podem ocorrer nos casos práticos de experimentos ou observações. Entretanto, em diversas aplicações, os xj’s encontram-se regularmente espaçados — por exemplo, em medidas tomadas a intervalos regulares de tempo. Então, representando essa distância por h, podemos escrever (11)

x0,

x1



x0



h,



x2



x0

2 h,





, xn  x0  nh.



Mostremos como (8) e (10) agora ficam muito mais simples! Para começarmos, definamos a primeira diferença progressiva de f em xj por ƒj 

ƒj

1

ƒj,



a segunda diferença progressivade f em xj por 2ƒj  ƒj1  ƒj ,

e, prosseguindo dessa maneira, a k-ésima diferença progressiva de f em xj por (12)

kƒj  k

ƒj

1



1

 k

ƒj

(k  1, 2,

1







).



Mais adiante seguem-se exemplos e uma explicação da expressão “progressiva”. O que é o mais importante disto? Mostremos que, se temos um espaçamento regular (11), então 1 (13) ƒ[x0, , xk]  k kƒ0. k! h •





Provemos (13) por indução. Isto é verdadeiro para k = 1, pois x1 = x0 + h, de modo que 1 1 ƒ  ƒ0 ƒ[x0, x1]  1   (ƒ 1  ƒ 0)   ƒ0. 1! h h x1  x0



Supondo que (13) se verifique para todas as diferenças progressivas de ordem k, mostremos que (13) também se verifica para k + 1. Utilizamos (8) com k + 1 ao invés de k; então, usamos (k  1) h  xk 1  x0, que resulta de (11), e finalmente (12) com j = 0, ou seja, k 1ƒ0  kƒ1  kƒ0. Isto fornece ƒ[x1, , xk 1]  ƒ[ x0, , xk] ƒ[x0, , xk 1]  (k  1) h 



 •













1







1

( 1)   !  1 k



kƒ1 

h k hk

 (k 1)! h 



k1





1 ƒ  k! h k

k



0

ƒ0

k1



que corresponde a (13) com k + 1 no lugar de k. A fórmula (13) fica assim demonstrada.



24

Parte E • Análise Numérica

Em (10), finalmente fazemos x = x0 + rh. Então, x  x0  rh, x  x1  ( r  1) h, visto que x1 – x0 = h, e assim por diante. Com isto e com (13), a fórmula (10) passa a ser a fórmula de interpolação da diferença progressiva de Newton (ou de Gregory –Newton) 2

n

 r

ƒ(x)  pn(x)   s s 0

(14)



sƒ0

r (r 1)  2!

(x  x0  rh, r  ( x  x0)/h) ( r n 1) r (r 1)  n! 





ƒ 0  rƒ0 

2ƒ0 



















nƒ0

onde os coeficientes binomiais na primeira linha são definidos por r

(15)

e s!  1 2 •







0 

s.



( 1)( 2) ( 1) !    r s

1,



r r

r











s

r



s

(s  0, inteiro)



Erro. De (5), obtemos, com x  x0  rh, x  x1  ( r  1) h etc., h  n1

(16)

en(x)

ƒ( x)  pn(x)  (n  1)! r (r  1)



( r  n)ƒ (n 1)(t) 







com t conforme caracterizado em (5). A fórmula (16) é uma fórmula exata para o erro, porém envolve a incógnita t. No Exemplo 5 (a seguir), mostraremos como usar (16) para obter uma estimativa de erro e um intervalo dentro do qual deve se situar o valor verdadeiro de f(x). Comentários sobre a Precisão. (A) A ordem de magnitude do erro en(x) é aproximadamente igual à da diferença seguinte não utilizada em pn(x). (B) Devemos escolher x0, , xn tais que o valor de x no qual a interpolação é feita esteja tão bem centrado entre x0, , xn quanto possível. •











A razão para (A) é que, em n(16),  1ƒ(t) ƒ n 1(t)  , n 1



r (r 1) ( r n)  1 1 2 ( n 1)





h

























se

r  1

(e, na verdade, para qualquer r, contanto que não extrapolemos). A razão para (B) é que r (r  1) torna-se o menor valor para essa escolha. EXEMPLO 5







( r  n)

Fórmula da Diferença Progressiva de Newton. Estimativa do Erro Calcule cosh 0,56 a partir de (14) e dos quatro valores na tabela a seguir, e faça a estimativa do erro.

ƒj  cosh xj

j

xj

0

0,5

1,127 626

1

0,6

1,185 465

ƒj

2ƒj

3ƒj

0,057 839 0,011 865 0,069704 2

0,7

1,255 169

3

0,8

1,337 435

0,000697 0,012 562

0,082 266

Solução. Calculemos as diferenças progressivas conforme mostra a tabela. Os valores de que precisamos estão circulados. Em (14), temos r  (0,56  0,50)/0,1  0,6, de modo que (14) fornece

2 JAMES GREGORY (1638–1675), matemático escocês e catedrático nas universidades de St. Andrews e Edimburgo. Os símbolos (14) e 2 nada têm a ver com o laplaciano.



em

25

Capítulo 19: Métodos Numéricos em Geral

cosh 0,56

 1,127 626  0,6 0,057 839  

0,6( 0,4)  2



0,011 865 



1,127 626  0,034 703  0,001 424  0,000 039



1,160 944.

0,6( 0,4)( 1,4)  6 





0,000 697

Estimativa do erro. De (16), visto que a quarta derivada é cosh(4) t = cosh t, 0,14 e3(0,56)   0,6( 0,4)(1,4)(2,4) cosh t 4!  A cosh t, 

onde A  0,000 003 36 e 0,5 cosh t nesse intervalo:



t



0,8. Não conhecemos t, mas obtemos uma desigualdade tomando os valores máximo e mínimo de A cosh

0,8  e3(0,62)  A cosh 0,5.

Como ƒ(x)  p3(x)  e3(x), isto fornece p3(0,56)



A cosh

0,8  cosh 0,56  p3(0,56)  A cosh 0,5.

Os valores numéricos são 1,160 939  cosh 0,56  1,160 941. O valor exato em 6D é cosh 0,56 = 1,160 941, que está situado dentro desses limites. Nem sempre tais limites são tão estreitos. Além disso,  não consideramos os erros de arredondamento, que dependerão do número de operações.

Este exemplo também explica o nome “fórmula da diferença progressiva”: vemos que as diferenças na fórmula inclinam-se para a frente na tabela de diferenças.

Espaçamento Igual: Fórmula da Diferença Regressiva de Newton Ao invés das diferenças de inclinação podemos tambémnúmeros, empregarnaasmesma diferenças de inclinação regressiva. A tabela de diferenças continua aprogressiva, mesma de antes (os mesmos posição), exceto por uma alteração muito inofensiva do número subscrito em questão j (que explicaremos no Exemplo 6, a seguir). Não obstante, puramente por razões de conveniência, é padrão apresentar um segundo nome e uma segunda notação para as diferenças, conforme se segue. Definimos a primeira diferença regressiva de f em xj por ƒj 

ƒ j  ƒ j 1, 

a segunda diferença regressivade f em xj por 2ƒj  ƒj  ƒj

,

1



e, continuando dessa maneira, a k-ésima diferença regressiva de f em xj por (17)

kƒj  k

ƒj  k 1ƒj

1





(k  1, 2,

1







).



Uma fórmula semelhante a (14) mas que envolve diferenças regressivas é a fórmula de interpolação de diferença regressiva de Newton (ou de Gregory–Newton). n

ƒ(x)  pn(x)  

r



(18)

s



1

sƒ0

(x  x0  rh, r  ( x  x0)/h)

s

r (r 1)   ƒ 2!

s0





EXEMPLO 6

ƒ 0  r ƒ0 

2

0

r (r 1) ( r n 1)  n! 





















nƒ0.

Interpolações Progressivas e Regressivas de Newton Calcule um valor em 7D da função de Bessel J0(x) para x = 1,72 a partir dos valores da tabela a seguir, usando: (a) a fórmula progressiva de Newton (14) e (b) a fórmula regressiva de Newton (18).

26

Parte E • Análise Numérica

jprogr

jregr

xj

0

3

1,7

J0(xj) 0,3979849

1

2

1,8

0,3399864

2

1

1,9

0,2818186

3

0

2,0

0,2238908

1aD eriv. 0,057

9985

0,058

1678

2aD eriv.

0,000

3a Deriv.

1693 0,000 4093

0,0002400 0,057

9278

Solução. O cálculo das diferenças é o mesmo em ambos os casos. Somente a sua notação é que difere.  0,2 e j vai de 0 a 3 (veja a primeira coluna). Em cada coluna, precisamos do

(a) Progressiva. Em (14), temos r  (1,72  1,70)/0,1 primeiro número dado e, assim, (14) fornece J0(1,72)

 0,397 9849  0,2( 0,057 9985)  

0,2( 0,8) 0,2( 0,8)(1,8)  ( 0,000 1693)   2 6



0,000 4093

0,397 9849  0,011 5997  0,000 0135  0,000 0196  0,386 4183,

que é um valor exato em 6D, com o valor exato em 7D sendo 0,386 4185. (b) Regressiva. Para (18), usamos o j mostrado na segunda coluna e, em cada coluna, o último número. Como r  (1,72  2,00)/0,1 2,8, obtemos então de (18) 2,8( 1,8) 2,8( 1,8)(0,8) J0(1,72)  0,223 8908  2,8( 0,057 9278)   0,000 2400  0,000 4093 2 6  0,223 8908  0,162 1978  0,000 6048  0,000 2750











0,386 4184.



Notação da Diferença Central Esta é uma terceira notação para as diferenças. A primeira diferença central de f(x) em xj é definida por dƒj

ƒj



1/2



ƒj

1/2



e a k-ésima diferença central de f(x) em xj, por (19)

dkƒj



dk

ƒj

1



1/2



dk

ƒj

1



( j  2, 3,

1/2







).



Assim, nesta notação, uma tabela de diferenças, por exemplo, para f-1, f0, f 1, f 2, tem a seguinte aparência: x

1



x0

ƒ

1



ƒ0

x1

ƒ1

x2

ƒ2



1/2



dƒ1/2 dƒ3/2

d2ƒ0 d2ƒ1

d3ƒ1/2

Utilizam-se as diferenças centrais na derivação numérica (Seção 19.5), em equações diferenciais (Capítulo 21) e em fórmulas centralizadas de interpolação (p. ex., a fórmula de Everett no Projeto de Equipe 22). Estas são fórmulas que utilizam valores de funções localizados “simetricamente” em ambos os lados do ponto de interpolação x . Esses valores estão disponíveis próximo do meio de uma tabela dada, em que as fórmulas centralizadas de interpolação tendem a fornecer resultados melhores que os das fórmulas de Newton, as quais não possuem essa propriedade de “simetria”.

PROBLEMAS PROPOSTOS 19.3 1. (Interpolação linear) Calcule p1(x) no Exemplo 1. A partir dele, 3. (Interpolação quadrática) Calcule o polinômio de Lagrange calcule ln 9,4 ≈ p1(9,4). p2(x) para os valores em 4D da função gama [(24), Apêndice 3.1] 2. Faça a estimativa do erro no Problema 1, utilizando (5). (1,00)  1,0000, (1,02)  0,9888, (1,04)  0,9784 e, a partir

Capítulo 19: Métodos Numéricos em Geral

27

disso, calcule as aproximações de(x) para x  1,005, 1,010, ƒ(7,0)  0,3001 1,015, 1,025, 1,030, 1,035. ƒ(7,5)  0,2663 4. (Limites de erro) Obtenha os limites de erro parap2(9,2) no Exemƒ(7,7)  0,2346 plo 2, a partir de (5). por interpolação cúbica, usando (10). 5. (Função de erro) Calcule o polinômio de Lagrangep2(x) para 17. (Diferenças centrais) Escreva a diferença na tabela no Exemplo )  0x os valores em 5D da função de erro ƒ(x )  erf x  (2/  5 usando da notação da diferença central. e w dw , a saber, ƒ(0,25)  0,27633, ƒ(0,5)  0,52050, ƒ(1)  0,84270 e, a partir dep2, uma aproximação de f(0,75)(= 0,71116, 18. (Subtabulação) Calcule a função J1(x) de Bessel para x  0,1; 0,3, , 0,9 de J1(0)  0, J1(0,2)  0,09950; J1(0,4)  0,19603; 5D). J1(0,6)  0,28670;J1(0,8)  0,36884; J1(1,0)  0,44005. Use (14) 6. Obtenha um limite de erro no Problema 5, a partir de (5). com n = 5. 7. (Integral do seno) Calcule o polinômio de Lagrangep2(x) para os 19. (Notações) Calcule uma tabela de diferença def(x) = x3 para x = valores em 4D da integral do seno Si(x) [(40) no Apêndice 3.1], 0, 1, 2, 3, 4, 5. Escolha x0 = 2 e escreva todos os números que p2, ou seja, Si(0) = 0,deSi(1) = 0,9461, Si(2) =4D) 1,6054 e, a partir de ocorrerem utilizando as notações: (a) para as diferenças centrais, as aproximações Si(0,5) (= 0,4931, e Si(1,5) (= 1,3247, (b) para as diferenças progressivas e (c) para as diferenças regres4D). sivas. 8. (Interpolação linear e quadrática) Encontre e–0,25 e e–0,75 por 20. EXPERIMENTO DEÁLGEBRA COMPUTACIONAL.Acresinterpolação linear, comx0 = 0, x1 = 0,5 e x0 = 0,5, x1 = 1, rescentando Termos às Fórmulas de Newton.Escreva um programa pectivamente. Depois encontrep2(x) interpolando e–x com x0 = 0, para a fórmula progressiva (14). Faça experiências com o aumento x1 = 0,5, x2 = 1 e, a partir disso, e–0,25 e e–0,75. Compare os erros da precisão, acrescentando termos sucessivamente. Utilize como dessas interpolações lineares com as interpolações quadráticas. Use dados os valores de alguma função de sua escolha para os quais valores em 4D de e–x. seu aplicativo computacional fornece os valores necessários na 9. (Interpolação cúbica de Lagrange) Calcule e faça um esboço determinação de erros. ou gráfico de L0, L1, L2, L3 para x = 0, 1, 2, 3 em eixos comuns. 21. PROJETO ESCRITO. Interpolação: Comparação de MétoEncontre p3(x) para os dados dos. Faça uma lista de 5 ou 6 idéias que você considera as mais (0, 1) fundamentais desta seção. Arranje-as na melhor ordem lógica. (1, 0,765198) Discuta-as em um relatório de 2 a 3 páginas. (2, 0,223891) 22. PROJETO DE EQUIPE. Interpolação e Extrapolação. (a) Estimativa prática de erro de Lagrange (baseada no Teorema (3, 0,260052) 1). Aplique essa estimativa ap1(9,2) e p2(9,2) para os dadosx 0  [valores da função de Bessel J0(x)]. Encontre p3 para x = 0,5; 1,5; 9,0; x 1  9,5; x 2  11,0; ƒ 0  l n x 0, ƒ 1  l n x 1; ƒ 2  ln x 2 2,5 por interpolação. (valores 6S). 10. (Interpolação e extrapolação) Calcule p2(x) no Exemplo 2. A xj, ƒ(xj))  (0,2; 0,9980); partir disso, calcule aproximações de ln 9,4; ln 10; ln 10,5; ln 11,5; (b)(0,4; dados(0,8; os pontos: Extrapolação. 0,9686); (0,6; São 0,8443); 0,5358);( (1,0; 0). Encontre f(0,7) ln 12; calcule os erros usando valores exatos em 4D e comente. a partir dos polinômios de interpolação quadrática baseados em 11. (Extrapolação) Para os dados do Problema 10, será que um esboço (a)0,6; 0,8; 1,0; (b)0,4; 0,6; 0,8; (g)0,2; 0,4; 0,6. Compare os erros ou um gráfico do produto de x( – xj) em (5) indica que a extrapolae comente. [Valores exatos: ƒ(x)  cos ( 12 px 2), ƒ(0,7)  0,7181 ção provavelmente envolve erros maiores do que a interpolação? (4S).] 12. (Grau inferior) Encontre o grau do polinômio de interpolação (c) Represente graficamente o produto dos fatores x( – xj) na fórpara os dados mula do erro (5) para n = 2,..., 10 separadamente. O que esses (2, 33) gráficos mostram a respeito da precisão da interpolação e da extra(0, 5) polação? (2, 9) (d) Diferenças centrais. Mostre que (4, 45) d2ƒm  ƒ m 1  2ƒ m  ƒ m 1, e, além disso, (6, 113). d3ƒm 1/2  ƒ m 2  3ƒ m 1  3ƒ m  ƒ m 1, dnƒm  nƒm n /2   nƒ m n /2 . 13. (Fórmula da diferença progressiva de Newton) Elabore (14) para os dados do Problema 7 e obtenhap2(x) a partir de (14). (e) A fórmula de interpolação de Everett 14. Elabore a fórmula da diferença progressiva de Newton para os ƒ(x)  (1  r)ƒ0  rƒ1 dados do Problema 3 e calcule(1,01), (1,03), (1,05). (2  r)(1  r)(r) 15. (Fórmula das diferenças divididas de Newton) Calcule f(0,8) e (20) d2ƒ0   f(0,9) a partir de 3! 

2

















ƒ(0,5)  0,479 ƒ(1,0)  0,841 ƒ(2,0)  0,909 por interpolação quadrática. 16. Calcule f(6,5) a partir de ƒ(6,0)  0,1506







(r  1) r (r  1)



dƒ  3! 2

1

é um exemplo de uma fórmula envolvendo somente diferenças de ordem par. Use-a para calcular a função de BesselJ0(x) para x = 1,72 a partir de J0(1,60) = 0,455 4022 eJ0(1,7), J0(1,8), J0(1,9) no Exemplo 6.

28

Parte E • Análise Numérica

19.4 Interpolação por Splines Os dados fornecidos (valores de funções, ponto no plano xy) (x0, f0), (x1, f1), , ( xn, fn) podem ser interpolados por um polinômio Pn(x) de grau igual ou menor que n, de modo que a curva de Pn(x) passa através desses n + 1 pontos (xj, fj); aqui, f0 = f(x0), , fn = f(xn). Veja a Seção 19.3. Ora, se n for grande, pode haver problemas: Pn(x) pode tender a oscilar para x situado entre os nós x0, , xn. Logo, precisamos estar preparados para a ocorrência de instabilidade numérica (Seção 19.1). A Fig. 431 mostra um exemplo famoso dado por C. Runge 3, para o qual o erro máximo chega a se aproximar de ∞ à medida que n ∞ (com os nós mantidos eqüidistantes e seu número aumentando). A Fig. 432 ilustra o aumento da oscilação com n para uma outra função que seja linear por intervalos. Essas oscilações indesejáveis são evitadas pelo método de splines proposto por I. J. Schoenberg em 1946 (Quarterly of Applied Mathematics 4, pp. 45–99, 112–141). Esse método é amplamente utilizado na prática. Ele também lançou as bases para uma boa parte da moderna modelagem assistida por computador, ou CAD *. Seu nome vem de um instrumento utilizado por projetistas **, consistindo em uma régua elástica que pode ser curvada de modo a passar por pontos determinados, sendo mantida em seu lugar pelo uso de pesos. A idéia matemática do método é a seguinte: Em vez de usarmos um único polinômio Pn de grau elevado em todo o intervalo a  x  b onde o nó está situado, ou seja, •



















(1)

a



x0



x1











xn



b,

usamos polinômios de um baixo grau n, por exemplo, cúbicos q0(x),

q1(x),







,

qn

(x),

1



um sobre cada subintervalo entre nós adjacentes; logo, q0 de x0 a x1, depois q1 de x1 a x2, e assim por diante. A partir disso, compomos uma função de interpolação g(x) chamada de spline, juntando esses polinômios em uma única curva contínua que passa através dos pontos referentes aos dados, ou seja: (2)

g(x0)



ƒ( x0)  ƒ 0,

g(x1)

Observe que g(x) = q0(x) quando x0  x





x1,

ƒ( x1)  ƒ 1,







,

g(xn)

então g(x) = q1(x) quando x1





ƒ( xn)  ƒ n.

x



x2,

e assim por diante, de

acordo com aa nossa construção de g. é uma interpolação polinomial por intervalos. Portanto, interpolação de spline

P10(x)

y f(x)

–5

0

5

x

Fig. 431. Exemplo de Runge f(x) = 1/(1 + x2) e o polinômio de interpolação P10(x)

–4

f(x)

4

–4

4

–4

4

P2(x)

P4(x)

P8(x)

Fig. 432. Função linear por intervalos f(x) e polinômios de interpolação de graus crescentes CARL RUNGE (1856–1927), matemático alemão, também conhecido por seus trabalhos sobre EDOs (Seção 21.1). CAD: abreviatura da expressão inglesa, também de uso freqüente: computer-aided design. (N.T.) Lit. ing.: draftsman’s spline. (N.T.)

3

*

**

Capítulo 19: Métodos Numéricos em Geral

29

Os qj’s mais simples seriam polinômios lineares. Entretanto, a curva de uma função linear contínua por intervalos apresenta arestas, e teria pouco interesse geral — imagine, por exemplo, a modelagem da estrutura de um automóvel ou de um navio. Consideraremos os splines cúbicos por serem os mais importantes nas aplicações. Por definição, um spline cúbico g(x) interpolando dados fornecidos (x0, f0), , (xn, fn) é uma função contínua no intervalo a = x0  x  xn = b, que tem a primeira e a segunda derivativas contínuas e que satisfaz à condição de interpolação (2); além disso, entre nós adjacentes, g(x) é dada por um polinômio qj(x) de grau menor ou igual a 3. Afirmamos que esse spline cúbico existe. E se, além de (2), também exigirmos que •

(3)

g(x0)







k0,

g(xn)



kn

(direções tangentes a g(x) dadas nas duas extremidades do intervalo a  x  b), temos então um spline cúbico unicamente determinado. Este é o conteúdo do seguinte teorema da existência e unicidade, cuja prova também sugerirá a determinação real dos splines. (A Condição (3) será discutida após a demonstração.) TEOREMA 1

Existência e Unicidade de Splines Cúbicos

, (xn, fn) com os xj arbitrariamente espaçados [veja (1)] e os Consideremos os pontos(x0, f0), ( x1, f1), , n. Consideremos também que k0 e kn sejam quaisquer números dados. valores dados fj = f(xj), j = 0, 1, Então, existe um e somente um spline cúbico g(x) que corresponde a (1) e satisfaz a (2) e (3). •



PROVA









Por definição, em cada subintervalo Ij dado por xj  x  xj+1, o spline g(x) precisa concordar com um polinômio qj(x) de grau não superior a 3, de modo que (4)

qj (xj)

ƒ( xj),



qj(xj1)



ƒ( xj 1)

( j  0, 1,









, n  1).

Para as derivadas, escrevemos; (5)

qj(xj)



kj,

qj(xj1)



( j  0, 1,

kj1







, n  1)

com k0 e kn dados e k1, , kn-1 a serem determinados posteriormente. As Equações (4) e (5) são quatro condições a serem satisfeitas por cada qj(x). Por cálculo direto e empregando a notação •





(6*)

1



cj



hj



1



podemos verificar que o único polinômio cúbico qj(x) ( j = 0, 1, ƒ(xj) cj2(x

qj (x)

ƒ(xj

(6)

xj

1

)2[1

2

1



xj) [1

xj)(x

cj2(x





xj

xj)2(x







, n  1)

, n –1) que satisfaz a (4) e (5) é xj)]

2cj (x

2

) cj (x

kj cj2 (x kj

1

( j  0, 1,

xj+1 – xj

2cj (x

xj

1

)]

2 1)

xj

1

).

Derivando duas vezes, obtemos (7)

q j(xj)

 6 cj2ƒ(xj) 

(8)

q j(xj1)



6 cj2ƒ(xj 1)  4 cjkj  2 cjkj

1



6 cj ƒ(xj)  6 c ƒ(xj 1)  2 cjkj  4 cjkj 1. 2

2 j





Por definição, g(x) possui derivadas segundas contínuas. Isto fornece as condições q j 1(xj) 



q j(xj)

( j  1,







, n  1).

Se usarmos (7) e também (8) com a substituição de j por j – 1, essas n – 1 equações tornam-se (9)

cj 1 k j 

1





2( cj

1





cj) kj



cj k j1



3 [c 2j

ƒ

1 j





cj2 ƒj1]

onde ƒj  ƒ(xj)  ƒ(xj 1) e ƒj1  ƒ(xj1)  ƒ(xj) e j  1, , n  1, como antes. Esse sistema linear de n – 1 equações tem uma solução única k1, , kn-1, visto que a matriz dos coeficientes é estritamente dominante 













diagonalmente [ou seja, em cada linha, o elemento diagonal (positivo) é maior do que a soma dos outros elementos

30

Parte E • Análise Numérica

(positivos)]. Logo, o determinante da matriz não pode ser zero (como decorre do Teorema 3 na Seção 20.7), de modo que podemos determinar valores únicos k1, , kn-1 da primeira derivada de g(x) nos nós. Isto prova o teorema.  •





As Demandas de Armazenamento e de Tempo na resolução de (9) são modestas, já que a matriz de (9) é esparsa (tem poucos elementos não-nulos) e tridiagonal (pode ter elementos não-nulos somente na diagonal e nas duas “paralelas” adjacentes, acima e abaixo dela). A ocorrência de dominância dispensa a necessidade de pivotação (Seção 7.3). Isto torna os splines eficientes na resolução de problemas grandes, com milhares de nós ou mais. Sobre referências em literatura e alguns comentários críticos, veja a American Mathematical Monthly 105 (1998), 929–941. A condição (3) inclui as condições fixas g(x0)  ƒ (x0), g(xn)  ƒ (xn), (10) nas quais são dadas as direções f (x0) e f (xn) tangentes às extremidades. Outras condições de interesse prático são as condições livres ou naturais. g (x0)

(11)



0,

g (xn)



0

(geometricamente: curvatura zero nas extremidades, como ocorre na régua do projetista), que fornecem um spline natural. Estes nomes são justificados pela Fig. 290, em Problemas Propostos 12.3. , kn-1 resolvendo o sistema linear Determinação de Splines. Considere que k0 e kn sejam dados. Obtenha k1, (9). Lembre-se de que o spline g(x) a ser encontrado consiste em n polinômios cúbicos q0, , qn-1. Escrevemos esses polinômios na forma •







(12)

onde j = 0,

(13)





qj (x)  aj0  aj1(x  xj)  aj2(x  xj)2  aj3(x  xj)3 •





, n – 1. Utilizando a fórmula de Taylor, obtemos aj0



qj(xj)



ƒj

por (2),

aj1



qj(xj)



kj

por (5),

aj2



aj3



3 1 1  q j(xj)   (ƒ  ƒ j)   ( kj 1  2 kj) h2 j 1 h 2 1 2 1  q j (xj)   (ƒ j  ƒ j 1)  2 ( kj 1  kj) 6 h3 h 

por (7),







com aj3 sendo obtido calculando-se q j(xj 1) a partir de (12) e igualando o resultado a (8), ou seja: 6 2 q j(xj 1)  2 aj2  6 aj3h   (ƒ j  ƒ j 1)   ( kj  2 kj 1), 2 





h

h



e então subtraindo disto 2 aj2, conforme dado em (13), e simplificando. Note que, para os nós eqüidistantes de distância hj = h podemos escrever cj = c = 1/ h em (6*) e obter, a partir de (9), simplesmente (14)

EXEMPLO 1

kj

1





3

4 kj  kj

1

 

h

(ƒ j

1



ƒ j 1) 

( j  1,







, n  1).

Interpolação Spline. Nós Eqüidistantes Interpole f(x) = x4 no intervalo –1  x  1 usando o spline cúbico g(x) correspondente aos nós x0 = –1, x1 = 0, x2 = 1 e satisfazendo às condições fixas g(–1) = f (–1), g(1) = f (1).

Solução. Em nossa notação-padrão, os dados fornecidos são ƒ0  ƒ( 1)  1, ƒ1  ƒ(0)  0, ƒ2  ƒ(1)  1. Temos que h = 1 e n = 2, de modo que nosso spline consiste em n = 2 polinômios q0(x) q1(x)

 

a00 a10

 

a01(x a11x





1)



a12x

2

a02(x 



a13x

3

1) 2  a03(x  1) 3

(1  x  0), (0  x  1).

Capítulo 19: Métodos Numéricos em Geral

31

Determinamos o valor de kj a partir de (14) (eqüidistância!) e então os coeficientes do spline a partir de (13). Como n = 2, o sistema (14) é uma equação única (comj = 1 e h = 1) k0



4 k1  k2  3(ƒ2  ƒ 0).

Aqui, f0 = f2 = 1 (o valor de x4 nas extremidades) e k0 = –4, k2 = 4, com os valores da derivada 4 x3 nas extremidades sendo –1 e 1. Logo, 4 

4 k1  4



3(1



1)

0,



k1



0.

De (13), podemos agora obter os coeficientes de q0, ou seja, a00  ƒ 0  1, a01  k0  4, e 3

a02

12 2

a03

13

(ƒ1

ƒ0)

(ƒ0

ƒ1)

1 1

(k1

1 12

2k0)

3(0

1)

(0

8)

5.

k0)

2(1

0)

(0

4)

2.

(k1

De modo semelhante, para os coeficientes de q1, obtemos, a partir de (13), os valores a10  ƒ 1  0, a11  k1  0 e a12

3(ƒ 2

ƒ1)

(k2

2k1)

a13

2(ƒ 1

ƒ2)

(k2

k1)

3(1

0)

2 (0

1)

(4

0)

(4

1

0)

2.

Isso fornece os polinômios nos quais o spline g(x) consiste, ou seja, g(x)



q0(x) q1(x)

1

4(

x2

x

5( x

1)

1)2

2(x

1)3

x2

2x 3

2x 3

se

1

x

0.

se

0

x

1.

A Fig. 433 mostra f(x) e este spline. Você percebe que poderíamos ter poupado quase a metade do nosso trabalho se tivéssemos usado a  simetria do problema? 1

f(x) x

–1

1

g(x)

Fig. 433. Função f(x) = x4 e spline cúbico g(x) do Exemplo 1

EXEMPLO 2

Spline Natural. Nós Arbitrariamente Espaçados Encontre uma aproximação por spline e uma aproximação polinomial para a curva de secção transversal do Santuário do Livro em Jerusalém, que tem forma circular e está mostrado na Fig. 434.

3 2 1

–6

–5

–4

–3

–2

–1

0

1

Fig. 434. Santuário do Livro em Jerusalém (Arquitetos F. Kissler e A. M. Bartus) Solução. Treze pontos, distribuídos de forma aproximadamente igual ao longo do contorno (e não ao longo do eixo x!), fornecem os seguintes números:

32

Parte E • Análise Numérica 5,8

xj

ƒj 0

5,0

1,5

4,0

1,8

2,5

2,2

1,5

2,7

0,8

3,5

0

3,9

0,8 3,5

2,7

1,5 2,2

2,5 1,8

4,0 1,5

5,0 0

5,8

A figura mostra o correspondente polinômio de interpolação de 12º grau, que é inútil devido às suas oscilações. (Por causa do arredondamento, seu aplicativo computacional também lhe fornecerá pequenos termos de erro envolvendo potências ímpares de x.) O polinômio é P12(x)



3,9000  0,65083x 2  0,033858 x 4  0,011041x 6  0,0014010 x 8 

0,000055595x 10  0,00000071867x 12.

O spline praticamente acompanha o contorno do teto, com um pequeno erro próximo aos nós –0,8 e 0,8. O spline é simétrico. Seus seis polinômios correspondentes aos valores positivos de x têm os seguintes coeficientes para suas representações (12). (Note bem que (12) é dada em termos de potências dex – xj, e não de x!)  j

intervalo x

aj0

aj1

0 1 2 3 4 5

0,0...0,8 0,8...1,5 1,5...2,5 2,5...4,0 4,0...5,0 5,0...5,8

3,9 3,5 2,7 2,2 1,8 1,5

0,00 1,01 0,95 0,32 0,027 1,13

a j2

aj3

0,61 0,65

0,015

0,73 0,091 0,29 1,39

0,27

0,66

0,084 0,56

0,58

PROBLEMAS PROPOSTOS 19.4 1. PROJETO ESCRITO.Splines. Escreva, com suas próprias palavras e usando o menor número possível de fórmulas, um relatório curto sobre a interpolação despline, o motivo de seu uso, uma comparação com a interpolação polinomial e suas aplicações. 12. 2. (Polinômio Individualqj) Mostre que, em (6),qj(x) satisfaz tão bem à condição de interpolação (4) quanto à condição da derivada (5). 13.

a g(2)  ƒ(2)  0, g(2)  ƒ(2)  0. Encontre e faça um esboço ou gráfico do correspondente polinômio de interpolação de 4º grau e compare-o com ospline. Comente. ƒ 0  ƒ(0)  1, ƒ 1  ƒ(2)  9, ƒ 2  ƒ(4)  41, ƒ 3  ƒ(6)  41, k 0  0, k 3   12

Verifiquepara as derivações fornecem (7) e (8) a partir 3. (Sistema 4. derivadas)que Obtenha o sistema linear básicode(9)(6). para k1, , kn-1, conforme indicado no texto. 5. (Nós eqüidistantes) Obtenha (14) a partir de (9). 6. (Coeficientes)Forneça os detalhes da obtenção de aj2 e aj3 em (13). 7. Verifique os cálculos no Exemplo 1. 8. (Comparação) Compare o spline g no Exemplo 1 com o polinômio de interpolação quadrática sobre o intervalo inteiro. Encontre os desvios máximos deg e p2 em relação a f. Comente. 9. (Condição natural de spline) Utilizando os coeficientes dados, verifique que o spline no Exemplo 2 satisfaz ag(x) = 0 nas extremidades.

k0

14.

ƒ0



ƒ(



1)



0, ƒ 1



ƒ(0)



4, ƒ 2



ƒ(1)



0,

k2  G x é par? (Justifique.)  ƒ 0  0,ƒ(0) 0.0, ƒ( 1)  ƒ(1)  1, ƒ 2 

ƒ(2)  6, ƒ 3  ƒ(3)  10, k 0  0, k 3  0 15. ƒ 0  ƒ(0)  1, ƒ 1  ƒ(1)  0, ƒ 2  ƒ(2)  1, ƒ 3  ƒ(3)  0, k 0  0, k 3   6 16. Podem ocorrer casos em que umspline seja dado pelo mesmo polinômio em dois subintervalos adjacentes. Para ilustrar este fato, encontre o spline cúbico g(x) para f(x) = sen x correspondente à partição x0  p/2, x1  0, x2  p/2 do intervalo p/2  x  p/2 e satisfazendo g(p/2)  ƒ (p/2) e g(p/2)  ƒ (p/2). 17. (Condições naturais) Explique a observação feita após (11). 18. EXPERIMENTO DE ÁLGEBRA COMPUTACIONAL. Splines versusPolinômios. Se seu aplicativo computacional fornecer 10–16 DETERMINAÇÃO DOS SPLINES splines naturais, encontre-os quandox for um número inteiro entre – m e m, y(0) = 1 e todos os outrosy forem iguais a 0. Represente Encontre o spline cúbico g(x) para os dados fornecidos, com k0 e kn graficamente cada um dessessplines juntamente com o polinômio conforme dados. de interpolaçãop2m. Faça isto param valendo de 2 até 10 (ou mais). 10. ƒ(2)  ƒ(1)  ƒ(1)  ƒ(2)  0, ƒ(0)  1, k0  k4  0 O que acontece à medida quem aumenta? 11. Se, no Problema 10, partíssemos da função linear por intervalos mostrada na Fig. 435, obteríamosg(x) como o spline satisfazendo 19. Se um spline cúbico for três vezes continuamente derivável (ou •





seja, derivadas primeira, segunda mostretiver quesuas ele deve ser um polinômio único.e terceira contínuas), 20. PROJETO DE EQUIPE. Interpolação de Hermite e Curvas de Bezier. Na interpolação de Hermite, desejamos encontrar um 0,5 polinômio p(x) (de grau 2n + 1 ou menos), tal que p(x) e sua –2 –1 1 2 derivada p(x) tenham valores dados nos n + 1 nós. (De modo x 0 mais geral, pode-se exigir quep(x), p(x), p(x)... possuam valores dados nos nós.) (a) Curvas com extremidades e tangentes dadas . Consideremos Fig. 435. Spline e polinômio de interpolação nos Problemas 10 e 11 que C seja uma curva no planoxy representada parametricamente

Capítulo 19: Métodos Numéricos em Geral

por r(t)  [x ( t ), y ( t ) ], 0  t  1 (veja a Seção 9.5). Mostre que, para os pontos inicial e terminal dados de uma curva e para as tangentes inicial e terminal, digamos A:

r0

G B:



r1

[ x (0), y (0) ] [x0, y0],  [ x (1), y (1) ] 

 [x 1, y 1] v0  [x(0), y(0)]  [x0, y0], v1  [x(1), y(1)]

[x 1 , y 1]





(15)

y(t)





x0

r0





(3( r 1



r 0)



(2 v 0



(2( r 0



r 1)



v0

x 0t





(2( x 0

v0 t

y0



y 0t



(2( y 0

(3( x 1



x 0)



x 0





(3( y 1



y 0)



y 1)

y 0



 

x 1)





v 1)) t 2

v1)t 3;





(2 x 0  x 1)) t 2

x 1 ) t 3 

(2 y 0  y 1)) t 2

y 1 ) t 3 .

g0

v1 x 1 , y 1



y 1]

GA(c)

Observe que este é um polinômio de interpolação cúbica de Hermite e n = 1, pois temos dois nós (as extremidades de C). (Isto nada tem a ver com os polinômios de Hermite vistos na Seção 5.8.) Os dois pontos G A:



*

nas componentes, x(t)



1.) (b) Encontre e represente graficamente a curva de Bezier e seus pontos-guia se A: [0, 0], B: [1, 0], v0  [ 12 , 12 ], v1  [ 12 ,  14 3 ]. (c) A alteração dos pontos-guia altera C. Deslocar os pontos-guia para mais longe faz com queC “permaneça perto das tangentes por um tempo mais longo”. Confirme este fato deslocandov0 e v1 em (b) para 2v0 e 2v1 (veja a Fig. 436). (d) Faça outros experimentos por conta própria. O que acontecerá se, em (b), você trocarv1 por –v1? Se você girar as tangentes? Se multiplicar v0 e v1 por fatores positivos menores do que 1?

podemos encontrar uma curva C, a saber: r(t)

[x1

são chamados de pontos-guia, porque os segmentosAGA e BGB especificam graficamente as tangentes.A, B, GA, GB determinam C, e C pode ser prontamente alterado movendo-se os pontos. Uma curva que consista nesses polinômios de interpolação de Hermite chama-se curva de Bezier, nome do engenheiro francês P. Bezier, da Fábrica de Automóveis Renault, que as introduziu no início da década de 1960 para projetar carrocerias de automóveis. As curvas (e as superfícies) de Bezier são usadas em modelagem assistida por computador (CAD) e na fabricação assistida por computador (CAM) . (Veja mais detalhes sobre isto na Ref. [E21], no Apêndice



B:

g1  r1

33



r0



[x 0

 

y

0,2

v0 x 0, y 0

GA(b)

0,4



y 0 ]

(b)

A

e

GB(c)

(c) GB(b)

1 B

x

Fig. 436. Projeto de Equipe 20(b) e (c): curvas de Bezier

19.5 Integração e Derivação Numéricas Integração numérica significa o cálculo numérico de valores das integrais

 ƒ( ) b

J



x dx

a

onde a e b são dados e f é uma função fornecida analiticamente por uma fórmula, ou empiricamente por um tabela de valores. Geometricamente, J é a área sob a curva de f entre a e b (Fig. 437). Sabemos que, se f é tal que podemos encontrar uma função derivável F cuja derivada seja f, então podemos calcular o valor de J aplicando a fórmula familiar

 ƒ( ) b

J



x dx



F(b)



F(a)

[F(x)  ƒ( x)].

a

As tabelas de integrais ou um aplicativo computacional (Mathematica, Maple etc.) podem ser úteis neste propósito. Entretanto, freqüentemente as aplicações conduzem a integrais cuja avaliação analítica seria muito difícil ou mesmo impossível, ou cujo integrando é uma função empírica fornecida por meio de valores numéricos registrados. Em casos assim podemos obter valores numéricos aproximados da integral usando um método de integração numérica.

CAD e CAM: abreviaturas muito utilizadas das expressões srcinais inglesas: computer-aided design e computer-aided making . (N.T.)

*

34

Parte E • Análise Numérica

Regra do Retângulo. Regra do Trapézio Os métodos de integração numérica são obtidos conseguindo-se aproximações do integrando f por meio de funções que podem ser integradas facilmente. A fórmula mais simples, correspondente à regra do retângulo, é obtida se subdividirmos o intervalo de integração a  x  b em n intervalos de igual comprimento h = ( b – a)/n e, em cada subintervalo, obtivermos uma aproximação de f pela constante f(xj*), que é o valor de f no ponto médio xj* do j-ésimo subintervalo (Fig. 438). Então, obtemos uma aproximação de f por meio de função degrau (função constante por intervalos), os n retângulos na Fig. 438 têm as áreas f(x1*)h, , f(xn*)h, e a regra do retângulo é •

 ƒ( )





b

(1)

J



x dx

a

 h [ƒ(x1*)  ƒ( x2*) 











ƒ( xn*)]

b a  . n 

h



A regra do trapézio é geralmente mais precisa. Obtêmo-la se tomarmos a mesma subdivisão de antes e aproximarmos f por uma linha quebrada de segmentos (cordas) com as extremidades [a, f(a)], [x1, f(x1)], , [b, f(b)] na curva de f (Fig. 439). Então a área abaixo da curva de f entre a e b é aproximada por n trapézios de áreas •

1 2

[ƒ(a)



ƒ( x1)]h,

1 2

[ƒ(x1)



ƒ( x2)]h,







,

y

y

1 2

[ƒ(xn





)  ƒ( b)]h.

1



y

y = f(x)

y = f(x)

y = f(x)

R

a

x

b

a x1*

Fig. 437. Interpretação geométrica de uma integral definida

x2*

xn* b

x

a

Fig. 438. Regra do retângulo

x1

x2

xn – 1

b

x

Fig. 439. Regra do trapézio

Fazendo a soma desses trapézios, obtemos a regra do trapézio

 ƒ( ) b

J

(2)



x dx

 h[ 1_2 ƒ(a)  ƒ( x1)  ƒ( x2) 









ƒ( xn 1)  1_2 ƒ(b)] 

a

onde h = (b – a)/n, como em (1). Os xj’s e a e b são chamados de nós. EXEMPLO 1

Regra do Trapézio Avalie J 



1 

e

2

x

dx

usando (2) com n = 10.

0

Solução.

J



0,1(0,5  1,367 879 + 6,778 167) = 0,746 211 da Tabela 19.3.



Tabela 19.3 Cálculos do Exemplo 1 j

xj

0

0

xj2

e

0

xj2



1,000 000

1 2

0,1 0,2

0,01 0,04

0,990 050 0,960 789

43 5 6 7 8 9

0,3 0,4 0,5 0,6 0,7 0,8 0,9

0,09 0,16 0,25 0,36 0,49 0,64 0,81 1,00

0,913 931 0,852 144 0,778 801 0,697 676 0,612 626 0,527 292 0,444 858

10 Somas

1,0

0,367 879 1,367 879

6,778 167

Capítulo 19: Métodos Numéricos em Geral

35

Limites e Estimativa de Erro para a Regra do Trapézio Uma estimativa de erro para a regra do trapézio pode ser obtida de (5) na Seção 19.3 com n = 1, usando-se integração como se segue. Para um único subintervalo, temos ƒ ( t )  2 com um valor apropriado de t dependente de x, situado entre x0 e x1. A integração em x de a = x0 até x1 = x0 + h fornece x h x h ƒ (t (x)) h ƒ(x) dx   [ƒ(x0)  ƒ( x1)]  (x  x0)(x  x0  h) dx . 2 2 x x 

ƒ(x)  p1(x)  ( x  x0)(x  x1)





0



0

0

0

x x0 v e aplicando o teorema do valor médio do cálculo integral, que podemos utilizar, visto que Fazendo (x – x0)(x ––x0 – =h) não muda de sinal, encontramos que o lado direito se iguala a h ƒ ( t ) h3 h 3 ƒ ( t ) h3 (3*) v(v  h) dv          ƒ ( t ) 2 2 3 2 12 0













onde t é um valor (adequado e desconhecido) situado entre x0 e x1. Este é o erro para a regra do trapézio com n = 1, freqüentemente chamado de erro local. Logo, o erro e de (2) com n qualquer é o somatório dessas contribuições provindas dos n subintervalos; como h = (b – a)/n, nh3 = n(b – a)3/n3, e (b – a)2 = n 2h2, obtemos 

e

(3)

(b a ) ƒ (tˆ)  12 n 3



 



2

(b a)  h ƒ (tˆ) 12 

 

2

com tˆ (adequado e desconhecido) situado entre a e b. Devido à Equação (3), a regra do trapézio é também escrita como

 ƒ( ) b

(2*)

J



x dx



a

h [ 12 ƒ(a)



ƒ( x1) 









ƒ( xn 1)  12 ƒ(b)]  

(b a)  h ƒ (tˆ). 12 

2

Os Limites de Erro são agora obtidos tomando-se o maior valor para f , digamos, M2, e o menor valor, M2*, no intervalo de integração. Então, (3) fornece (note que K é negativo) (4)

KM2



e



KM2*

(b a)  12n 3



onde

K

 

2

b a  h. 12 

 

2

A Estimativa do Erro Reduzindo-se h à Metade é aconselhável se h for muito complicado ou desconhecido, por exemplo, no caso de os dados serem experimentais. Então, podemos aplicar o Princípio do Erro da Seção 19.1. Ou seja, fazemos o cálculo usando (2), primeiramente com h, obtendo, digamos, J = Jh + eh, e então com 12h, obtendo J = Jh/2 + eh/2. Ora, se em (3) substituirmos h2 por ( 12h)2, o erro fica multiplicado por 14 . Logo, eh/2 ≈ 14 eh (não exatamente igual porque tˆ pode diferir). Juntos, Jh/2 + eh/2 = Jh + eh ≈ Jh + 4eh/2. Portanto, Jh/2 – Jh = (4 – 1)eh/2. Dividindo por 3, obtemos a fórmula do erro para Jh/2 (5)

EXEMPLO 2

eh /2



1 3

 ( Jh /2  Jh).

Estimativa do Erro para a Regra do Trapézio Usando-se (4) e (5) Estime o erro do valor aproximado no Exemplo 1 utilizando (4) e (5).

Solução. (A) Limites do erro por(4). Por derivação, f (x) = 2(2x2 – 1)e x . Além disso, f (x) > 0 se 0 < x < 1, de modo que os valores mínimo e máximo ocorrem nas extremidades do intervalo. Calculamos M2 = f (1) = 0,735 759 e M2* = f (0) = –2. Além disso, K = –1/1200, e (4) fornece 

–0,000 614



e



2

0,001 667.

Logo, o valor exato de J deve se situar entre 0,746 211 – 0,000 614 = 0,745 597 Na verdade, J = 0,746 824, com uma exatidão de 6D.

e

0,746 211 + 0,001 667 = 0,747 878.

36

Parte E • Análise Numérica

(B) Estimativa do erro por(5). Jh = 0,746 211 no Exemplo 1. Além disso, Jh /2



0,05

19

e

1

( j /20)2

2

j 1

(1

0,367879)



0,746671.

Logo, eh/2 = 13 (Jh/2 – Jh) = 0,000 153 e Jh/2 + eh/2 = 0,746 824, com uma exatidão de 6D.



Regra de Integração de Simpson Se uma aproximação constante por intervalos de f nos levou à regra do retângulo (1) e uma aproximação linear por intervalos nos levou à regra do trapézio (2), agora uma aproximação quadrática por intervalos nos levará à regra de Simpson, que é de grande importância prática devido ao fato de ser suficientemente exata para a maioria dos problemas, embora ainda suficientemente simples. Para obtermos a regra de Simpson, dividimos o intervalo de integração a  x  b em um número par de subintervalos iguais, digamos, em n = 2 m subintervalos de comprimento h = ( b – a)/2m, com as extremidades x0 (= a), x1, , x2m-1, x2m (= b); veja a Fig. 440. Agora tomamos os dois primeiros subintervalos e obtemos uma aproximação de f(x) no intervalo x0  x  x2 = x0 + 2h usando o polinômio de Lagrange p2(x) que passa pelos pontos (x0, f0), ( x1, f1), ( x2, f2), onde fj = f(xj). De (3) da Seção 19.3, obtemos (x  x1)(x  x2) (x  x0)(x  x2) (x  x0)(x  x1) (6) ƒ  ƒ  ƒ. p2(x)  (x0  x1)(x0  x2) 0 (x1  x0)(x1  x2) 1 (x2  x0)(x2  x1) 2 Os denominadores em (6) são 2 h2, – h2 e 2h2, respectivamente. Fazendo s = (x – x1)/h, temos •





 

x

x1





sh, x



x2









( x1  h)  ( s  1) h

x



x0

x



( x1  h)  ( s  1) h

x

e obtemos p2(x)



1 2

s (s



1)ƒ 0  ( s  1)( s  1)ƒ 1  12 (s  1) sƒ2.

Agora integramos em x de x0 a x2. Isto corresponde a integrar em s de –1 a 1. Como dx = h ds, o resultado é 1 4 1    (7*) x  x p2(x) dx  h 3 ƒ 0  3 ƒ 1  3 ƒ 2 . Uma fórmula similar se verifica para os dois próximos subintervalos de x2 a x4, e assim por diante. Somando todas essas m fórmulas, obtemos a regra de Simpson4 x2



 ƒ( )

0

b

(7)

x dx



a

x2

ƒ(x) dx

h



3





0

(ƒ 0  4ƒ 1  2ƒ 2  4ƒ 3 











2ƒ 2m

2





4ƒ 2m

1





ƒ 2m),

onde h = (b – a)/(2m) e fj = f(xj). A Tabela 19.4 apresenta um algoritmo para a regra de Simpson.

y

Primeira parábola Segunda parábola y = f(x)

a

x1

x2

x3

x4

Última parábola

x2m–2

x2m–1 b

x

Fig. 440. Regra de Simpson

4 THOMAS SIMPSON (1710–1761), matemático autodidata inglês, autor de diversos livros-texto populares. A regra de Simpson foi usada muito mais cedo por Torricelli, Gregory (em 1668) e Newton (em 1676).

Capítulo 19: Métodos Numéricos em Geral

37

Tabela 19.4 Regra de Integração de Simpson

ALGORITMO SIMPSON (a, b, m, f0, f1, , f2m) Este algoritmo calcula a integral J  eba ƒ(x) dx de valores dados fj = f(xj) em pontos eqüidistantes x0 = a, , x2m = x0 + 2mh = b pela regra de Simpson (7), onde h = (b – a)/(2m). x1 = x0 + h, ENTRADA: a, b, m, f0, , f2m SAÍDA: Valor aproximado  J de J Calcule s0 = f0 + f2m s1 = f1 + f3 + ... + f2m-1 s2 = f2 + f4 + ... + f2m-2 h = (b – a)/2m h  J   ( s0  4 s1  2 s2) 3 SAÍDA  J . Pare. Fim SIMPSON •

















Erro da Regra de Simpson (7). Se a quarta derivada f (4) existe e é contínua em a  x  b, o erro de (7), chamado de es, é (b  a)5 (4) (b  a) 4 (4) (8) ƒ (tˆ)   eS    h ƒ ( tˆ ); 180(2 m)4 180 aqui, tˆ é um valor adequado e desconhecido, situado entre a e b, e é obtido de forma similar a (3). Com isso, podemos também escrever a regra de Simpson (7) como b (b  a) 4 (4) h (7**) ƒ(x) dx   (ƒ 0  4ƒ 1   ƒ 2m)  h ƒ ( tˆ ). 180 3 a













Limites de Erro. Em (8), tomando para f(4) o valor máximo M4 e o valor mínimo M4* no intervalo de integração, obtemos de (8) os limites de erro (note que C é negativo) (9)

CM4



eS



(b  a) (b  a)    h . 180(2 m) 180 5

CM4*

onde

C

 

4

4

Grau de Precisão (GP) de uma fórmula de integração. Trata-se do grau máximo assumido por polinômios arbitrários para os quais a fórmula fornece valores exatos das integrais para quaisquer intervalos. Logo, para a regra do trapézio,

GP = 1 pois aproximamos a curva de f por segmentos de retas (polinômios lineares). Para a regra de Simpson, poderíamos esperar que GP = 2 (por quê?). Na verdade, GP = 3 por causa de (9), visto que f (4) é identicamente nula para polinômios cúbicos. Isso torna a regra de Simpson suficientemente precisa para a maioria dos problemas práticos e justifica a sua popularidade. A Estabilidade Numérica com relação ao arredondamentoé outra importante propriedade da regra de Simpson. De fato, para o somatório dos erros de arredondamento ej dos 2m + 1 valores fj em (7) obtemos, visto que h = (b – a)/2m, h (b  a) 6 m u  ( b  a) u  e2m   e0  4 e1  3 3 2m onde u é a unidade de arredondamento (u = 12  10 –6 se arredondarmos para 6D; veja a Seção 19.1). Além disso, 6 = 1 + 4 + 1 é a soma dos coeficientes para um par de intervalos em (7); faça m = 1 em (7) para verificar isso. •





 

38

Parte E • Análise Numérica

O limite (b – a)u é independente de m, de modo que ele não pode aumentar com o crescimento de m, ou seja, com o decrescimento de h. Isto prova a estabilidade.  Fórmulas de Newton–Cotes. Devemos mencionar que as regras do trapézio e de Simpson são casos especiais das fórmulas fechadas de Newton–Cotes, ou seja, fórmulas de integração nas quaisf(x) é interpolada em nós igualmente espaçados utilizando-se um polinômio de graun (n = 1 para a regra do trapézio,n = 2 para a regra de Simpson), e a expressão fórmula fechada significa que a e b são nós (a = x0, b = xn). Ocasionalmente se utilizan = 3 (regra dos três oitavos; examine o Problema 33), bem como valores maiores den. De n = 8 em diante, alguns dos coeficientes tornam-se negativos, de modo que um valor positivo parafj pode resultar numa contribuição negativa para a integral, o que é absurdo. Para saber mais sobre esse tópico, veja a Ref. [E25] no Apêndice 1. EXEMPLO 3

Regra de Simpson. Estimativa do Erro 1

Avalie J 



e

x2



dx

pela regra de Simpson com 2m = 10 e estime o erro.

0

Solução. Como h = 0,1, a Tabela 19.5 fornece 0,1 J   (1,367 879  4 3,740 266  2 3,037 901)  0,746 825. 3 Estimativa do erro. A derivação fornecef (4)(x) = 4(4x4 – 12 x2 + 3) e x . Considerando a derivada f (5) de f (4), constatamos que o maior valor de f (4) no intervalo de integração ocorre em 0 e o menor valor, em x *  (2,5  0,5 10 )1/2. Calculando, encontramos os valores M4 = f (4)(0) = 12 e M4* = f(4)(x*) = –7,419. Como 2 m = 10 e b – a = 1, obtemos C = –1/1 800 000 = –0,000 000 56. Portanto, de (9), 





–0,000 007



2

eS



0,000 005.

Logo, J deve se situar entre 0,746 825 – 0,000 007 = 0,746 818 e 0,746 825 + 0,000 005 = 0,746 830, de modo que pelo menos quatro dígitos do nosso valor aproximado são exatos. Com efeito, o valor 0,746 825 é exato em 5D, pois J = 0,746 824 (exato em 6D). Portanto, nosso resultado é muito melhor que o do Exemplo 1 obtido pela regra do trapézio, enquanto o número de operações é aproxi madamente o mesmo em ambos os casos.

Tabela 19.5 Cálculos do Exemplo 3

2

j

xj

xj2

0

0

0

1

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

3 4 5 6 7 8 9 10 Somas

xj2



e

1,000 000

0,01 0,04

0,990 050

0,09

0,913 931

0,960 789

0,16

0,852 144

0,25

0,778 801 0,36

0,697 676

0,49

0,612 626 0,64

0,527 292

0,81 1,00

0,444 858 0,367 879 1,367 879

3,740 266

3,037 901

Ao invés de escolher um n = 2m e então estimarmos o erro usando (9), como no Exemplo 3, é melhor requerer uma precisão (por exemplo, 6D) e então determinar n = 2m a partir de (9). EXEMPLO 4

Determinação de n = 2m na Regra de Simpson a partir de uma Precisão Requerida Qual n devemos escolher no Exemplo 3 para obtermos uma precisão de 6D?

Solução. Utilizando M4 = 12 (que, em valor absoluto, é maior que M4*), obtemos de (9), com b – a = 1 e a precisão requerida, 12 2 10 6 12 1/4 1 m   CM4    10 6, assim,  9,55. 180(2 m)4 180 2 4 2

















Logo, devemos escolher n = 2m = 20. Fazendo o cálculo, que é similar ao do Exemplo 3. Note que, em (4) ou (9), os limites de erro algumas vezes podem ser folgados, de modo que, em casos assim, um menor valor n = 2m  pode já ser suficiente.

Estimativa do Erro para a Regra de Simpson pela Redução de h à Metade. A idéia é a mesma de (5) e fornece

Capítulo 19: Métodos Numéricos em Geral

eh/2

(10)

39

1   ( Jh/2  Jh). 15

é obtido usando-se h; Jh/2 é obtido usando-se 12 h, e eh/2 é o erro de Jh/2. Obtenção. Em (5), tínhamos 13 como o recíproco de 3 = 4 – 1 e 14 = ( 12 )2 resultante de h2 em (3) substituindo-se 1 como o recíproco de 15 = 16 – 1 e 1 = ( 1 )4 resultante de 4 em (8) substituindo-se h por 12 h. Em (10), temos 15 h 16 2 h por 12 h. Jh

EXEMPLO 5

Estimativa de Erro para a Regra de Simpson pela Redução de h à Metade Integre ƒ(x)  14 px 4 cos 14 px de 0 a 2 com h = 1 e aplique (10).

Solução. O valor exato 5D da integral é J = 1,25953. A regra de Simpson fornece Jh Jh/2

[ƒ(0)

4ƒ(1)  ƒ(2)]  13 (0  4 0,555360  0)

0,740480,



1 3



1 1  ƒ(0)  4ƒ  6 2



1  [0  4 0,045351  2 0,555361  4 1,521579  0]  1,22974. 6











3  2ƒ(1)  4ƒ  2







ƒ(2)







Logo (10) fornece eh/2 = 151 (1,22974 – 0,74048) = 0,032617 e, assim, J ≈ Jh/2 + eh/2 = 1,26236, com um erro de –0,00283, que é menor em  módulo do que 101 do erro 0,02979 de Jh/2. Portanto, o uso de (10) foi bastante proveitoso.

Integração Adaptativa A idéia é adaptar o passo h à variabilidade de f(x). Ou seja, onde f varia apenas um pouco, podemos proceder em grandes passos sem provocar um erro substancial na integral, mas onde f varia rapidamente, temos de efetuar pequenos passos a fim de, em todos os lugares, permanecermos perto o bastante da curva de f. A mudança de h é feita sistematicamente, usualmente dividindo-se h pela metade, e automaticamente (não “de forma manual”) dependendo do tamanho do erro (estimado) ao longo de um subintervalo. O subintervalo é dividido pela metade se o erro correspondente for ainda muito grande, ou seja, maior do que uma dada tolerância TOL (máximo erro absoluto admissível), ou não é dividido pela metade se o erro for menor ou igual à TOL. A adaptação das métodos. técnicas típicas utilizadas nos softwares. conexão com a integração, ela pode ser aplicadaé uma a vários Explicá-la-emos aquimodernos no contexto da regraEm de Simpson. Na Tabela 19.6, um asterisco indica que se atingiu TOL para o subintervalo em questão. EXEMPLO 6

Integração Adaptativa com a Regra de Simpson Integre ƒ(x)  14 px 4 cos 14 px de x = 0 a x = 2, usando a integração adaptativa e a regra de Simpson, com TOL[0,2] = 0,0002. f(x) e os intervalos adaptados utilizados. Os dois primeiros Solução. A Tabela 19.6 mostra os cálculos. A Fig. 441 mostra o integrando intervalos ([0, 0,5], [0,5, 1,0]) têm um comprimento de 0,5, logo, h = 0,25 [pois usamos 2 m = 2 subintervalos na regra de Simpson (7**)]. Os dois intervalos seguintes ([1,00, 1,25], [1,25, 1,50]) têm um comprimento de 0,25 (logo, h = 0,125) e os quatro últimos intervalos têm um comprimento de 0,125. Cálculos amostrais. Para 0,740480, veja o Exemplo 5. A fórmula (10) fornece (0,123716 – 0,122794)/15 = 0,000061. Note que 0,123716 se refere a [0, 0,5] e [0,5, 1], de modo que precisamos subtrair o valor correspondente a [0,1] na linha anterior etc. A TOL[0,2] = 0,0002 fornece 0,0001 para os subintervalos de comprimento 1, fornece 0,00005 para os subintervalos de comprimento 0,5 etc. O valor da integral que se obtém é a soma dos valores marcados por um asterisco (para os quais a estimativa de erro torna-se menor do que a TOL). Isso nos dá J

 0,123716  0,528895  0,388263  0,218483  1,25936.

O valor exato em 5D é J = 1,25953. Logo, o erro é 0,00017. Isto é cerca de 1/200 do valor absoluto do erro no Exemplo 5. O cálculo mais  longo que agora fizemos produziu um resultado muito melhor. f(x)

1,5 1,0 0,5 0

0

0,5

1

1,5

2

x

Fig. 441. Integração adaptativa do Exemplo 6

40

Parte E • Análise Numérica

Tabela 19.6 Cálculos do Exemplo 6

Intervalo

Integral

[0, 2] [0, 1] [1, 2]

Erro(10)

0,740480 0,122794 1,10695 Soma  1,22974 0,004782 0,118934 Soma  0,123716* 0,528176 0,605821 Soma  1,13300 0,200544 0,328351 Soma  0,528895* 0,388235 0,218457 Soma  0,606692 0,196244 0,192019 Soma  0,388263* 0,153405 0,065078 Soma  0,218483*

[0,0,0,5] [0,5,1,0] [1,0,1,5] [1,5,2,0] [1,00,1,25] [1,25,1,50] [1,50,1,75] [1,75,2,00] [1,500,1,625] [1,625,1,750] [1,750,1,875] [1,875,2,000]

TOL

Comentário

0,0002

0,032617

0,0002

Dividirnovamente

0,000061

0,0001

TOLalcançada

0,001803

0,0001

Dividirnovamente

0,000048

0,00005

TOLalcançada

0,000058

0,00005

Dividirnovamente

0,000002

0,000025

TOLalcançada

0,000002

0,000025

TOLalcançada

Fórmulas de Integração de Gauss. Máximo Grau de Precisão As fórmulas de integração que discutimos até agora utilizam valores da função em valores de x (nós) predeterminados (eqüidistantes) e fornecem resultados exatos para polinômios que não excedem um certo grau [chamado de grau de precisão; veja depois (9)]. Porém, podemos obter fórmulas de integração muito mais exatas do seguinte modo. Fazemos



(11)

n

1

ƒ(t) dt   Ajƒj

1



[ƒj  ƒ( tj)]

j1

com n fixo, e t = 1 obtido de x = a, b fazendo x = 12 [a(t – 1) + b(t + 1)]. Então, determinamos os n coeficientes A1, , An e n nós t1, , tn, de modo que (11) forneça resultados exatos para polinômios de um grau k tão alto quanto possível. Como n + n = 2n é o número de coeficientes de um polinômio de grau 2n – 1, segue-se que k  2 n – 1. Gauss mostrou que é possível atingir uma precisão para polinômios de grau não excedendo 2 n – 1 (ao invés de n – 1, como ocorria com os nós predeterminados), e ele forneceu a localização de tj (= o j-ésimo zero do polinômio de Legendre Pn na Seção 5.3) e dos coeficientes Aj que dependem de n, mas não de f(t), e que são obtidos usando-se o polinômio de interpolação de Lagrange, conforme mostra a Ref. [E5] no Apêndice 1. Com esses tj e Aj, a fórmula (11) é chamada de fórmula de integração de Gauss ou fórmula da quadratura de Gauss. n = 2, Seu grau de precisão é 2n – 1, como dizemos há pouco. A Tabela 19.7 fornece os valores necessários para , 5. (Para n maior, veja a Ref. [RG1] no Apêndice 1.) •



EXEMPLO 7















Fórmula de Integração de Gauss com n = 3 Avalie a integral no Exemplo 3 pela fórmula de integração de Gauss (11) com n = 3.

Solução. Temos que converter nossa integral de 0 a 1 em uma integral de –1 a 1. Fazemos então x = 12 ( t + 1). Logo, dx = com n = 3 e os valores acima dos nós e os coeficientes fornecem

1 2

dt,

e (11)

Capítulo 19: Métodos Numéricos em Geral

41

Tabela 19.7 Integração de Gauss: Nós tj e Coeficientes Aj

Nós tj

n

0,57735

Grau de precisão

Coeficientes Aj 1

02692

2

3 0,57735 02692 0,77459 66692 0 0,77459 66692 0,86113 63116

3

4

1 0,55555 55556 0,88888 88889 0,55555 55556 0,34785 48451

0,33998

10436 0,33998 10436 0,86113 63116 0,90617 98459 0,53846 93101 0 0,53846 93101 0,90617 98459

5

0,6521451549 0,65214 51549 0,34785 48451 0,23692 68851 0,47862 86705 0,56888 88889 0,47862 86705 0,23692 68851 1

1

exp ( x 2) dx

2

0

1 2



5 9

exp

  1 4

5

3

1

5



2

)

8 9

exp

7

9

1

exp ( 1

  1 4

1 4

(t

5 exp 9

1)2) dt

  1

1

3

4

5

  2

0,746 815

(valor exato em 6D: 0,746 825), que é quase tão exato quanto o resultado obtido pela regra de Simpson no Exemplo 3, onde era necessário um número muito maior de operações aritméticas. Usando 3 valores da função (como neste exemplo) e a regra de Simpson, obteríamos 16 (1 + 4e–0,25 + e–1) = 0,747 180, com um erro mais de 30 vezes superior ao da integração de Gauss.

EXEMPLO 8



Fórmula de Integração de Gauss com n = 4 e 5 Integre ƒ(x)  14 px 4 cos 14 px de 0 a 2 por Gauss. Compare com a integração adaptativa no Exemplo 6 e comente.

Solução.

x= t+

1 fornece ƒ( t)  14 p(t  1) 4 cos (14 p(t  1)), conforme necessário em (11). Para n = 4, calculamos (6S) J

 A1ƒ1  









A 4 ƒ4



A1(ƒ 1



ƒ 4)  A2 (ƒ2  ƒ 3)

0,347855(0,000290309  1,02570)  0,652145(0,129464  1,25459)  1,25950.

O erro é 0,00003, pois J = 1,25953 (6S). Calculando com 10S e n = 4, obtemos o mesmo resultado; logo, o erro se deve à fórmula, não ao arredondamento. Para n = 5 e 10S, temos J ≈ 1,25952 6185, um valor maior pela quantidade 0,00000 0250, pois J = 1,25952 5935 (10S). A  exatidão é impressionante, particularmente se compararmos a quantidade de trabalho que aqui tivemos com a do Exemplo 6.

A integração de Gauss é de considerável importância prática. Sempre que o integrando f for dado por uma fórmula (e não simplesmente por uma tabela de números) ou quando medições experimentais podem ser efetuadas em instantes tj (ou independentemente do que t represente) como mostrado na Tabela 19.7 ou na Ref. [RG1], então a grande acurácia da integração de Gauss se sobrepõe à desvantagem das complicações referentes a tj e Aj (que podem precisar ser armazenados). Além disso, os coeficientes de Gauss Aj são positivos para todo n, diferentemente de alguns coeficientes de Newton–Cotes para maiores valores de n. É claro que existem freqüentes aplicações com nós igualmente espaçados, casos em que a integração de Gauss não se aplica (ou não representa uma grande vantagem, visto que é preciso primeiro obter-se tj em (11) por interpolação). Como as extremidades –1 e 1 do intervalo de integração em (11) não são zeros de Pn, elas não ocorrem entre os valores t0, , tn, fazendo com que a fórmula de Gauss (11) seja assim chamada de fórmula aberta, para contrastá-la com uma fórmula fechada, onde as extremidades do intervalo de integração são t0 e tn. [Por exemplo, (2) e (7) são fórmulas fechadas.] •





42

Parte E • Análise Numérica

Derivação Numérica A derivação numérica é a computação de valores da derivada de uma função f usando-se valores dados de f. A derivação numérica deve ser evitada sempre que possível, pois, ao passo que a integração é um processo suave e que não é muito afetado por pequenas imprecisões nos valores da função, a derivação tende a tornar os resultados grosseiros, em geral fornecendo valores de f  muito menos exatos que os de f — lembre-se de que a derivada é o limite de um quociente de diferenças e neste último usualmente há uma pequena diferença de grandes quantidades que então dividimos por uma pequena quantidade. Entretanto, as fórmulas que obteremos para a derivação serão fundamentais à obtenção de soluções numéricas de equações diferenciais. Utilizamos as notações f j = f (xj), f j = f (xj) etc., e podemos obter fórmulas grosseiras de aproximação para as derivadas lembrando que ƒ(x  h)  ƒ( x) h 0 ƒ(x)  lim

h  ƒ ƒ dƒ  .  h h →

Isto sugere (12)

ƒ1/2 

1/2



1



.

0

De forma similar, para a segunda derivada, obtemos ƒ2  2ƒ 1  ƒ 0 d2ƒ1 ƒ 1   (13) , 2 2

 h

h

etc.

Obtemos soluções mais precisas se derivarmos polinômios de Lagrange apropriados. Derivando (6) e lembrando que os denominadores em (6) são 2h2, – h2 e 2h2, temos 2 x  x1  x2 2 x  x0  x1 2 x  x0  x2 ƒ(x)  p 2(x)  ƒ0  ƒ1  ƒ 2. 2h2 2h2 h2 Avaliando isto em x0, x1, x2, obtemos as “fórmulas de três pontos” 1 (a) ƒ0   ( 3ƒ0  4ƒ 1  ƒ 2), 2h 1 ( ƒ  ƒ ), (14) (b) ƒ1   0 2 2h 1 (c) ƒ2   (ƒ 0  4ƒ 1  3ƒ 2). 2h Aplicando esta mesma idéia ao polinômio de Lagrange p4(x), obtemos fórmulas similares, em particular, 1 (15) ƒ2   (ƒ 0  8ƒ 1  8ƒ 3  ƒ 4). 12h







Alguns exemplos e fórmulas adicionais são fornecidos em Problemas Propostos, bem como na Ref. [E5] no Apêndice 1.

PROBLEMAS PROPOSTOS 19.5 1. (Regra do retângulo) Avalie a integral no Exemplo 1 utilizando a regra do retângulo (1) com um subintervalo de comprimento 0,1. 2. Obtenha uma fórmula para os limites inferior e superior utilizando a regra do retângulo e aplique-a ao Problema 1.

3–8

REGRAS DO TRAPÉZIO E DE SIMPSON

Avalie numericamente as integrais conforme o indicado e determine o erro empregando uma fórmula de integração conhecida do cálculo.

 ** , ()  x

F(x)



1

Hx

*  , cos * x

dx

G(x)

x

2

0

x



0

x *e

x*



dx *

dx

x

3. 4. 5. 6. 7. 8.

F(2) por (2), n =

10 10 (2), n = 10 (7), n = 10 (2), n = 10 (7), n = 10

F(2) por (7), n = G(1)

por por H(4) por H(4) por G(1)

9–12

DIVISÃO PELA METADE

Estime o erro utilizando a divisão pela metade. 9. No Problema 5 10. No Problema 6

43

Capítulo 19: Métodos Numéricos em Geral

11. No Problema 7 12. No Problema 8

13–19 INTEGRAIS NÃO-ELEMENTARES As integrais a seguir não podem ser avaliadas pelos métodos usuais do cálculo. Avalie-as conforme o indicado. sen *  * x

Si(x) 

0

 sen ( * )

x

x

dx *,

x

S(x) 

x

2

 cos ( * ) x

dx *,

C(x) 

0

x

2

dx *

Passo 2.Mostre que e21 = –0,066596; logo, e21 > TOL e continue. Use (2) comh/4 para obter J31 e some-o à estimativa de erro e31 = 1/3(J31 – J21) para obter o melhor valor J32 = J31 + e31. Calcule 1 1  e32  4 2  1 ( J32  J22)  15 ( J32  J22). Se e32  TOL, pare. O resultado éJ33 = J32 + e32. (Por que 24 = 16 aparece?) Mostre que obtemose32 = –0,000266, de modo que podemos parar. Arranje seus valoresJ e e em um tipo de “tabela de diferenças.”



J11

0

21

Si(x) é a integral do seno. S(x) e C(x) são as integrais de Fresnel. (Veja o Apêndice 3.1.) 13. Si(x) por (2), n = 5, n = 10 14. Usando os valores doProblema 13, obtenha ummelhor valor para Si(1). Sugestão: use (5). 15. Si(1) por (7), 2m = 2, 2m = 4 16. Obtenha um melhor valor noProblema 15. Sugestão: use (10). 17. Si(1) por (7), 2m = 10 18. S(1,25) por (7), 2m = 10 19. C(1,25) por (7), 2m = 10 20. (Estabilidade) Prove que a regra do trapézio é estável com relação ao arredondamento.

21–24 INTEGRAÇÃO DE GAUSS

J22

J21 31

J31

32

J33

J32

Se e32 fosse maior do que TOL, você teria que continuar e calcular o próximo passoJ41 a partir de (2) com h = 14 ; então, 1 J42  J41  e41 com e41   ( J41  J31) 3 1 J43  J42  e42 com e42   ( J42  J32) 15 1 J44  J43  e43 com e43   ( J43  J33) 63 onde 63 = 2 6 – 1. (Como isso aparece?) Aplique o método de Romberg à integral de ƒ( x)  14 px 4 cos 1 –4 4 px de x = 0 a 2 com TOL = 10 .

Integre por (11) comn = 5: 21. 1/x de 1 a 3 22. cos x de 0 a 12 p 23. e x de 0 a 1 24. sen (x2) de 0 a 1,25 25. (TOL dada) No cálculo da integral de 1/x de 1 a 2, encontre o menor n para o qual a precisão em 5D é garantida: (a) por (4) no uso de (2), (b) por (9) no uso de (7). Compare e comente. 26. PROJETO DE EQUIPE. Integração de Romberg (W. Romberg, Norske Videnskab. Trondheim, Førh. 28, Nr. 7, 1955). Este método utiliza a regra do trapézio e ganha precisão passo a passo dividindo h pela metade e adicionando uma estimativa de erro. Faça isto para a integral de f(x) = e–x de x = 0 a x = 2 com TOL = 10–3, como se segue. Passo 1.Aplique a regra do trapézio (2) comh = 2 (logo, n = 1) para obter uma aproximaçãoJ11. Divida h pela metade e use (2) para obter J21 e uma estimativa de erro 1 e21  2 ( J  J11). 2  1 21 Se e21  TOL, pare. O resultado éJ22 = J21 + e21.

DERIVAÇÃO

E PROBLEMAS REVISÃO DO 1. QUESTÕES O que é um método numérico? De queDE modo os computadores vêm influenciando os métodos numéricos? 2. O que é uma representação de números por ponto flutuante?Overflow e underflow? 3. Como o erro e o erro relativo se comportam naadição? Na multiplicação? 4. Por que os erros de arredondamento são importantes? Enuncie as regras de arredondamento.

CAPÍTULO 5. O que é um algoritmo? Quais de suas19 propriedades são importantes na implementação de programas de computador? 6. Por que a seleção de umbom método é pelo menos tão importante em um grande computador quanto em um pequeno? 7. Explique os métodos de resolução de equações, em particular a iteração de ponto fixo e a sua convergência. 8. O método de Newton (–Raphson) pode divergir? Ele é rápido? Responda a estas mesmas questões para o método da bissecção.



2



27. Considere f(x) = x4 para x0 = 0, x1 = 0,2, x2 = 0,4, x3 = 0,6, x4 = 0,8. Calcule f 2 a partir de (14a), (14b), (14c), (15). Determine os erros. Compare e comente. 28. Uma “fórmula de 1quatro pontos” para a derivada é ƒ2   6h ( 2ƒ1  3ƒ 2  6ƒ 3  ƒ 4). Aplique esta fórmula a f(x) = x4 com x1,..., x4 como no Problema 27, determine o erro e compare-o com o obtido no caso de (15). 29. Também se pode obter uma aproximação para a derivadaf (x) em termos de diferenças de primeira ordem e de ordens superiores (veja a Seção 19.3):

1 ƒ(x0)   h

ƒ 

0

1 2

1 3

1 4

  2ƒ0   3ƒ0   4ƒ0  





.



Calcule f (0,4) no Problema 27 com esta fórmula, utilizando diferenças até (inclusive) a primeira ordem, segunda ordem, terceira ordem, quarta ordem. 30. Obtenha a fórmula do Problema 29 a partir de (14) da Seção 19.3.

44

Parte E • Análise Numérica

9. Qual é a vantagem das fórmulas de interpolação de Newton em relação às de Lagrange? 10. O que você se lembra sobre os erros na interpolação polinomial? 11. O que é interpolaçãospline? Qual é a sua vantagem em relação à interpolação polinomial? 12. Liste e compare os métodos numéricos de integração. Quando você os aplicaria? 13. Em que sentido a integração de Gauss é ótima? Explique os detalhes. 14. O que significa integração adaptativa? Por que ela é útil? 15. Por que a derivação numérica é geralmente mais delicada que a integração numérica? 16. Escreva –0,35287, 1274,799, –0,00614, 24,9482, 1/3, 85/7 na forma de ponto flutuante com 5S (5 dígitos significativos, apropriadamente arredondados). 17. Calcule (5,346 – 3,644)/(3,454 – 3,055) conforme dados e depois arredondados passo a passo para 3S, 2S, 1S. (“Passo a passo” significa arredondar os quatro números já arredondados, e não os números dados.) Comente os resultados obtidos. 18. Calcule 0,29731/(4,1232 – 4,0872) com os números conforme dados e depois arredondados passo a passo (ou seja, arredondando mais uma vez os números arredondados) para 4S, 3S, 2S. Comente. 19. Resolva x2 – 50x + 1 = 0 por (6) e por (7) na Seção 19.1 usando 5S na computação. Compare e comente. 20. Resolva x2 – 200x + 4 = 0 por (6) e por (7) na Seção 19.1, usando 5S no cálculo. Compare e comente. 21. Considere que os números 4,81 e 12,752 estejam corretamente arredondados ao número de dígitos mostrado. Determine o menor intervalo no qual sua soma (usando os valores verdadeiros ao invés dos arredondados) deve se situar. 22. Responda à questão do Problema 21 para a diferença 4,81 – 12,752. 23. Qual é o erro relativo de n a em termos do erro de a? 24. Mostre que o erro relativo dea 2 é cerca do dobro do dea. 25. Calcule a solução de x5 = x + 0,2 próximo a x = 0 passando esta equação para a forma x = g(x) e começando de x0 = 0. (Use 6S.)

RESUMO DO CAPÍTULO

26. Resolva cos x = x por iteração (6S, x0 = 1), escrevendo-a como x = (0,74x + cos x)/1,74, obtendo x4 = 0,739 085 (valor exato para 6S!). Por que a convergência é tão rápida? 27. Resolva x4 – x3 – 2 x – 34 = 0 pelo método de Newton comx0 = 3 e uma precisão de 6S. 28. Resolva cos x – x = 0 pelo método da falsa posição. 29. Calcule f(1,28) a partir de f(1,0) = 3,00000 f(1,2) = 2,98007 f(1,4) = 2,92106 f(1,6) = 2,82534 f(1,8) = 2,69671 f(2,0) = 2,54030 por interpolação linear. Por interpolação quadrática, usando f(1,2), f(1,4), f(1,6). 30. Encontre o spline cúbico para os dados f(–1) = 3 f(1) = 1 f(3) = 23 f(5) = 45 k0 = k3 = 3. 31. Calcule a integral de x3 de 0 a 1 usando a regra do trapézio com n = 5. Que limites de erro são obtidos a partir de (4) da Seção 19.5? Qual é o erro verdadeiro do resultado? Por que esse resultado é maior que o valor exato? 32. Calcule a integral de cos(x2) de 0 a 1 usando a regra de Simpson com 2m = 2 e 2m = 4 e estime o erro usando (10) da Seção 19.5. (Esta é a integral de Fresnel (38) no Apêndice 3.1 comx = 1.) 33. Calcule a integral de cosx de 0 a 12 p usando a regra dos três oitavos b 3 ƒ(x) dx   h (ƒ 0  3ƒ 1  3ƒ 2  ƒ 3) 8 a 1   ( b  a) h 4ƒ (iv) ( tˆ ) 80 e forneça os limites de erro; aqui, a  tˆ  b e xj = a + ( b – a)j/3, j = 0, ,3.









19

Métodos Numéricos em Geral Neste capítulo, discutimos os conceitos relevantes que perpassam a área de cálculo numérico como um todo, bem como os métodos de natureza geral, em contrapartida aos métodos utilizados em álgebra linear (Capítulo 20) e em equações diferenciais (Capítulo 21). Em cálculos científicos, utilizamos a representação de números em ponto flutuante (Seção 19.1); a representação em Pelos pontométodos fixo é menos adequada na maioria casos. numéricos, obtemos valoresdos aproximados a de quantidades. O erro e de a é 

(1)



e= a– a



(Seção 19.1)

onde a é o valor exato. O erro relativo de a é e/a. Os erros são causados por arredondamentos, imprecisão de valores medidos, truncamentos (isto é, substituição de integrais por somas, de séries por somas parciais), e assim por diante. Dizemos que um algoritmo é numericamente estável se pequenas alterações nos dados iniciais provocam apenas pequenas alterações correspondentes nos resultados finais. Algoritmos instáveis são em geral inúteis, pois seus erros podem se tornar tão grandes a ponto de deixar os resultados bastante imprecisos. Não se deve confundir a instabilidade 

45

Capítulo 19: Métodos Numéricos em Geral

numérica dos algoritmos com a instabilidade matemática dos problemas ( “problemas mal-condicionados”, Seção 19.2). A iteração de pontos fixos é um método utilizado para resolver equações f(x) = 0, no qual primeiro a equação é transformada algebricamente para x = g(x), faz-se uma suposição inicial x0 para a solução e depois as aproximações x1, x2, , são sucessivamente calculadas por iteração, a partir de (veja a Seção 19.2) •





(2)

xn1

g(xn)



(n  0, 1,





).



O método de Newton para a solução de equações f(x) = 0 é uma iteração ƒ(xn) (3) xn 1  xn   (Seção 19.2). ƒ(xn) Aqui, xn+1 é a interseção entre o eixo x e a tangente à curva y = f(x) no ponto xn. Este método é de segunda ordem (Teorema 



f pordaum 2 da Seção Se, em (3), substituirmos quociente diferenças se substituirmos a secante tangente por19.2). uma secante), obteremos o método ; vejade(10) na Seção(geometricamente: 19.2. Sobre o método da bissecção (que converge lentamente) e o método da falsa posição, veja em Problemas Propostos 19.2. A interpolação polinomial corresponde à determinação de um polinômio pn(x) tal que pn(xj) = fj, onde j = 0, , n e (x0, f0), , (xn, fn) são valores observados ou medidos, ou valores de uma função etc. Dizemos que pn(x) é um polinômio de interpolação. Para dados fornecidos, pn(x) de grau n (ou menos) é único. Entretanto, pode-se escrevê-lo de diferentes formas, notavelmente na forma de Lagrange (4) da Seção 19.3, ou na forma de diferenças divididas de Newton (10) da Seção 19.3, a qual requer um número menor de operações. Para pontos regularmente espaçados x0, x1 = x0 + h, , xn = x0 + nh, esta última passa a ser a fórmula das diferenças progressivas de Newton (fórmula (14) na Seção 19.3) •







(4)











ƒ(x)  pn(x)  ƒ 0  rƒ0 

r (r 1) ( r n 1)  n! 



















nƒ0

onde r = (x – x0)/h, as diferenças progressivas são ∆fj = fj+1 – fj e kƒj  k

1



ƒj

1

 k

1



ƒj

(k  2, 3,





).



Similar a esta é a fórmula de interpolação de diferenças regressivas de Newton (fórmula (18) na Seção 19.3). Os polinômios de interpolação podem se tornar numericamente instáveis à medida que n aumenta, de modo que, ao invés de se interpolar e obter-se uma aproximação por meio de um único polinômio de grau elevado, é preferível utilizar-se um splinecúbico g(x), ou seja, uma função de interpolação dupla e continuamente derivável [assim, g(xj) = fj], que, em cada subintervalo xj  x  xj+1, consiste em um polinômio cúbico qj(x); veja a Seção 19.4. A regra de Simpson para a integração numérica é [veja (7) na Seção 19.5] (5)



b

a

ƒ(x) dx 

h



3

(ƒ 0  4ƒ 1  2ƒ 2  4ƒ 3 









2ƒ 2m

2





4ƒ 2m



1



ƒ 2m)

com nós igualmente espaçados xj = x0 + jh, j = 1, , 2m, h = (b – a)/(2m), e fj = f(xj). Esta regra é simples, mas precisa o suficiente em diversas aplicações. Seu grau de precisão é GP = 3, pois o erro (8) na Seção 19.5 envolve h4. Uma estimativa de erro mais prática é (10) na Seção 19.5: 1 eh/2   ( Jh/2  Jh), 15 obtida primeiramente calculando-se com um passo h, então com um passo h/2, e então tomando-se 1/15 da diferença entre os resultados. A regra de Simpson é a mais importante das fórmulas de Newton–Cotes, que são obtidas integrando-se os polinômios de interpolação de Lagrange, com os polinômios lineares sendo integrados pela regra do trapézio (2) da Seção 19.5, os polinômios quadráticos pela regra de Simpson, os cúbicos pela regra dos três oitavos (veja em Problemas de Revisão do Capítulo 19) etc. A integração adaptativa (Seção 19.5, Exemplo 6) é uma integração que ajusta (“adapta”) o passo (automaticamente) à variabilidade de f(x). A integração de Romberg (Projeto de Equipe 26, em Problemas Propostos 19.5) parte da regra do trapézio (2) na Seção 19.5, com h, h/2, h/4 etc. e aperfeiçoa os resultados por meio de uma soma sistemática das estimativas de erro. A integração de Gauss (11) na Seção 19.5 é importante devido à sua grande precisão (GP = 2 n – 1, comparada com a de Newton–Cotes GP =n – 1 ou n). Tal precisão é alcançada por meio de uma escolha ótima dos nós, que não são igualmente espaçados; veja a Tabela 19.7 na Seção 19.5. A derivação numérica é discutida no final da Seção 19.5. (Sua principal aplicação (em equações diferenciais) é apresentada no Capítulo 21.) •





20

CAPÍTULO

Métodos Numéricos de Álgebra Linear Neste capítulo, explicaremos alguns dos mais importantes métodos numéricos para a solução de sistemas de equações lineares (Seções 20.1–20.4), para o ajuste com linhas retas ou parábolas (Seção 20.5) e para os problemas de matrizes (Seções 20.6–20.9). métodos considerável importância prática,com poisautovalores muitos problemas de engenharia, estatísticaEsses e outras áreas são têmdeligação com modelos matemáticos cuja solução requer métodos numéricos de álgebra linear. COMENTÁRIO. Esse capítulo é independente do Capítulo 19 e pode ser estudado imediatamente após os Capítulos 7 ou 8. Pré-requisitos: Seções 7.1, 7.2 e 8.1. Seções que podem ser omitidas em um curso menor: 20.4, 20.5 e 20.9 Referências e Respostas dos Problemas: Parte E do Apêndice 1 e Apêndice

2

20.1 Sistemas Lineares: Eliminação de Gauss Um sistema linear de n equações com n incógnitas x1, En da forma a11x1  E1:



E2:

(1)

a21x1 •

En:













an1x1





















, xn























consiste em um conjunto de equações E1, a1nxn a2nxn •







annxn



,

b2

 •



b1













bn

onde os coeficientes ajk e b j são números dados. O sistema é chamado de homogêneo se todos os bj são nulos; caso contrário, ele é chamado de não-homogêneo. Usando a multiplicação de matrizes (Seção 7.2), podemos escrever (1) na forma de uma simples equação vetorial

(2)

Ax  b

onde a matriz dos coeficientes A = [ ajk] é a matriz n  n

A



a11

a12

a21

a22 •



an2

an1



























     a1n

b1

x1

a2n

, e x



ann



e eb

• •



• •

bn

xn

são vetores-coluna. A seguinte matriz A é chamada de matriz ampliada do sistema (1):

A  [ A b] 



a11







a1n

b1

a21







a2n

b2













an1







ann

bn

.

47

Capítulo 20: Métodos Numéricos de Álgebra Linear

Uma solução de (1) é um conjunto de números x1, , xn que satisfaz a todas as n equações, e um vetor-solução de (1) é o vetor x cujas componentes constituem uma solução de (1). O método para se resolver esse sistema baseando-se em determinantes (regra de Cramer na Seção 7.7) não é prático, mesmo sendo um método eficiente para se avaliar os determinantes. Um método prático para a solução de sistemas lineares tem o nome de eliminação de Gauss, que discutiremos agora (procedimento independente da Seção 7.3). •





Eliminação de Gauss Esse método-padrão para a solução de sistemas lineares (1) é um processo sistemático de eliminação que reduz (1) à “forma triangular”, pois desse modo o sistema pode ser facilmente resolvido por “ retrosubstituição”. Por exemplo, um sistema triangular é 3x1  5x2  2x3  8x2  2x3 

8 7



6x3 

3

e, por retrosubstituição, temos x3 = 3/6 = 1/2 da terceira equação e então x2

( 7  2 x3)  1

 1  8

da segunda equação e finalmente da primeira equação, x1

 1 3

(8  5 x2  2 x3)  4.

De que modo reduzimos o sistema dado (1) à forma triangular? No primeiro passo, em (1), eliminamos x1 das equações E2 até En. Fazemos isso adicionando (ou subtraindo) múltiplos adequados de E1 nas equações E2, , En e tomando as equações resultantes, chamando-as de E 2*, , En* como as novas equações. A primeira equação, E1, é chamada de equação-pivô nessa etapa e a11 é chamado de pivô. Essa equação é mantida inalterada. Na segunda etapa, tomamos a nova segunda equação E2* (que já não contém x1) como a equação-pivô e a utilizamos para eliminar x2 de E3* a En*. E assim por diante. Após n – 1 iterações, isso fornece um sistema triangular que pode ser resolvido por retrosubstituição conforme acabamos de mostrar. Dessa forma, obtemos de modo preciso todas as soluções do sistema dado (como demonstrado na Seção 7.3). O pivô akk (na etapa k) precisa ser diferente de zero e deve ser grande em valor absoluto, para evitar aumentos por arredondamento pela multiplicação no processo de eliminação. Para isso, escolhemos como nossa equação-pivô uma que possua o maior valor absoluto ajk na coluna k, sobre ou abaixo da diagonal principal (na verdade, na que estiver em posição superior, se houver diversas equações). Esse popular método é conhecido como pivotação parcial, sendo usado em sistemas de álgebra computacional (como, por exemplo, no Maple). A pivotação parcial se distingue da pivotação total, que envolve intercâmbios tanto em linhas quanto em colunas, mas que é dificilmente usada na prática. Ilustremos esse método com um exemplo simples. •



EXEMPLO 1









Eliminação de Gauss. Pivotação Parcial Resolva o sistema 7

E1:

8x2  2 x3 

E2:

3x1  5x2  2 x3 

E3:

6x1  2x2  8 x3  26.



8

Solução. A pivotação é necessária, visto que E1 não possui termo em x1. Na Coluna 1, a equação E3 tem o maior coeficiente. Logo, trocamos E1 e E3 de posição, 6x1  2x2  8 x3  26 3x1  5x2  2 x3  8x2  2 x3 

8 

7.

Passo 1. Eliminação dex1

Seria suficiente exibir a matriz ampliada e operar com ela. Mostremos ambas as equações e a matriz ampliada. No primeiro passo, a primeira equação é a equação-pivô. Portanto,

48

Parte E • Análise Numérica

Pivô 6

6x1

2x2

8x3

26

Eliminado

3x1

5x2

2x3

8

8x2

2x3

7



6

2

8

3

5

2

0

8

2

| | | | | |

26 8 7



Para eliminarmos x1 das outras equações (neste caso, da segunda equação), fazemos: Subtraímos 3/6 = 1/2 vez a equação-pivô da segunda equação. O resultado é



6x1  2 x2  8 x3  26 4x2  2 x3 



5

8x2  2 x3 



7

6

2

0

4

0

8

8 

| | | | | |

2 2



26 

5



7

Passo 2. Eliminação dex2

O maior coeficiente da coluna 2 é 8. Logo, consideramos a nova terceira equação como equação-pivô, trocando as posições das Equações 2 e 3, 2x2

8x3

26

Pivô 8

6x1

8x2

2x3

7

Eliminado

4x2

2x3

5



6

2

8

0

8

2

0

4

2

| | | | | |

26 7 5



Para eliminarmos x2 da terceira equação, fazemos: Subtraímos 1/2 vez a equação-pivô da terceira equação. O sistema triangular resultante é mostrado a seguir, e corresponde ao fim do processo de eliminação para a frente. Agora começa a retrosubstituição.

Retrosubstituição. Determinação dex3, x2, x1 O sistema triangular obtido no Passo 2 é



6x1  2 x2  8 x3  26 8x2  2 x3  



3 x3 

7

3

2

6

2

8

0

8

2

0

0

3



| | | | | |

26 

7



3 2



Desse sistema, tomando-se a última equação, depois a segunda e finalmente a primeira equação, calculamos a solução x3

 1

x2

 1 

x1

 1

2 8

( 7  2 x3)  1

(26  2 x2  8 x3)  4. 6

Isso concorda com os valores dados antes do início do exemplo.



O algoritmo geral para a eliminação de Gauss é mostrado na Tabela 20.1. Para ajudar a explicar o algoritmo, numeramos algumas de suas linhas. bj é denotado por aj,n+1, para fins de uniformidade. Nas linhas 1 e 2, procuramos por um possível pivô. [Para k = 1, podemos sempre encontrar um; de outro modo, x1 não ocorreria em (1)]. Na linha 2, fazemos o pivoteamento se necessário, escolhendo um ajk de maior valor absoluto (aquele com o menor j se houver diversos deles) e trocando as posições das linhas correspondentes. Se akk for o maior de todos, não fazemos o pivoteamento. mjk na linha 3 sugere um multiplicador, visto que esses são os fatores pelos quais teremos que multiplicar a equação-pivô E k* no Passo k antes de a subtrairmos de uma equação E*j abaixo de Ek*, da qual desejamos eliminar xk. Aqui, escrevemos Ek* e E*j para indicar que, após o Passo 1, elas já não são mais as equações dadas em (1), mas foram modificadas em cada passo, conforme indicado na linha 4. Assim, nas linhas 1–4, ajk etc. referem-se às equações mais recentes e, na linha 1, j  k indica que deixamos intocadas todas as equações que serviram como equações-pivô nos passos anteriores. Para p = k na linha 4, temos 0 à direita, como deveria ser na eliminação, ajk



mjkakk



ajk



a

jk  akk  0.

akk

Na linha 5, se a última equação no sistema triangular for 0 = bn*  0, não há solução. E se a equação for 0 = bn* = 0, não temos uma solução única, pois nesse caso há mais incógnitas que equações. EXEMPLO 2

Eliminação de Gauss na Tabela 20.1, Cálculo Amostral No Exemplo 1, tínhamos a11 = 0, de modo que o pivoteamento era necessário. O maior coeficiente na Coluna 1 era a31. Portanto, j = 3 na linha 2, e trocamos as posições de E1 e E3. Então, nas linhas 3 e 4, calculamos m21 = 3/6 = 12 e 

Capítulo 20: Métodos Numéricos de Álgebra Linear

a22



5

1 2





2



4,

a23



2



1 2



8

2,

 

a24



8



1 2



26

49

5,

 

e então m31 = 0/6 = 0, de modo que a terceira equação 8 x2 + 2 x3 = –7 não se alterou no Passo 1. No Passo 2 (k = 2), tivemos 8 como o maior coeficiente na Coluna 2, logo j = 3. Trocamos as posições das equações 2 e 3, calculamos m32 = –4/8 = – 12 na linha 4, e a33 = –2 – 12  2 =  –3, a34 = –5 – 12 ·(–7) = – 32 . Isso resultou na forma triangular usada na retrosubstituição. 

Se, no Passo k, akk = 0, é preciso pivotar. Se akk for pequeno, é recomendável pivotar por causa do aumento dos erros de arredondamento, que pode afetar seriamente a exatidão, ou chegar mesmo a produzir resultados sem sentido. EXEMPLO 3

Dificuldade com Pivôs de Pequeno Valor A solução do sistema 0,0004x1  1,402x2  1,406 0,4003x1  1,502x2  2,501 é x1 = 10, x2 = 1. Resolvemos esse sistema pela eliminação de Gauss, usando uma flutuação pontual aritmética de quatro dígitos. (4D é por razões de simplificação. Faça um exemplo com uma aritmética 8D que mostre o mesmo.) (a) Tomando-se a primeira das equações dadas como a equação-pivô, temos que multiplicar essa equação por m = 0,4003/0,0004 = 1001 e subtrair o resultado da segunda equação, obtendo –1405x2 = –1404.

Tabela 20.1 Eliminação de Gauss

ALGORITMO DE GAUSS (à = [ ajk] = [A b]) Este algoritmo calcula uma solução única x = [xj] do sistema (1) ou indica que (1) não possui solução única. ENTRADA: Matriz aumentada n  ( n + 1) à = [ ajk], onde aj,n+1 = bj SAÍDA: Solução x = [xj] de (1) ou mensagem dizendo que o sistema (1) não possui solução única Para k = 1, , n – 1, faça: 1 Se a = 0 para todo j  k então SAÍDA “Não existe uma solução única.” Pare jk [Procedimento concluído sem sucesso; A é singular] 2 Senão, trocar os conteúdos das linhas j e k de à com j sendo o menor j  k tal que ajk seja máximo na coluna k. 3 Para j = k + 1, , n, faça: •









mjk:

4

5

6





a

jk 

akk

Para p = k + 1, , n + 1, faça: ajp: = ajp – mjkakp Fim •





Fim Fim Se ann = 0 então SAÍDA “Não existe solução.” Pare Senão x

 n

a  a n,n1 nn

Para i = n – 1, 7



xi











1  ai,n aii

[Início da retrosubstituição] , 1, faça: n

1



Fim SAÍDA x = [xj]. Pare Fim GAUSS



 aijxj ji1



50

Parte E • Análise Numérica

Logo, x2 = –1404/(–1405) = 0,9993, e da primeira equação, em vez de x1 = 10, temos 1 0,005 x1  0,0004 (1,406  1,402 0,9993)  0,0004  12,5. Essa falha ocorre porque a11 é pequeno comparado com a12, de modo que um pequeno erro de arredondamento em x2 conduz a um grande erro em x1. (b) Tomando-se a segunda das equações dadas como a equação-pivô, temos que multiplicar essa equação por 0,0004/0,4003 = 0,000 9993 e subtrair o resultado da primeira equação, obtendo







1,404x2 = 1,404. Logo, x2 = 1 e, da equação-pivô, x1 = 10. Esse cálculo bem-sucedido ocorreu porque a21 não é muito pequeno comparado com a22, de modo que um pequeno erro de arredondamento em x2 não deve conduzir a um grande erro em x1. Com efeito, por exemplo, se tivéssemos o valor x2 = 1,002, ainda chegaríamos pela equação-pivô ao bom valor de x1 = (2,501 + 1,505)/0,4003 = 10,01. 

A estimativa dos erros para a eliminação de Gauss é discutida na Ref. [E5] no Apêndice 1. O escalonamento por linhas corresponde à multiplicação de cada linha j por um fator adequado de escala sj. Isso é feito em conexão com a pivotação parcial, para se obterem soluções mais acuradas. A despeito da grande quantidade de pesquisas (ver as Refs. [E9] e [E24] no Apêndice 1) e da proposição de diversos princípios, o escalonamento ainda não é uma técnica bem compreendida. Como uma possibilidade, pode-se escalonar somente para a escolha do pivô (e não nos cálculos, a fim de evitar arredondamentos adicionais) e tomar como primeiro pivô a entrada aj1 para a qual aj1/Aj assume o maior valor; aqui Aj é uma entrada de maior valor absoluto na linha j. Algo similar ocorre aos passos adicionais da eliminação de Gauss. Por exemplo, para o sistema 4,0000x1  14020x2  14060 0,4003x1  1,502x2  2,501 poderíamos adotar 4 como pivô, mas dividindo a primeira equação por 104 chegamos no sistema do Exemplo 3, para o qual a segunda equação é uma melhor equação-pivô.

Contagem das Operações De modo bastante geral, os fatores importantes para julgar a qualidade de um método numérico são A quantidade de armazenamento A quantidade de tempo ( número de operações) O efeito dos erros de arredondamento. Para a eliminação de Gauss, a contagem de operações para uma matriz cheia (uma matriz com relativamente muitas entradas diferentes de zero) ocorre do seguinte modo. No Passo k, eliminamos xk de n – k equações. Isso exige n – k divisões no cálculo de mjk (linha 3) e ( n – k)(n – k + 1) multiplicações, bem como subtrações (ambos na linha 4). Uma vez que executamos n – 1 passos, k vai de 1 a n – 1 e, portanto, o número total de operações nessa etapa da eliminação para frente é n 1

ƒ(n)

n 1

(n

k)

2

k 1 n

(n

k)(n

1)

1 2

k

(escrevemos n – k = s)

1)

k 1 n

1

s

1

2

s 1

s(s

_ (n

1)n

_2(n2 3

1)n

_n 3 2 3

s 1

onde 2n3/3 é obtido descartando-se as potências menores de n. Vemos que f(n) cresce de forma aproximadamente proporcional a n3. Dizemos que f(n) é de ordem n3 e escrevemos ƒ(n)  O(n3) onde O significa ordem. A definição geral de O é a seguinte. Escrevemos ƒ(n)  O(h(n)) se o quociente f(n)/h(n) permanece limitado (não segue para o infinito) à medida que n ∞. Em nosso presente caso, h(n) = n3 e, com efeito, f(n)/n3 2/3, pois os termos omitidos e divididos por n3 vão para zero à medida que n ∞. →





Capítulo 20: Métodos Numéricos de Álgebra Linear

51

Na retrosubstituição de xi fazemos n – i multiplicações e subtrações, além de 1 divisão. Logo, o número de operações na retrosubstituição é n

b(n)

2

n

(n

i)

n

i 1

2

s

n(n

n

1)

n2

n

2n

O(n2).

s 1

Vemos que o crescimento é mais devagar que o número de operações na eliminação para a frente do algoritmo de Gauss, de modo que é insignificante para grandes sistemas, pois é menor por um fator n, aproximadamente. Por exemplo, se uma operação consome 10–9 segundos, então os tempos necessários são: Algoritmo

n

Eliminação

0,7s

Retrosubstituição

0,001s



1.000

n



10.000

11min 0,1s

PROBLEMAS PROPOSTOS 20.1 Para as aplicaçõesde sistemas lineares, veja as Seções 7.1 e 8.2.

1–3

10.

INTERPRETAÇÃO GEOMÉTRICA

x1

2x2

3x3

11

10 x 1

x2

x3

8

10 x 2

2 x3

2

Resolva graficamente e explique geometricamente. 1. 4 x1  x2  4,3 3x1  5 x2 

33,7





2,72 x 3

0

x1

1,80 x 2

0,80 x 3

0

2,7 x 1

4,86 x 2

2,16 x 3

0

12,74x1  8,281 x2  0 7,2 x1  3,5 x2 

3.

21,6 x1  10,5 x2 



4–14

12.

16,0 

2x2



25,38 x 1

6

15,48 x 2

7,05 x 1 6 x2

7.



6 x1

4,30 x 2

6x1 30,60 8,50

13 x 3

137,86

8 x3

85,88

13 x 1

8 x2

5 x1

3x2

x3

2

4x2

8 x3

3

6x2

26 x 3

0

9. 4 x 1

10 x 2

2 x3

20

x1

15 x 2

3x3

30

25 x 2

5 x3

50

10 x 1

178,54



2x2



5x3

1,20736

6x3

0,329193

4x2

5 x1

ELIMINAÇÃO DE GAUSS

4x1

3x2 3x1

48,5

Resolva os seguintes sistemas lineares pela eliminação de Gauss, com pivotação parcial se necessário (mas sem escalonamento). Mostre os passos intermediários. Cheque o resultado por substituição. Se nenhuma solução ou mais de uma solução existir, explique a razão. 4. 6 x1  x 2   3 5. 2 x1  8 x2   4

8.

6,12 x 2

1,820x1  1,183 x2  0

2.

6.

11. 3,4 x 1

2,34066

13. 6,4 x 1

3,2 x 2

3,2 x 1

1,6 x 2

4,8 x 3

4,8 x 2

9,6 x 3

7,2 x 4

78,0

7,2 x 3

4,8 x 4

20,4

14 4,4 x 2

14.

0,4 x 1

3,6 x 2

2,0 x 1

6,2 x 2

x1

1,6

3,0 x 3

32,0

6,6 x 4

4,65

8,4 x 4

4,62

5,0 x 3 7,6 x 3

4,35 3,0 x 4

5,97

15. EXPERIMENTOS DE ÁLGEBRACOMPUTACIONAL. Eliminação de Gauss. Escreva um programa para realizar a eliminação de Gauss com pivotação. Aplique-o aos Problemas 11–14. Experimente com sistemas onde os determinantes dos coeficientes

possuam módulo o desempenho de seu programa parapequeno. sistemas Investigue maiores de também sua escolha, incluindo sistemas esparsos. 16. PROJETO DE EQUIPE. Sistemas Lineares e Eliminação de Gauss. (a) Existência e unicidade. Encontre a e b tais que ax1 + x2 = b, x1 + x2 = 3 tenham (i) uma única solução, (ii) infinitas soluções e (iii) nenhuma solução. (b) Eliminação de Gauss e inexistência. Aplique a eliminação de Gauss aos seguintes dois sistemas e compare os cálculos

52

Parte E • Análise Numérica

passo a passo. Explique por que a eliminação falha se não existe solução. x1

x2

x3

4x 1

2x2

x3

5

9x 1

5x2

x3

13

x1

x2

x3

3

4x 1

2x2

x3

5

9x 1

5x2

x3

12.

tamanho fixo de expressão computacional e para valores suficientemente pequenos e > 0, o computador fornece x2 = 1 e então x1 = 0. Qual é a solução exata? E seu limite quandoe 0? Depois resolva o sistema por eliminação de Gauss com pivotação. Compare e comente. (e) Pivotação. Resolva o sistema (B) pela eliminação de Gauss e para uma aritmética de arredondamento de três dígitos, escolhendo (i) a primeira equação e (ii) a segunda equação como equação-pivô. (Lembre-se de retornar para 3S após cada operação antes de passar para a próxima, como seria feito num computador!) Então, utilize uma aritmética de arredondamento de quatro dígitos nesses dois cálculos. Compare e comente. →

3

(c) Determinante zero. Por qual motivo pode um programa de computador lhe fornecer um resultado indicando que um sistema linear homogêneo possui apenas a solução trivial, apesar de você saber que o determinante dos coeficientes é nulo? (d) Pivotação. Resolva o sistema (A) (a seguir) pela eliminação de Gauss primeiramente sem pivotação. Mostre que, para qualquer

(A) ex

x



1

x1



1



2

2

x2



(B) 4,03 x 1



2,16 x 2

 

4,61

6,21 x 1



3,35 x 2

 

7,19

20.2 Sistemas Lineares: Fatoração LU, Inversão de Matrizes

Continuemos nossa discussão sobre métodos numéricos para a solução de sistemas lineares de n equações e n incógnitas x1, , xn, •





Ax  b

(1)

onde A = [ajk] é a matriz dos coeficientes e x = [x1

xn]

T







e b = [b1 T







bn].

Apresentaremos três métodos

relacionados são modificações do métododedaDoolittle, eliminação de Gauss e quee requerem menor de operações que aritméticas. Eles são chamados Crout, e Cholesky utilizam auma idéiaquantidade da fatoração LU de A, que explicaremos primeiro. Uma fatoração LU de uma dada matriz quadrada A é da forma

(2)

A  LU

onde L é triangular inferior e U é triangular superior. Por exemplo,

A

  2

8

3

5



  

LU 

1

0 2

4

1 0

3

7

.



Pode-se provar que, para qualquer matriz não-singular (veja a Seção 7.8), as linhas podem ser reordenadas de forma que a matriz resultante A tenha uma fatoração LU (2), na qual L venha a ser a matriz dos multiplicadores mjk da eliminação de Gauss, com a diagonal principal 1, , 1, e U é a matriz do sistema triangular ao final da eliminação de Gauss. (Veja a Ref. [E5] do Apêndice 1.) A idéia crucial agora é que, em (2), L e U podem ser calculadas diretamente, sem precisar resolver as equações simultâneas (e assim, sem utilizar a eliminação de Gauss). Como uma contagem pode mostrar, isso necessita de cerca de n3/3 operações, mais ou menos a metade do que no método da eliminação de Gauss, que precisa de cerca de 2n3/3 (veja a Seção 20.1). E, uma vez que temos (2), podemos usá-la para resolver Ax = b em duas etapas, envolvendo apenas aproximadamente n2 operações, simplesmente observando que Ax = LUx = b pode ser escrito como •

(3)

(a) Ly  b



onde



(b) Ux  y

e resolvendo primeiramente (3a) para y e então (3b) para x. Aqui, podemos requerer que L tenha a diagonal principal 1, ,1 como enunciamos antes; então temos o chamado método de Doolittle. Ambos os sistemas (3a) e (3b) são triangulares, de modo que podemos resolvê-los como na retrosubstituição da eliminação de Gauss. •





Capítulo 20: Métodos Numéricos de Álgebra Linear

1, EXEMPLO 1

53

Um método similar, o método de Crout, é obtido de (2) se U (ao invés de L) tiver a diagonal principal , 1. Em ambos os casos, a fatoração (2) é única.







Método de Doolittle Resolva o sistema linear do Exemplo 1 da Seção 20.1 pelo método de Doolittle.

Solução. A decomposição (2) é obtida de



a11

a12

a13

A  [ajk]  a21

a22

a23

a31

a32

a33

 

3

5

2

0

8

2

6

2

8

 





1

0

0 u11

u12

u13

m21

1

0 0

u22

u23

m31

m32

1 0

0

u33

pela determinação de mjk e u jk e utilizando a multiplicação de matrizes. Percorrendo A linha por linha, temos sucessivamente a11

3

1 u11

a21

0

m21u11

m21 a31

6

u11

a12

5

1 u12

a22

8

m21u12

0

u22

m31u11

2

a32

a13

2

1 u13

a23

2

m21u13

8 m32 u22

u23

m31u13

m32 8

2 2

1

m32

8

a33

u13

2

u23

2 5

2

u22

m31u12

m31 3 m31

u12

m32 u23

1 2

u33

u33

6

u33

Portanto, a fatoração (2) é

     3

5

2

0

8

2

6

2

8



1

0

0 3

5

2

LU  0

1

0 0

8

2 .

1

1 0

0

6

2



Primeiramente, resolvemos Ly = b, determinando y1 = 8, então y2 = –7 e depois y3 a partir de 2 y1 – y2 + y3 = 16 + 7 + y3 = 26; portanto (note que invertemos a posição de b por causa da inversão em A!)

 

1

0

0

0

1

0

y2

2

1

1

y3

8

y1

      .

8

7 Solução

  7

y

26

Então, resolvemos Ux = y, determinando x3 = 3/6, depois x2, e depois x1, isto é, 3

5

2

x1

8

0

8

2

x2

7

0

0

6

x3

3

.

3

4

.

x

Solução

1

.

1/2

Isso está de acordo com a solução do Exemplo 1 da Seção 20.1.



No Exemplo 1, nossas fórmulas sugerem que, no método de Doolittle, para n geral, os elementos das matrizes L = [mjk] (com a diagonal principal 1, , 1 e mjk sugerindo um “multiplicador”) e U = [ujk] são calculados a partir de •

u1k mj1 ujk



a1k aj1 u11 j

(4)



k

1,

j

2,

k

j,

j

k













,n ,n

1

ajk

mjs usk







, n;

j

2

s 1

mjk

1 ukk



k

1

ajk



mjs usk s 1

Trocas de Posição das Linhas. Matrizes, como

1,







, n;

k

2.

54

Parte E • Análise Numérica

  0

1

  0

ou

1

1 0 1 1 não possuem fatoração LU (tente fazer!). Isso indica que, para obter uma fatoração LU, as trocas de posições das linhas de A (e as correspondentes trocas em b) são necessárias.

Método de Cholesky Para uma matriz A simétrica, positiva e definida (de modo que, portanto, A = A , x Ax > 0 para todo x  0), podemos em (2) igualmente escolher U = L , de modo que ujk = mkj (mas não podemos impor condições aos elementos da diagonal principal). Por exemplo, T

T

T

(5)

4 2

2 17

14 5

14

5

83

2 1

0 4

0 0

2 0

1 4

7 3

7

3

5

0

0

5

    

A

LLT

.

O método popular de se resolver Ax = b baseado nessa fatoração A = LL é chamado de método de Cholesky. Em termos dos elementos de L = [ljk], as fórmulas para a fatoração são l11

T

a11 aj1

lj1

l11

j

2,

j

2,

p

j













,n

j 1

(6)

lj j

l js2

aj j

,n

s 1

1

lpj

lj j



j

1



apj

ljs lps s 1

1,







, n;

j

2.

Se A for simétrica, porém não definida positiva, esse método ainda pode ser aplicado, mas então ele levará a uma matriz L complexa, de modo que o método deixa de ser prático. EXEMPLO 2

Método de Cholesky Resolva pelo método de Cholesky: 4x1  2x2  14x3  2x1  17x2  5x3 

14 101



14x1  5x2  83x3 

155.

Solução. De (6) ou da forma da fatoração,



4

2

14

2

17

5

14

5

83



l11

0

0

l21

l22

0

l31

l32

l33



l11

l21

l31

0

l22

l32

0

0

l33



calculamos, na ordem dada, l11

a11

l22 l32

l33

2

l21

a22 1 l22

(a32

a33

a21

2

l11

2

l 212

17

l31l21) l 312

l 322

Isso está de acordo com (5). Agora, temos que resolver Ly = b , isto é,

1 1 4

1

l31

a31

14

l11

2

4

( 5 7 1)

83

3 72

( 3)2

5.

7

55

Capítulo 20: Métodos Numéricos de Álgebra Linear



2

0

0

1

4

0

7

3

5

    y1

14

y2

101

y3

155

 7

.

Solução

27

y

.

5

Como segundo passo, temos que resolver Ux = L x = y , isto é, T

 TEOREMA 1

2

1

7

0

4

3

0

0

5

    x1

7

x2

27

x3

5

 3

.

Solução

6

x

.



1

Estabilidade da Fatoração de Cholesky A fatoração LLT de Cholesky é numericamente estável

(conforme a definição na Seção 19.1).

2 Temos ajj  lj12  lj22   ljj ao elevarmos ao quadrado a terceira fórmula em (6) e resolvê-la para ajj. Logo, para todo ljk (note que ljk = 0 para k > j), obtemos (com a desigualdade sendo trivial)

PROVA







ljk2

Ou seja, l

2 jk

 lj12  lj22 







 ljj2 

ajj.

é limitado por um elemento de A, o que significa estabilidade contra o arredondamento.



Eliminação de Gauss–Jordan. Inversão de Matrizes Outra variante do método da eliminação de Gauss é a eliminação de Gauss–Jordan, introduzida por W. Jordan em 1920, na qual a retrosubstituição é evitada por operações adicionais que reduzem a matriz à forma diagonal, em vez da forma triangular da eliminação de Gauss. Porém, essa redução da forma triangular de Gauss para a forma diagonal requer um maior número de operações do que a retrosubstituição, de modo que esse método é desvantajoso para a solução de sistemas Ax = b. Mas ele pode ser usado para a inversão de matrizes, onde a situação é a seguinte. A inversa de uma matriz quadrada não-singular A pode, em princípio, ser determinada pela resolução de n sistemas (7) Ax  bj (j  1, , n) •





onde bj é a j-ésima coluna da matriz-identidade n  n. Entretanto, é preferível chegar a A–1 por meio de operações sobre a matriz-identidade I da mesma forma que no algoritmo de Gauss–Jordan, que reduz A a I. Um típico exemplo que ilustra esse método é dado na Seção 7.8.

PROBLEMAS PROPOSTOS 20.2 1–7

MÉTODO DE DOOLITTLE

6.

Mostre a fatoração e resolva pelo método de Doolittle. 1. 3 x 1  2 x2  15,2 2. 2 x1  9x2  41 15 x 1

11 x 2



77,3

3. 4 x 1  6 x 2 



34

8x1





7x2

 

3x1 4.

53



4x2



3x3 

2,0

4x1



3x2



2x3



0,5

3x1



4x2



2x3

 

2,5

5x2

2 x1  

5. 6 x 1



2x1 x1

 

 



31

x1



x2



2,6 x 3



0,5 x 1



3,0 x 2



3,3 x 3

 

16,54

1,5 x 1



3,5 x 2



10,4 x 3



21,02

3x1



9x2



x2



2 x3  0

18 x 1



48 x 2



39 x 3



13,6

2x2 2x2



x3 2x3

0 36

9x1



27 x 2



42 x 3



4,5



7.

 



9,88

6 x3  2,3

8. PROJETO DE EQUIPE. O Método de Crout efetua a fatoração A = LU, onde L é triangular inferior eU é triangular superior com elementos da diagonalujj = 1, j = 1, , n, (a) Fórmulas. Obtenha fórmulas para o método de Crout similares a (4). •





56

Parte E • Análise Numérica

(b) Exemplos. Resolva os Problemas 1 e 7 pelo método de 13 . 4 x1 Crout. 2x1 (c) Fatore a seguinte matriz pelos métodos de Doolittle, Crout e Cholesky. 4x1 4 1 2





4

25

4

2

4

24



2 x2  4 x3



2x2







20



2 x4



36

x3 

3x4



60

9x4



122



3x3

3x2



6

2x2



3x3



14. PROJETO DE ÁLGEBRA COMPUTACIONAL. Método de Cholesky. (a) Escreva um programa para obter a solução de sistemas lineares pelo método de Cholesky e aplique-o ao Exemplo (d) Forneça as fórmulas para a fatoração de matrizes tridiagonais 2 do texto, aos Problemas 9–11, e a sistemas de sua escolha. pelo método de Crout. (b) Splines. Aplique a parte de fatoração do programa às seguintes (e) Quando é possível obter a fatoração de Crout fazendo-se uma matrizes (do modo como elas ocorrem em (9) da Seção 19.4 (com transposição a partir da fatoração de Doolittle? cj = 1), em associação comsplines). 9–13 MÉTODO DE CHOLESKY 2 1 0 0 2 1 0 Mostre a fatoração e resolva. 1 4 1 0 9. 9 x 1  6 x2  12 x 3  87 1 4 1 , . 0 1 4 1 6 x 1  13 x 2  11 x 3  118 0 1 2 0 0 1 2 12 x 1  11 x 2  26 x 3  154 15. (Matrizes Definidas) Consideremos que A e B sejam matrizes n  n definidas positivas. Serão –A, A , A + B, A – B definidas  0,12 x 3  1,4 10 . 0,04 x 1 positivas? 0,64 x 2  0,32 x 3  1,6









T

16–19 INVERSA

0,12 x 1



11. 4 x1 

12 .

0,32 x 2

6 x2 

0,56 x 3



8 x3 

6x1



34 x 2



52 x 3

8x1



52 x 2



129 x 3



x2



5x2



3x3 5x3



x1 

x1



5,4

0 

 





80

226

2 x4  2x4 



30 70

3x1



5x2



19 x 3



3x4



188

2x1



2x2



3x3



21 x 4



2

Encontre a inversa pelo método de Gauss–Jordan, mostrando os detalhes do que fizer. 16. No Problema 4. 17. No Problema 5. 18. No Problema 6. 19. No Problema 7. 20. (Arredondamento) Para a seguinte matrizA , encontre det A. O que acontece se arredondarmos os elementos dados para (a) 5S, (b) 4S, (c) 3S, (d) 2S (e) 1S? Qual a implicação prática de seu trabalho?

A

20.3



1/3



1/9



4/63



2

1

1/7

3/28

13/49

 



1/4



Sistemas Lineares: Solução por Iteração A eliminação de Gauss e suas variantes vistas nas duas últimas seções incluem-se entre os métodos diretos de resolução de sistemas de equações lineares; trata-se de métodos que fornecem soluções após se fazer uma certa quantidade de cálculos que podem ser especificada com antecedência. Em contraste, em um método indireto ou iterativo, começamos a partir de uma aproximação da solução verdadeira e, se obtido sucesso, conseguimos aproximações cada melhores por meiorequerida de etapaspara computacionais vezes quantas forem necessárias para se vez atingir uma exatidão o resultado, cíclicas de modorepetidas que essatantas quantidade de aritmética depende da exatidão requerida e varia de caso para caso. Aplicamos métodos iterativos se a convergência for rápida (se as matrizes possuírem grandes valores nos elementos da diagonal principal, conforme veremos), de modo que assim temos uma economia de operações, em comparação com os métodos diretos. Também utilizamos métodos iterativos se um grande sistema for esparso, ou seja, se ele possuir muitos coeficientes nulos, onde poderia haver desperdício de espaço na armazenagem dos zeros, por exemplo, 9995 zeros por equação em um problema de potencial de 10 4 equações e 104 incógnitas com usualmente apenas 5 termos não-nulos por equação (veja mais sobre isso na Seção 21.4).

Capítulo 20: Métodos Numéricos de Álgebra Linear

57

Método de Iteração de Gauss–Seidel1 Este é um método iterativo de grande importância prática e que pode ser explicado de modo simples por meio de um exemplo. EXEMPLO 1

Iteração de Gauss–Seidel Consideremos o sistema linear

(1)

x1



0,25 x2



0,25 x1



x2



0,25 x1 0,25 x2





0,25 x3

50

 

0,25 x4



50



25



x3



0,25 x4



0,25 x3



x4



25.

(Equações dessa forma surgem em soluções numéricas de Equações Diferenciais Parciais (EDPs) e em interpolações spline.) Escrevemos o sistema na forma

(2)

0,25 x2

x1



x2



0,25x1

x3



0,25x1

x4



0,25 x2





0,25 x3



50



0,25 x4  50



0,25 x4  25

0,25 x3



25.

Essas equações são agora usadas para a iteração; isto é, começamos a partir de valor aproximado (possivelmente ruim) para a solução, digamos, = 100, x2(0) = 100, x3(0) = 100, x4(0) = 100 e, a partir de (2), calculamos uma aproximação possivelmente melhor

x1(0)

Use valores “antigos” (“Novos” valores aqui ainda indisponíveis)

0,25 x2(0) + 0,25 x3(0)

x1(1) =

(3)

+ 50,00 = 100,00

=

0,25 x1(1)

0,25 x4(0)

x3(1) =

0,25 x1(1)

0,25 x4(0)

x2(1)

x4(1) =

0,25 x2(1) + 0,25 x3(1)

+ 50,00 = 100,00 + 25,00 = 75,00 + 25,00 = 68,75

Use valores “novos”

Essas equações (3) são obtidas de (2) substituindo-se, no lado direito, cada incógnita pela aproximação mais recente. Com efeito, valores correspondentes substituem os anteriores tão logo eles são calculados, de modo que, na segunda e na terceira equações, usamos x1(1) (e não x1(0)), e na última equação de (3), usamos x2(1) e x3(1) (e não x 2(0) e x3(0)). Utilizando o mesmo princípio, obtemos no próximo passo 0,25x 2(1)

x 1(2)



x 2(2)



0,25x 1(2)

x 3(2)



0,25x 1(2)

x 4(2)



0,25x 2(2)





0,25x 3(1)



50,00  93,750



0,25x 4(1)  50,00  90,625



0,25x 4(1)  25,00  65,625

0,25x 3(2)



25,00  64,062

Os demais passos fornecem os valores x1

x2

x3

x4

89,062 87,891 87,598 87,524 87,506

88,281 87,695 87,549 87,512 87,503

63,281 62,695 62,549 62,512 62,503

62,891 62,598 62,524 62,506 62,502

Logo, a convergência para a solução exatax1 = x2 = 87,5 e x3 = x4 = 62,5 (verifique!) mostra-se um tanto rápida. PHILIPP LUDWIG VON SEIDEL (1821–1896), matemático alemão. Sobre Gauss, veja a nota de rodapé 5 da Seção 5.4.

1



58

Parte E • Análise Numérica

A seguir, apresentamos um algoritmo para a iteração de Gauss–Seidel. Para obter o algoritmo, obteremos as fórmulas gerais para essa iteração. , n. (Observe que isso pode ser conseguido se pudermos rearrajar as Suponhamos que ajj = 1 para j = 1, equações de tal forma que nenhum coeficiente da diagonal seja zero; então, podemos dividir cada equação pelo seu correspondente coeficiente da diagonal.) Agora escrevemos •





(4)

AILU

(ajj  1)

onde I é a matrix unitária n  n e L e U são, respectivamente, as matrizes triangulares inferior e superior com as diagonais principais nulas. Se substituímos (4) em Ax = b, temos

Ax  ( I  L  U)x  b. Passando Lx e Ux para a direita, obtemos, visto que Ix = x, (5)

x  b  Lx  Ux.

Lembrando de (3) do Exemplo 1 que abaixo da diagonal principal fizemos “novas” aproximações, e acima da diagonal principal, “antigas” aproximações, obtemos de (5) as fórmulas de iteração que desejávamos: “Novo”

(6)

x(m

1)



b  Lx(m

1)



“Antigo”

Ux(m)

(ajj  1)

onde x(m) = [xj(m)] é a m-ésima aproximação e x(m+1) = [ xj(m+1)] é a (m + 1)-ésima aproximação. Em componentes, isso fornece a fórmula na linha 1 da Tabela 20.2. A matriz A precisa satisfazer ajj  0 para todo j. Na Tabela 20.2, nossa suposição ajj = 1 não é mais necessária, pois ela é automaticamente observada por causa do fator 1/ajj na linha 1. Tabela 20.2 Iteração de Gauss–Seidel

ALGORITMO DE GAUSS–SEIDEL (A, b, x(0), e, N) Este algoritmo computa uma solução x do sistema Ax = b dada uma aproximação inicial x(0), onde A = •





j = 1, (0) , n. [ajk] éENTRADA: uma matriz nA,b,naproximação com ajj  0, inicial x , tolerância e > 0, número máximo de iterações N SAÍDA: Solução aproximada x(m) = [xj(m)] ou mensagem de falha dizendo que x(N) não satisfaz à condição de tolerância. Para m = 0, , N – 1, faça: Para j = 1, , n, faça: •







1

x j(m





1

1)

ajj



j

n

1

ajk x k(m

bj

ajk x k(m)

1)

k 1

k

j 1



Fim 2 Se max xj(m+1) – xj(m) < e, então SAÍDA x (m+1). Pare j [Procedimento concluído com sucesso] Fim SAÍDA: “Nenhuma solução satisfazendo à condição de tolerância é obtida após N passos iterativos.” Pare [Procedimento concluído sem sucesso] Fim GAUSS–SEIDEL

Convergência e Normas de Matrizes Um método iterativo para a solução de Ax = b é dito convergente para um x(0) inicial se a correspondente seqüência de iterações x(0), x(1), x(2), converge para uma solução do sistema dado. A convergência depende da relação entre x(m) e x(m+1). Para obtermos essa relação para o método de Gauss–Seidel, usamos (6). Primeiramente temos •





(I  L)x(m

1)



b  Ux(m)

Capítulo 20: Métodos Numéricos de Álgebra Linear

59

e, multiplicando por (I + L)–1 à esquerda,

(7)

x(m

1)

Cx(m)  ( I  L) 1b

C  (I  L) 1U.

onde







A iteração de Gauss–Seidel converge para todo x(0) se e somente se todos os autovalores (Seção 8.1) da “matriz de iteração” C = [cjk] tiverem módulos maiores que 1. (A demonstração disso está na Ref. [E5], mencionada no Apêndice 1.) CUIDADO! Se você desejar obter C, primeiramente divida as linhas de A por ajj para fazer com que a diagonal

principal seja 1, vergência é rápida. •





, 1. Se o raio espectral de C (= valor máximo dos módulos) for pequeno, então a con-

Condição Suficiente de Convergência. Uma condição suficiente para a convergência é

C  1.

(8) Aqui, C é alguma norma matricial, como

n

(9)

n

 C

(Norma de Frobenius)

c jk2 j 1k 1

ou a maior das somas de cjk numa coluna de C n

C 

(10)

max k

cjk

(Norma da “soma” das colunas)

cjk

(Norma da “soma” das linhas).

j 1

ou a maior das somas de cjk numa linha de C n

C 

(11)

max j

k 1

Essas são as normas de matrizes mais freqüentemente usadas nos métodos numéricos. Na maioria dos casos, a escolha de uma dessas normas é uma questão de conveniência computacional. Entretanto, o seguinte exemplo mostra que algumas vezes uma dessas normas é preferível às demais. EXEMPLO 2

Teste de Convergência da Iteração de Gauss–Seidel Teste se a iteração de Gauss–Seidel converge para o sistema 2x  y  z  4 x



x



escrevendo como

2y  z  4 y

2z  4



2

x



y

2

z



2

1

1

 2y  2z 1  2

x

1

 2z

1

1

.

 2x  2y

Solução. A decomposição (multiplique a matriz por 1/2 – por quê?) é

Isso mostra que

 C

1

1/2

1/2

1

1/2

1/2

(I

L)

1/2



1

1

U

Calculamos a norma de Frobenius de C

C 



1/2 I L U I



1

1

4

4



0

0

0

1/2

0

0

1/2

1/2

0



0

1/2

1/2

0

0

1/2

0

0

0



1

0

0

0

1/2

1/2

0

1/2

1/2

1/2

1

0

0

0

1/2

0

1/4

1/4

1/4

1/2

1

0

0

0

0

1/8

3/8



1

1

1

9

16

16

64

64



1/2



  50 64

1/2

0,884

1

.

.



e concluímos de (8) que essa iteração de Gauss–Seidel converge. É interessante que as outras duas normas não permitiriam essa conclusão, como você deveria verificar. Obviamente, isso aponta para o fato de que (8) é suficiente para a convergência, e não apenas necessária. 

Resíduo. Dado um sistema Ax = b , o resíduo r de x com relação a esse sistema é definido por

60

Parte E • Análise Numérica

(12)

r  b  Ax.

Logicamente, r = 0 se e somente se x é uma solução. Logo r  0 para uma solução aproximada. Na iteração de Gauss–Seidel, a cada estágio modificamos ou relaxamos uma componente de uma solução aproximada, no intuito de reduzir uma componente de r a zero. Logo, a iteração de Gauss–Seidel pertence a uma classe de métodos freqüentemente chamada de métodos de relaxação. Maiores informações sobre os resíduos são fornecidas na próxima seção.

Iteração de Jacobi A iteração de Gauss–Seidel é um método de correções sucessivas, pois, para cada componente, substituímos sucessivamente uma aproximação de uma componente por uma nova aproximação correspondente, tão logo esta última tenha sido calculada. Dizemos que um método iterativo é de correções simultâneas se nenhuma componente da aproximação x(m) é usada até que todas as componentes de x(m) tenham sido calculadas. Um método desse tipo é a iteração de Jacobi, que é similar à iteração de Gauss–Seidel, mas envolve a não-utilização de valores melhorados até que um passo tenha sido concluído e então substituímos x(m) por x(m+1) uma vez, imediatamente antes do próximo passo. Logo, se escrevemos Ax = b (com ajj = 1 como antes!) na forma x = b + (I – A)x, a iteração de Jacobi em notação matricial é

(13)

x(m

1)



b  ( I  A)x(m)

(ajj  1).

Esse método converge para toda escolha de x(0) se e somente se o raio espectral de I – A for menor que 1. Isso vem recentemente ganhando grande interesse prático, devido ao fato de que, em processos paralelos, todas as n equações podem ser resolvidas simultaneamente a cada passo da iteração. Sobre Jacobi, veja a Seção 10.3. Sobre exercícios, veja Problemas Propostos.

PROBLEMAS PROPOSTOS 20.3 1. Verifique a declaração feita no final do Exemplo 2. 2. Mostre que, para o sistema do Exemplo 2, a iteração de Jacobi diverge. Sugestão: use autovalores.

3–8

ITERAÇÃO DE GAUSS–SEIDEL

Execute 5 passos, começando de x0 = [1 1 1] e usando 6S na computação. Sugestão: certifique-se de ter resolvido cada equação para a variável com o maior coeficiente (por quê?). Mostre os detalhes.

x

x

x

1

2

3

x1

10 x 2

x3

6 6

x1

x2

10 x 3

6

7. 10

T

3.

x1

x2

6 x3

61,3

x1

9x2

2x3

49,1

8 x1

2 x2

x3

185,8

4.

x2

7x3

25,5 0

5x1

x2

x1

6 x2

x3

5. 5 x 1

x2

2 x3

x1

4 x2

2 x3

2

2 x1

3x2

8 x3

39

6. 4 x 1 x1

x2

4 x2 x2

10,5 19

8. 4 x 1

4 x3

45 33

12,5

x1

6 x2

2 x3

18,5

8 x1

2 x2

x3

11,5

9. Aplique a iteração de Gauss–Seidel (3 passos) ao sistema do Problema 7, começando por (a) 0, 0, 0, (b) 10, 10, 10. Compare e comente. 10. No Problema 7, calcule C (a) se você resolver a primeira equação para x1, a segunda parax2, a terceira parax3, provando a convergência. (b) se você, equivocadamente, resolver a terceira equação para x1, a primeira para x2, a segunda para x3, provando a divergência. 11. PROJETO DE ÁLGEBRA COMPUTACIONAL. Iteração de Gauss–Seidel. (a) Escreva um programa para a fazer a iteração de Gauss–Seidel. (b) Aplique o programa a A(t)x = b, começando de [0 0 0] , onde T

21 x3

5 x3

A(t)



1

t

t

t

1

t

t

t

1



 2

,

b

2 2

.

Capítulo 20: Métodos Numéricos de Álgebra Linear

61

Para t = 0,2, 0,5, 0,8, 0,9, determine o número de passos necessários 13. O sistema do Problema 5 para a obtenção da solução exata, usando 6S e o correspondente 14. O sistema do Problema 8 raio espectral de C. Faça um gráfico do número de passos e do 15. Mostre a convergência no Problema 14 verificando queI – A, onde raio espectral como funções det e comente. A é a matriz do Problema 14 com as linhas divididas pelos cor(c) Sobre-relaxação sucessiva (SOR*). Mostre que, adicionando respondentes elementos da diagonal principal, tem os autovalores (m) e subtraindo x à direita, a fórmula (6) pode ser escrita como –0,519589 e 0,259795 ± 0,246603i. x (m 1)  x (m)  b  Lx (m 1)  ( U  I ) x (m) ( a jj  1). 16–20 NORMAS 



A possível ocorrência de correções adicionais motiva a introdução de um fator de sobre-relaxação ω > 1 para assim se obter afórmula de SOR para Gauss–Seidel (14) x (m 1)  x (m)  v ( b  Lx (m 1)  ( U  I ) x (m)) ( a  1) jj com a finalidade de fornecer uma convergência mais rápida. Um valor recomendado év  2/(1  1  r) onde r é o raio espectral de C em (7). Aplique a sobre-relaxação sucessiva à matriz em (b) para t = 0,5 e 0,8 e observe a melhoria da convergência. (Ganhos espetaculares são obtidos com sistemas maiores.) 



Calcule as normas (9), (10), (11) para as seguintes matrizes (quadradas). Comente as razões das maiores ou menores diferenças entre os três números. 16. A matriz do Problema 3 17. A matriz do Problema 7 18. A matriz do Problema 8 19.

12–15 ITERAÇÃO DE JACOBI Execute 5 passos, começando de x0 = [1 1 1] . Compare com a iteração de Gauss–Seidel. Com qual dos dois métodos a convergência parece ser mais rápida? (Mostre os detalhes do que fizer.) 12. O sistema do Problema 6 T

20.

 

2k

k

k

k

2k

k

k

k

2k

4

3

5

7

1

0

17

12

2





20.4 Sistemas Lineares: Mau Condicionamento, Normas

Não precisacom de muita experiência ou para observar que algunsaosistemas = b são soluções Axoutros exatassemesmo arredondamentos coeficientes inexatos, passo que sãobons, ruins,fornecendo onde as inexatidões afetam fortemente a solução. Queremos ver o que acontece, e se é ou não possível “confiar” num sistema linear. Vamos primeiramente formular dois conceitos relevantes (os de mau e de bom condicionamento) para desenvolvimentos numéricos em geral e então retornar aos sistemas lineares e matrizes. Dizemos que um problema computacional é mal condicionado (ou mal posicionado) se “pequenas” alterações nos dados (a entrada) provocam “grandes” alterações na solução (a saída). Por outro lado, dizemos que um problema é bem condicionado (ou bem posicionado) se “pequenas” alterações nos dados provocam apenas “pequenas” alterações na solução. Esses conceitos são qualitativos. Certamente, consideraríamos “grande” um aumento das imprecisões por um fator de 100, porém poderia haver controvérsias quanto à determinação exata da linha que separa o que é “grande” do que é “pequeno”, dependendo do tipo de problema e do nosso ponto de vista. Uma precisão dupla pode algumas vezes ajudar, mas se os dados são medidos de forma imprecisa, deveríamos tentar modificar o ajuste matemático do problema, de modo a termos um problema bem condicionado. Retornemos agora aos sistemas lineares. A Fig. 442 explica que o mau condicionamento ocorre se e somente se as duas equações fornecem duas retas aproximadamente paralelas, de modo que seu ponto de interseção (a y

y

γ

x (a)

x (b)

Fig. 442. Sistema linear de duas equações e duas incógnitas (a) bem condicionado e (b) mal condicionado *Abreviatura da expressão srcinal: successive overrelaxation . (N.T.)

62

Parte E • Análise Numérica

solução do sistema) move-se substancialmente se levantamos ou abaixamos apenas um pouco uma das linhas. Para sistemas maiores, a situação é similar em princípio, embora a geometria se complique. Veremos que é possível considerar o mau condicionamento como uma aproximação da singularidade da matriz. EXEMPLO 1

Um Sistema Mal Condicionado Você pode verificar que o sistema 0,9999x  1,0001y  1 x

y





1

apresenta a solução x = 0,5, y = –0,5, ao passo que o sistema 0,9999x  1,0001y  1 x y1e tem a solução x = 0,5 + 5000,5e, y = –0,5 + 4999,5e. Isso mostra que o sistema é mal condicionado, pois uma mudança de magnitude e à direita produz uma mudança de magnitude de aproximadamente 5000e na solução. Vemos que as linhas dadas pelas equações têm aproximadamente a mesma inclinação. 

Pode-se garantir um bom condicionamento quando os elementos da diagonal principal de A apresentam grandes valores absolutos comparados aos valores absolutos dos demais elementos. Algo similar ocorre quando A–1 e A apresentam elementos máximos com aproximadamente o mesmo valor absoluto. O mau condicionamento ocorre quando A–1 possui elementos de grande valor absoluto comparados com os da solução (cerca de 5000 no Exemplo 1) e quando as soluções resultantes de aproximações ruins podem ainda produzir pequenos resíduos.

Resíduo. O resíduo r de uma solução aproximada x de Ax = b é definido como 

(1)

r  b  Ax . 

Agora, b = Ax, de modo que

r  A(x  x ).

(2)



Logo, r é pequeno se x tiver grande precisão, mas o inverso pode não ser verdadeiro: 

EXEMPLO 2

Solução Aproximada Inexata com um Pequeno Resíduo O sistema 1,0001 x1  x1



x2



2,0001

1,0001 x2  2,0001

tem a solução exatax1 = 1, x2 = 1. Você poderia ver isso por inspeção? A aproximação bastante inacurada x 1 = 2,0000 e x 2 = 0,0001 tem um resíduo muito pequeno (para 4D) 0,0002 2,0001 1,0001 1,0000 2,0000 2,0001 2,0003 r .     0,0000 2,0001 1,0000 1,0001 0,0001 2,0001 2,0001 

  

      





Disso, uma pessoa ingênua poderia chegar à falsa conclusão de que a aproximação deveria ser exata para 3 ou 4 decimais. Nosso resultado é provavelmente inesperado, mas veremos que isso tem a ver com o fato de o sistema ser mal condicionado.



Nosso objetivo é mostrar que o mau condicionamento de um sistema linear e da matriz A de seus coeficientes pode ser medido por um número, o “ número condicional” k(A). Outras medidas de mau condicionamento têm também sido propostas, mas o k(A) é provavelmente a de uso mais generalizado. k(A) é definido em termos da norma, um conceito de grande interesse geral em toda a área de métodos numéricos (e na matemática moderna em geral!). Alcançaremos nosso objetivo em três passos, discutindo-as(o):

1. Normas vetoriais 2. Normas matriciais 3. Número condicional k de uma matriz quadrada.

63

Capítulo 20: Métodos Numéricos de Álgebra Linear

Normas Vetoriais Uma norma vetorial para um vetor coluna x = [xj] com n componentes (n fixo) corresponde a um comprimento ou módulo generalizado, sendo denotado por x e definido por quatro propriedades do módulo usual de vetores no espaço tridimensional, que são, (a) x é um número real não-negativo. (b) x = 0 se e somente se x = 0. (c) kx = kx para todo k. (d) x + y   x + y (Desigualdade triangular).

(3)

Se usamos diversas normas, devemos etiquetá-las com números subscritos. A norma mais importante relacionada às computações é a norma p, definida por 1/p (4) xp  ( x1p  x2p   xnp) •





onde p é um número fixo e p  1. Na prática, usualmente fazemos p = 1 ou 2 e, como uma terceira norma, x (sendo esta última definida a seguir), ou seja,



(5)

x1  x1 

(6)

2 x2  x  xn2 1  

(7)

x  max xj













(“norma l1”)

xn





(Norma “Euclideana” ou “norma l2”) (“norma l”).

j

Para n = 3, a norma l2 é o comprimento usual do vetor no espaço tridimensional. A norma l1 e a norma l são geralmente mais convenientes nos cálculos. Porém, todas as três normas são de uso comum. ∞

EXEMPLO 3

Normas Vetoriais Se xT  [2



3

0

1

4], então x1  10, x2  30 , x  4.









No espaço tridimensional, dois pontos com os vetores posição x e x estão distantes x – x  um do outro. Para um sistema linear Ax = b, isso sugere que consideremos x – x  como uma medida da inexatidão, e vamos chamá-la de distância entre uma solução exata e uma solução aproximada, ou de erro de x . 



Norma Matricial Se A é uma matriz n  n e x é um vetor qualquer com n componentes, então Ax é um vetor com n componentes. Adotemos agora uma norma vetorial e consideremos x e Ax. Pode-se provar (veja a Ref. [E17], no Apêndice 1) que existe um número c (dependente de A) tal que

Ax  cx

(8)

para todo

x.

Façamos x  0. Então, por (3b), x > 0 e a divisão fornece Ax/x  c. Obtemos o menor c possível válido para todo x ( 0) tomando o valor máximo no lado esquerdo. Esse c mínimo é chamado de norma matricial de A correspondente à norma vetorial selecionada e denotado por A. Portanto,

Ax A  máx.  x

(9)

(x  0),



com o valor máximo sendo considerado para todo x  A (10)

0. Alternativamente, [veja (c) no Projeto de Equipe 24],

máx. Ax  .

 x

1

O máximo em (10) e, portanto, o máximo também em (9), existem. E o nome “norma matricial” se justifica, pois A satisfaz (3) com x e y substituídos por A e B. (Demonstrações na Ref. [E17].) Observe com cuidado queA depende da norma vetorial que selecionamos. Em particular, pode-se mostrar que para a norma l1 (5) considera-se a norma da “soma” das colunas (10), Seção 20.3, para a norma l (7) considera-se a norma da “soma” das linhas (11), Seção 20.3, ∞

64

Parte E • Análise Numérica

Tomando nosso melhor c = A possível (ou seja, nosso menor c), temos de (8)

Ax  A x.

(11)

Essa é a fórmula de que precisaremos. Para as matrizes n  n (veja a Ref. [E17]), a fórmula (9) também implica que

AB  A B,

(12)

An  An.

portanto,

Para outras fórmulas usuais de normas, veja as Refs. [E9] e [E17]. Antes de prosseguirmos, façamos um cálculo simples a título de exemplo. EXEMPLO 4

Normas Matriciais Calcule as normas matriciais da matriz A dos coeficientes no Exemplo 1 e de sua inversa A–1, supondo que usamos (a) a norma vetorial l1 e (b) a norma vetorial l . ∞

Solução. Usamos (4*) da Seção 7.8 para a inversa e então (10) e (11) da Seção 20.3. Portanto, 0,9999 1,0001 5000,0 5000,5 A , A 1 . 1,0000 1,0000 4999,5 5000,0











(a) A norma vetorial l1 fornece a norma da “soma” das colunas (10) da Seção 20.3; da coluna (2), obtemos, portanto, A = –1,0001 + –1,0000 = 2,0001. De forma similar, A–1 = 10.000. (b) A norma vetoriall fornece a norma da “soma” das linhas (11) da Seção 20.3; portanto, da linha 1, A = 2, A–1 = 10.000,5. Notamos que A–1 é surpreendentemente grande, fazendo com que o produto A A–1 seja grande (20.001). Veremos a seguir que isso usualmente ocorre nos sistemas mal condicionados.  ∞

Número Condicional de uma Matriz Estamos agora prontos para introduzir o conceito-chave da nossa discussão sobre mau condicionamento, a saber, o número condicional k(A) de uma matriz quadrada (não-singular) A, definido por

(13)

k(A)



A A 1. 

O papel do número condicional é apresentado pelo seguinte teorema. TEOREMA 1

Número Condicional Um sistema linear de equações Ax = b e sua matriz A cujo número condicional(13) seja pequeno são bem condicionados. Um grande número condicional indica mau condicionamento.

PROVA

b = Ax e (11) fornecem b  A  x. Consideremos que b  0 e x  0. Então, dividindo por b  x, temos 1 A  . (14) x  b Multiplicando (2) r = A(x – x ) por A–1 no lado esquerdo e invertendo os lados, temos x – x = A–1r. Agora, (11), com A–1 e r ao invés de A e x, fornece 



x  x   A 1r  A 1  r. 





Dividindo por x [note que x  0 por (3b)] e usando (14), finalmente obtemos

(15)



x x   x 



1 A 1 r   A A 1 r  k(A)  r .  x b b 



Logo, se k(A) é pequeno, um pequeno r / b implica um pequeno erro relativo x – x  / x, de modo que o sistema é bem condicionado. Entretanto, isso não ocorrerá se k(A) for grande; nesse caso, um pequeno r / b não necessariamente implicará um pequeno erro relativo x – x  / x.  



Capítulo 20: Métodos Numéricos de Álgebra Linear

EXEMPLO 5

65

Números Condicionais. Iteração de Gauss–Seidel

  5

1

1

A 1

4

2

1

2

4

A

tem a inversa

1

1  56





12 

2



2



2



2

19



9 .



9



19

Como A é simétrica, (10) e (11) na Seção 20.3 fornecem o mesmo número condicional k(A)



 A  A 1   7 

1 56



30





3,75.

Vemos que um sistema linearAx = b com esse A é bem condicionado. Por exemplo, se b = [14 0 28] , o algoritmo de Gauss fornece a solução x = [2 –5 9] (confirme isso). Como os elementos da diagonal principal de A são relativamente grandes, podemos esperar uma convergência razoavelmente boa para a iteração de Gauss–Seidel. Com efeito, começando de, digamos, x0 = [1 1 1] , obtemos os 8 primeiros passos (com valores 3D) T

T

T

EXEMPLO 6

x1

x2

x3

1,000 2,400 1,630 1,870 1,967 1,993 1,998 2,000 2,000

1,000 1,100 3,882 4,734 4,942 4,988 4,997 5,000 5,000

1,000 6,950 8,534 8,900 8,979 8,996 8,999 9,000 9,000



Sistema Linear Mal Condicionado Por (10) ou (11) da Seção 20.3, o Exemplo 4 fornece para a matriz do Exemplo 1 o grande número condicional k(A) = 2,0001  10 000 = 2  10 000,5 = 20 0001. Isso confirma o fato de que o sistema é bastante mal condicionado. Algo similar ocorre no Exemplo 2, onde, por (4*) da Seção 7.8 e com um cálculo em 6D, 

A

1



1

0,0002 





1,0001 1,0000



1,0000 1,0001

  

5000,5 5000,0



5000,0 5000,5



de modo que (10) da Seção 20.3 conduz a um k(A) muito grande, explicando o surpreendente resultado do Exemplo 2, k(A)



(1,0001  1,0000)(5000,5  5000,0)  20 002.



Na prática, não conheceremos A–1, de modo que, ao calcularmos o número condicional k(A), precisamos estimar A–1. Um método de fazer isso (proposto em 1979) é explicado na Ref. [E9] listada no Apêndice 1.

Elementos Inexatos da Matriz. k(A) pode ser usado para estimar o efeito δx de uma imprecisão δA de A (erros de medições dos ajk, por exemplo). Em vez de Ax = b, temos, então, (A  dA)(x  dx)  b. Multiplicando e subtraindo Ax = b em ambos os lados, obtemos

Adx  dA(x  dx)  0. Multiplicando por A à esquerda e passando o segundo termo para a direita, temos –1

dx

A 1dA(x  dx).

 



Aplicando (11) com A–1 e o vetor δA(x + δx) em vez de A e x, obtemos dx  A 1dA(x  dx)  A 1 dA(x  dx). 



Aplicando (11) à direita, com δA e x – δx em vez de A e x, obtemos

dx  A 1 dA x  dx. 

Agora, pela definição de k(A), A  = k(A)/A, de modo que a divisão por x + δx mostra que o erro relativo de x relaciona-se ao de A por meio do número condicional, através da desigualdade –1

66

Parte E • Análise Numérica

 dx   x 

(16)



 dx   x  d x 

A 1 dA  k(A) 



 dA   A 

.

Conclusão. Se o sistema for bem condicionado, pequenas inexatidões δA / A podem exercer somente um pequeno efeito sobre a solução. Por outro lado, em caso de mau condicionamento, se δA / A for pequeno, δx / x poderá ser grande. Inexatidão do Lado Direito. Você pode mostrar que, de forma similar, quando A é exata, uma inexatidão δb de b provoca uma inexatidão δx que satisfaz a

dx   x 

(17)

k(A)



 db  .  b 

Logo, δx / x precisa permanecer relativamente pequeno sempre que k(A) for pequeno. EXEMPLO 7

Inexatidões. Limites (16) e (17) No Exemplo 5, se cada um dos nove elementos de A for medido com uma imprecisão de 0,1, então δA = 9  0,1 e (16) fornece

 dx   x 



7,5

3 0,1  0,321 7 





dx  0,321 x  0,321 16

portanto,





5,14.

Você encontrará experimentalmente que a inexatidão realδx é apenas cerca de 30% do limite 5,14. Isso é usual. De forma similar, também no Exemplo 5, se δb = [0,1 0,1 0,1] , então δb = 0,3 e b = 42, de modo que (17) fornece  dx  0,3  logo,  7,5  0,0536,  dx  0,0536 16  0,857 x  42 T





porém esse limite é novamente muito maior que a inexatidão atual, que vale cerca de 0,15.



Comentários Adicionais Sobre os Números Condicionais.As seguintes explicações adicionais podem ser úteis. 1. Não há uma linha precisa separando o “bom condicionamento” do “mal condicionamento”, mas geralmente a situação vai piorando à medida que vamos passando de sistemas com pequenos valores de k(A) para sistemas com grandes valores de k(A). Agora, sempre ocorre que k(A)  1, de modo que valores de 10, 20, ou algo parecido não representam qualquer motivo de preocupação; por outro lado, a ocorrência de, digamos, k(A) = 100 exige cautela, e sistemas como os dos Exemplos 1 e 2 são extremamente mal condicionados. 2. Se k(A) for grande (ou pequeno) em uma norma, ele será grande (ou pequeno, respectivamente) em qualquer outra norma. Veja o Exemplo 5. 3. A literatura sobre o mau condicionamento é extensa. Para uma introdução a esse assunto, veja [E9]. Isto encerra nossa discussão sobre os métodos numéricos para a solução de sistemas lineares. Na próxima seção, consideraremos o ajuste de curvas, uma importante área que permite a obtenção de soluções de sistemas lineares.

PROBLEMAS PROPOSTOS 20.4 1–8

NORMAS VETORIAIS

Compute (5), (6), (7). Calcule um vetor unitário correspondente (vetor de norma 1) com relação à norma l . 1. [1 –6 5] 2. [0,4 –1,2 0 8,0] 3. [–4 4 3 –3] 4. [0 0 1 0 0] 5. [0,3 –0,1 0,5 1,0] 6. [16 21 54 –119] 7. [1 1 1 1 1 1] 8. [3 0 0 –3 0] 9. Mostre que x  x2  x1.

3

4

1

2

1 0.



1 1.



5

7

7

10







10–15 NORMAS MATRICIAIS, NÚMEROS CONDICIONAIS Calcule a norma matricial e o número condicional correspondente à norma vetorial l1.

1 2.

14.





3

3

0

3



1 3.



0

0

100

0

100

0

0,01

0

0

21

10,5

7

5,25

10,5

7

5,25

4,2

7

5,25

4,2

3,5

5,25

4,2

3,5

3





Capítulo 20: Métodos Numéricos de Álgebra Linear

15.



1

0,1

0

0,1

1

0,1

0

0,1

1

67

números rapidamente crescentes. Resolva alguns sistemas lineares envolvendo uma Hn de sua escolha. 24. PROJETO DE EQUIPE. Normas. (a) As normas vetoriais em nosso texto são equivalentes, isto é, relacionam-se por desigualdades duplas; por exemplo,



16. Verifique (11) para x= [4 –5 2] obtido com a norma l e a matriz do Problema 15. 17. Verifique (12) para as matrizes dos Problemas 10 e 11. 18. Verifique os cálculos dos Exemplos 5 e 6 do texto. T



(18)

(b)

19–20 SISTEMAS MAL CONDICIONADOS

20. A 

5 

7

        

7



10

, b1 



2 3

, b2 



1 H3

_1

T

3

2

3

_1 . 4

_1

_1

_1

 x



 x  1.

x 2

(19b)

  x 1   x 2   x 1.



x 1

n  x  2

(19a)



1 n

(c) A fórmula (10) é freqüentemente mais prática que (9). Obtenha (10) a partir de (9). (d) Normas matriciais. Ilustre (11) com exemplos. Dê exemplos de (12) para o caso de igualdade e também para a desigualdade estrita. Prove que as normas matriciais (10) e (11) da Seção 20.3 satisfazem aos axiomas de uma norma:

_1

2

_1



Ela é de grande importância. (Sua prova encontra-se na Ref. [GR7] do Apêndice 1.) Use-a para provar que

3,1

_1

 x1

T

2

T

n

x y  x2 y2.

21. (Resíduo) Para Ax = b1 no Problema 19, forneça por palpite o valor do resíduo de x = [113 –160] (cuja solução é x = [0 1] ). Então faça os cálculos e comente. 22. Mostre que k(A)  1 para as normas matriciais (10) e (11) da Seção 20.3, e k(A) = n para a norma de Frobenius (9) da Seção 20.3. 23. EXPERIMENTO DEÁLGEBRA COMPUTACIONAL. Matrizes de Hilbert. A matriz de Hilbert 3  3 é 

1



Logo, se para algum x, uma norma é grande (ou pequena), a outra norma deve também ser grande (ou pequena). Portanto, em muitas investigações, a escolha particular de uma norma não é essencial. Prove (18). (b) A desigualdade de Cauchy–Schwarz é

Resolva Ax = b1, Ax = b2, compare as soluções e comente. Calcule o número condicional de A. 2 1,4 1,4 1,44 19. A  , b1  , b2  1,4 1 1 1

 

(a) x  x1  n x

A  0.

3 4 5 A  0 se e somente se A  0, kA  k A, A matriz de Hilbert n  n é Hn = [hjk], onde hjk = 1/(j + k – 1). (Matrizes similares ocorrem no ajuste de curvas por mínimos  A  B   A    B . quadrados.) Calcule o número condicionalk(Hn) para a norma matricial correspondente à norma vetoriall - (ou l1-), para n = 2, 25. PROJETO ESCRITO. Normas e seu Uso Nesta Seção. Faça 3, , 6 (ou valores além desses, se desejar). Tente encontrar uma lista das mais importantes idéias vistas nesta seção e escreva uma fórmula que forneça valores aproximados razoáveis para esses um relatório de duas páginas sobre elas.













20.5 Método dos Mínimos Quadrados Tendo discutido os métodos numéricos para sistemas lineares, voltamo-nos agora para uma importante aplicação, o ajuste de curvas, em que as soluções são obtidas a partir de sistemas lineares. No ajuste de curvas temos n pontos (pares de números) ( x1, y1), , ( xn, yn) e desejamos determinar uma função f(x) tal que •

ƒ(x1)  y1,











, ƒ(xn)  yn,

aproximadamente. O tipo de função (por exemplo, polinômios, funções exponenciais, funções senoidais e cossenoidais) pode ser sugerido pela natureza do problema (uma lei física implícita, por exemplo), e em muitos casos um polinômio de certo grau será apropriado. Comecemos com o motivo de se fazer isso. Se requerermos a igualdade estrita f(x1) = y1, , f(xn) = yn e usarmos polinômios de um grau suficientemente alto, podemos aplicar um dos métodos discutidos na Seção 19.3 em conexão com a interpolação. Entretanto, em certas situações isso pode não representar a solução apropriada do problema que temos. Por exemplo, aos quatro pontos •





68

Parte E • Análise Numérica y 2

–1

1

x

Fig. 443. Ajuste aproximado de uma linha reta

(1)

(1,3; 0,103),

(0,1; 1,099),

(0,2; 0,808),

(1,3; 1,897)

corresponde o polinômio de interpolação f(x) = x3 – x + 1 (Fig. 443), mas se nós representamos esses pontos graficamente, vemos que eles se situam próximos a uma linha reta. Logo, se esses valores são obtidos num experimento e, portanto, envolvem um erro experimental, e se a natureza do experimento sugere uma relação linear, obtemos um ajuste melhor com uma linha reta passando através dos pontos (Fig. 443). Essa linha pode ser útil para na previsão de valores esperados para outros valores de x. Um importante princípio utilizado no ajuste de linhas retas é o método dos mínimos quadrados de Gauss e Legendre. Na presente situação, podemos formulálo da seguinte maneira.

Método dos Mínimos Quadrados. A linha reta (2) y  a  bx deve ser ajustada através dos pontos dados (x1, y1), , ( xn, yn) de forma que a soma dos quadrados das •





distâncias desses pontos à linha reta seja mínima, com essa distância sendo medida na direção vertical (a direção y).

O ponto sobre a reta e que possui a abscissa xj tem a ordenada a + bxj. Logo, sua distância de ( xj, yj) é yj – a – bxj (Fig. 444) e a soma dos quadrados é n





2



yj a bxj) . j 1 (  q depende de a e b. Uma condição necessária para q assumir um valor mínimo é q

q

 a

(3)

q

 b



2  ( yj  a  bxj)  0

 

2  xj ( yj  a  bxj)  0

 

(onde somamos em j, indo de 1 a n). Dividindo por 2, escrevendo cada soma como três somas, e passando uma delas para o lado direito, obtemos o resultado

(4)

an



b  xj



 yj

a  xj



b  xj2



 xj yj .

Essas equações são chamadas de equações normais do nosso problema. y

(xj, yj) yj – a – bxj y = a + bx a + bxj

0 0

xj

x

Fig. 444. Distância vertical de um ponto ( xj, y j) a uma linha reta y = a + bx

69

Capítulo 20: Métodos Numéricos de Álgebra Linear

EXEMPLO 1

Linha Reta Usando o método dos mínimos quadrados, ajuste uma linha reta aos quatro pontos dados na fórmula (1).

Solução. Obtemos n



4,

 xj  0,1,

 x j2  3,43,

 yj  3,907,

 xjyj  2,3839.

Logo, as equações normais são 4 a  0,10 b  3,9070. 0,1a  3,43 b  2,3839. A solução (arredondada para 4D) éa = 0,9601, b = 0,6670, e obtemos a linha reta (Fig. 443) y



0,9601  0,6670 x.



Ajuste de Curvas por Polinômios de Grau m Nosso método de ajuste de curvas pode ser generalizado de um polinômio y = a + bx para um polinômio de grau m (5)

p(x)



b0



b1x

q



 ( yj  p(xj))2











bmx m

onde m  n – 1. Então, q assume a forma n

j1

e depende de m + 1 parâmetros b0,







, bm. Em vez de (3), temos então m + 1 condições

q

  0,

(6)

b0







 0 b q

,

m

que fornecem um sistema de m + 1 equações normais. No caso de um polinômio quadrático p(x)  b0  b1x  b2x 2 (7) as equações normais são (somando-se de 1 a n) 

b1  xj

b0  xj b0  x j2

b0 n

(8)



b2  x j2



 yj



b1  x

2 j



b2  x j

3



 xjyj



b1  x j3



b2  x j4



 x j2 yj .

Deixamos a obtenção de (8) a cargo do leitor. EXEMPLO 2

Parábola Quadrática por Mínimos Quadrados Ajuste uma parábola que passe através dos dados (0, 5), (2, 4), (4, 1), (6, 6), (8, 7).

Solução. Para as equações normais, precisamos de n  5, xj  20, x j2  120, x j3  800, x j4  5664 yj  23,  xjyj  104,  x j2 yj  696. Logo, essas equações são 5 b0  20 b1 

120 b2  23

20 b0  120 b1 

800 b2  104

120 b0  800 b1  5664 b2  696. Resolvendo-as, obtemos a parábola quadrática de mínimos quadrados (Fig. 445) y



5,11429  1,41429 x  0,21429 x 2.



Para um polinômio geral (5), as equações normais formam um sistema linear de equações nas incógnitas b0, , bm. Quando sua matriz M é não-singular, podemos resolver o sistema pelo método de Cholesky (Seção 20.2), pois M será então definida positiva (e simétrica). Quando as equações são de modo aproximado linearmente dependentes, as equações normais podem tornar-se mal condicionadas, devendo ser substituídas por outros métodos; veja [E5] da Seção 5.7, listada no Apêndice 1. O método dos mínimos quadrados também desempenha um papel em estatística (veja a Seção 25.9). •





70

Parte E • Análise Numérica y 8

6

4

2

0

2

4

6

x

8

Fig. 445. Parábola dos mínimos quadrados do Exemplo 2

PROBLEMAS PROPOSTOS 20.5 15. EXPERIMENTO DE ÁLGEBRA COMPUTACIONAL. Míni1–6 AJUSTANDO UMA LINHA RETA mos Quadrados versus Interpolação. Para os dados fornecidos Usando o método dos mínimos quadrados, ajuste uma linha reta para e também para dados que você escolher, encontre o polinômio de os pontos dados. Mostre os detalhes. Verifique seu resultado esboçaninterpolação e as aproximações por mínimos quadrados (linear, do os pontos e a linha. Julgue a eficácia do ajuste. quadrática etc.). Compare e comente. 1. (2, 0), (3, 4), (4, 10), (5, 16) (a) (–2, 0), (–1, 0), (0, 1), (1, 0), (2, 0) 2. Como a linha do Problema 1 se altera se adicionamos um ponto (b) (–4, 0), (–3, 0), (–2, 0), (–1, 0), (0, 1), (1, 0), (2, 0), (3, 0), (4, 0) muito acima dela, digamos (3, 20)? (c) Escolha cinco pontos sobre uma linha reta, por exemplo, (0, 3. (2,5, 8,0), (5,0, 6,9), (7,5, 6,2), (10,0, 5,0) 0), (1, 1), , (4, 4). Mova um dos pontos uma unidade para 4. (Lei de Ohm U = Ri) Pela linha dos mínimos quadrados, estime a cima e encontre o polinômio quadrático pelo método dos mínimos resistência R que ajusta (i, U) = (2,0, 104), (4,0, 206), (6,0, 314), quadrados. Faça isso para cada ponto. Represente num mesmo (10,0, 530). gráfico os cinco polinômios. Qual dos cinco movimentos tem o 5. (Velocidade média) Estime a velocidade médiavav de um carro maior efeito? viajando de acordo coms = v  t [km] (s = distância percorrida,t 16. PROJETO DE EQUIPE. A aproximação por mínimos qua[h] = tempo) de ( t, s) = (9, 140), (10, 220), (11, 310), (12, 410). drados de uma função f(x) num intervalo a  x  b por uma função 6. (Lei de Hooke F = ks) Estime a constante elásticak de uma mola a partir da força F [lb] e da elongação s [cm], onde (F, s) = (1, F m ( x )  a 0 y 0( x )  a 1y 1 ( x )   a m y m( x ) 0,50), (2, 1,02), (4, 1,99), (6, 3,01), (10, 4,98), (20, 10,03). onde y0(x), , ym(x) são funções dadas, requer a determinação 7. Demonstre as equações normais (8). dos coeficientes a0, , am tais que •













8–10

AJUSTANDO UMA PARÁBOLA QUADRÁTICA

Usando mínimos quadrados, ajuste uma parábola (7) para os pontos dados (x, y). Verifique o resultado por meio de um esboço. 8. (–1, 3), (0, 0), (1, 2), (2, 8) 9. (0, 4), (2, 2), (4, –1), (6, –5) x do funcionário encarregado 1 2 3 4 5 10. Tempo[h] Tempo [s] de reação do funcionário

1,50 1,28 1,40 1,85 2,20

11. Ajuste (2) e (7) usando mínimos quadrados para (–1,0, 5,4), (–0,5, 4,1), (0, 3,9), (0,5, 4,8), (1,0, 6,3), (1,5, 9,3). Num mesmo gráfico, represente os dados e as curvas e comente. 12. (Parábola cúbica) Usando o método dos mínimos quadrados, obtenha a fórmula para as equações normais de uma parábola cúbica.











 [ƒ( ) b

(9)

x



F m ( x )] 2 dx

a

torna-se mínimo. Essa integral é denotada por f – Fm2, e f – Fm é chamada de norma L2 de f – Fm (com L em homenagem a Lebesgue2). Uma condição necessária para esse mínimo é dada por∂f – Fm2/∂aj = 0, j = 0, , m [o análogo de (6)]. (a) Mostre que isso conduz a m + 1 equações normais (j = 0, , m) •











m

 h jk a k k0

(10)

h jk



bj

onde

 () ()  ƒ( ) ( ) b



y j x y k x dx ,

a b

bj



x y j x dx .

a

13. Usando o método dos mínimos quadrados, ajuste as curvas (2) e (b) Polinômio. Que forma assume (10) se Fm(x)  a0  a1 x  (7) e uma parábola cúbica para (–2, –35), (–1, –9), (0, –1), (1, –1),  a m x m ? Qual é a matriz dos coeficientes de (10) nesse caso (2, 17), (3, 63). Represente num mesmo gráfico as três curvas e os quando o intervalo é 0 x  1? pontos. Comente a eficácia do ajuste. (c) Funções ortogonais. Quais são as soluções de (10) sey0(x), , 14. PROJETO DE ÁLGEBRA COMPUTACIONAL. Mínimos ym(x) são ortogonais no intervaloa  x  b? (Para a definição, Quadrados. Escreva programas para calcular e resolver as equaveja a Seção 5.7. Veja também a Seção 5.8.) ções normais (4) e (8). Aplique os programas aos Problemas 3, 5, 9, 11. Se o seu aplicativo tiver um comando específico para ajuste 2HENRI LEBESGUE (1875–1941), grande matemático francês, que criou a (como têm o Maple e o Mathematica), compare seus resultados moderna teoria de medidas e integração em sua famosa tese de doutoramento com os obtidos pelo seu programa. de 1902. •











Capítulo 20: Métodos Numéricos de Álgebra Linear

71

20.6 Problemas de Matrizes de Autovalores: Introdução

Nas seções restantes deste capítulo, discutiremos algumas das mais importantes idéias e métodos numéricos para problemas de matrizes de autovalores. Essa extensa parte da álgebra linear numérica tem grande importância prática e sobre ela há muita pesquisa sendo desenvolvida, com centenas, senão milhares, de artigos publicados em vários periódicos especializados (veja as Refs. em [E8], [E9], [E11], [E29]). Começaremos com os conceitos e os resultados gerais de que precisaremos para explicar e aplicar os métodos numéricos aos problemas de autovalores. (Para modelos típicos de problemas de autovalores, veja o Capítulo 8.) Um autovalor ou valor característico (ou ainda raiz latente) de uma dada matriz n  n A = [ajk] é um número real ou complexo λ tal que a equação vetorial

(1)

Ax  lx

possui uma solução não-trivial, ou seja, uma solução x  0 , que é então chamada de autovetor ou vetor característico da A correspondente a esse autovalor λ. O conjunto de todos os autovalores de A é chamado de espectro de A. A Equação 1 pode ser escrita como (A  lI) x  0

(2)

onde I é a matriz-identidade n  n. Esse sistema homogêneo possui uma solução não-trivial se e somente se o determinante característico det(A – λI) é 0 (veja o Teorema 2 da Seção 7.5). Isso nos leva ao (veja a Seção 8.1). TEOREMA 1

Autovalores Os autovalores de A são as soluções λ da

equação característica

a11

(3)

det (A  lI) 





a21

l

a12 a22

l







a1n







a2n













an1

an2









ann



l





0.

Desenvolvendo o determinante característico, obtemos o polinômio característico de A, que é de grau n em λ. Logo, A tem pelo menos um e no máximo n diferentes números de autovalores. Se A é real, o mesmo ocorre com os coeficientes do polinômio característico. Da álgebra comum, decorre que, então, as raízes (os autovalores de A) são reais ou conjugados complexosaos pares. Usualmente representaremos os autovalores de A por l1, l2,







, ln

porém admitindo que alguns deles (ou todos) podem ser iguais. A soma desses n autovalores é igual à soma dos elementos da diagonal principal de A, chamada de traço de A; portanto,

(4)

n

traço A   ajj



n

 lk.

j1

k1

Além disso, o produto dos autovalores é igual ao determinante de A,

(5)

det A  l1l2







ln.

Ambas as fórmulas decorrem da fatoração do polinômio característico, que denotamos por f(λ), ƒ(l)  ( 1)n(l  l1)(l  l2)







( l  ln).

72

Parte E • Análise Numérica

Se, em A, agruparmos os fatores iguais e denotarmos os autovalores numericamente distintos por (r  n), então o produto torna-se ƒ(l)  ( 1)n(l  l1)m (l  l2)m

(6)

1

2 •





λ1,







,

λr

( l  lr)mr.

O expoente mj é chamado de multiplicidade algébrica de λj. O número máximo de autovetores linearmente independentes correspondente a λj é chamado de multiplicidade geométrica de λj. Ele é igual ou menor que mj. Um subespaço S de Rn ou Cn (se A é complexo) é chamado de subespaço invariante de A se, para todo v em S, o vetor Av está também em S. Autoespaços de A (espaços de autovetores; Seção 8.1) são importantes subespaços invariantes de A. Uma matriz B n  n é chamada de similar a A se existe uma matriz T não-singular n  n tal que

(7)

B  T 1AT. 

A similaridade é importante pela seguinte razão. TEOREMA 2

Matrizes Similares Matrizes similares têm os mesmos autovalores. Se x for um autovetor de de B em (7) correspondente ao mesmo autovalor. (Prova na Seção 8.4.)

A, então y = T–1x é um autovetor

Outro teorema que possui diversas aplicações nos métodos numéricos é o seguinte. TEOREMA 3

Deslocamento Espectral Se A tem os autovalores λ1,







, λn, então A – k I com k arbitrário tem os autovaloresλ1 – k,







, λn – k.

Esse teorema é um caso especial do seguinte teorema do mapeamento espectral. TEOREMA 4

Polinômios Matriciais Se λ é um autovalor de

A, então q(l)



asls



as 1ls

1













a1l



a0



a1A



a0I.

é um autovalor do polinômio matricial q(A)

PROVA



asAs



As

as

1

1









Ax = λx implica A2x  Alx  lAx  l2x, A3x  l3x, etc. Portanto, q(A)x



( as As  as 1As



as A x



as



as lsx



as 1ls

1



s





A x

1





)x



s 1

x







1









q(l) x.



Os autovalores de importantes matrizes especiais podem ser caracterizados do seguinte modo TEOREMA 5

Matrizes Especiais —T

Os autovalores de matrizes hermitianas (isto é, A = A), e logo, os autovalores de matrizes reais simétri—T cas (isto é, AT = A), são reais. Os autovalores de matrizes anti-hermitianas(isto é, A = –A), e logo, os (isto é, AT = – A) são imaginários puros ou0. Os autovalores autovetores de matrizes reais anti-simétricas —T de matrizes-identidade (isto é, A = A–1), e logo, os autovetores de matrizes ortogonais (isto é, AT = A–1), têm valor absoluto 1. (Prontas nas Seções 8.3 e 8.5.)

73

Capítulo 20: Métodos Numéricos de Álgebra Linear

A escolha de um método numérico para problemas de autovalores de matrizes depende essencialmente de duas circunstâncias: do tipo de matriz (simétrica real, geral real, complexa, esparsa, ou cheia) e do tipo de informação a ser obtida, isto é, do fato de desejarmos conhecer todos os autovalores ou apenas valores específicos, como por exemplo, o maior autovalor, ou se desejamos conhecer os autovalores e os autovetores são desejados, e assim por diante. Fica claro que é aqui impossível discutirmos sistematicamente todas essas e outras possibilidades que surgem na prática, mas, em vez disso, iremos nos concentrar em alguns aspectos básicos e métodos que nos proporcionarão um entendimento geral desse fascinante campo.

20.7 Inclusão de Autovalores de Matrizes Todo o campo de estudo dos métodos numéricos aplicados aos problemas de autovalores matriciais se justifica pelo fato de que, excetuando-se alguns poucos casos triviais, não é possível determinar exatamente os autovalores por meio de um processo finito, uma vez que esses valores correspondem às raízes de um polinômio de grau n. Logo, usaremos principalmente iterações nesses casos. Nesta seção, enunciaremos alguns teoremas gerais que fornecem aproximações e limites de erro para os autovalores. Nossas matrizes continuarão sendo reais (exceto na fórmula (5) a seguir), porém, como as matrizes (não-simétricas) podem ter autovalores complexos, os números complexos terão um certo papel (embora muito modesto) nesta seção. O importante teorema de Gerschgorin fornece uma região que consiste de discos circulares fechados no plano complexo e inclui todos os autovalores de uma dada matriz. Com efeito, para cada j = 1, , n, a desigualdade (1) no teorema determina um disco circular fechado no plano complexo λ com centro ajj e um raio dado pelo lado direito de (1); e o Teorema 1 estabelece que cada um dos autovalores de A situa-se em um desses n discos. •

TEOREMA 1





Teorema de Gerschgorin Consideremos que λ seja um autovalor de uma matriz arbitrária nx n A = [ajk]. Então, para algum número inteiro j (1  j  n), temos 

PROVA





l

ajj

(1)

aj1



aj2











aj, j 1



aj, j 1 











ajn.

Consideremos que x seja um autovetor correspondente a um autovalor λ de A. Então,

Ax  lx

(2)

(A  lI) x  0.

ou

Façamos xj ser um componente de x com o maior valor absoluto. Então, temos xm/xj  1 para m = 1, , n. A equação vetorial (2) é equivalente a um sistema de n equações para as n componentes dos vetores em ambos os lados. A j-ésima dessas n equações com o j conforme o indicado é •

aj1x1









aj, j 1xj





1



( ajj



l) xj



aj, j1 xj1











ajnxn







0.

Dividindo por xj (que não pode ser zero; por quê?) e rearranjando os termos, chegamos a ajj



l

 aj1

x1

 xj











aj, j

1

xj

xj1

  a x 1

j, j1

j

  x j









xn ajn  . xj

Tomando os valores absolutos em ambos os lados dessa equação, aplicando a desigualdade triangular a + b  a + b (onde a e b são números complexos) e observando que devido à escolha de j (que é crucial!) x1/xj  1, , xn/xj  1, obtemos (1) e o teorema está provado.  •

EXEMPLO 1





Teorema de Gerschgorin Para os autovalores da matriz



obtemos os discos de Gerschgorin (Fig. 446)

0

1/2

1/2

A  1/2

5

1

1/2

1

1



74

Parte E • Análise Numérica D1:

Centro 0, raio 1,

D2:

Centro 5, raio 1,5, D3: Centro 1, raio 1,5.

Os centros são os elementos da diagonal principal de A. Eles seriam os autovalores de A se A fosse diagonal. Podemos tomar esses valores como aproximações grosseiras dos autovalores desconhecidos (valores 3D) λ1 = –0,209, λ2 = 5,305, λ3 = 0,904 (verifique isso); então, os raios dos discos correspondem aos limites dos erros. Como A é simétrica, do Teorema 5 da Seção 20.6 segue que o espectro de A precisa de fato se situar nos intervalos [–1, 2,5] e [3,5 , 6,5]. É interessante que, aqui, os discos de Gerschgorin formam dois conjuntos disjuntos, a saber, D1  D3, que contêm dois autovalores, e D2, que contém um autovalor. Isso é usual, conforme mostra o seguinte teorema.  y D3

D1 0

D2

1

x

5

Fig. 446. Discos de Gerschgorin do Exemplo 1

TEOREMA 2

Extensão do Teorema de Gerschgorin Se, numa dada matriz A, p discos de Gerschgorin formam um conjunto S que é disjunto de n – p outros discos, então S contém precisamente p autovalores deA ( cada um com sua multiplicidade algébrica, conforme definida na Seção 20.6).

Idéia da Prova. Consideremos A = B + C, onde B é a matriz diagonal com elementos ajj, e apliquemos o Teorema 1 a At = B + tC com t real crescendo de 0 a 1. EXEMPLO 2

Outras Aplicações do Teorema de Gerschgorin. Similaridade Suponha que diagonalizamos a matriz por algum método numérico que nos deixou com alguns elementos de fora da diagonal com um tamanho de 10–5, como, por exemplo, 2

10

10

5

A  10

5

2

10

5

10

5

10

4



5

5



.

O que podemos concluir sobre os desvios dos autovalores em relação aos elementos da diagonal principal?

Solução. Pelo Teorema 2, um autovalor deve se situar no disco de raio 2  10–5 centrado em 4 e dois autovalores (ou um autovalor de multiplicidade algébrica 2) no disco de raio 2  10–5 centrado em 2. Com efeito, como a matriz é simétrica, esses autovalores necessariamente se situam nas interseções desses discos com o eixo real, segundo o Teorema 5 da Seção 20.6. Mostremos de que modo um disco isolado pode sempre ser reduzido em tamanho por uma transformação de similaridade. A matriz 1

0

0

B  T 1AT  0

1

0

0

0

10





5







2

10

10

5

10

5

2

10

5

10

5

10

4

5

5

2

10

10

2

10

5

10

5

10

10

1 1 4

0

1

0

0

1

0

0

0

105







é similar a A. Logo, pelo Teorema 2 da Seção 20.6, ela possui os mesmos autovalores de A . Da linha 3 temos o menor disco de raio 2  10–10. Note que os outros discos ficaram maiores, aproximadamente por um fator 105. E, ao escolhermos T, temos que observar que os novos discos não se sobrepõem ao disco cujo tamanho desejamos diminuir. Para mais fatos interessantes, veja o livro [E28], recentemente publicado. 

Por definição, uma matriz diagonalmente dominante A = [ ajk] é uma matriz n  n tal que (3)

ajj   ajk kj

j



1,







,n

Capítulo 20: Métodos Numéricos de Álgebra Linear

75

onde o somatório engloba todos os elementos de fora da diagonal na linha j. Dizemos que a matriz é estrita e diagonalmente dominante se > em (3) para todo j. Use o Teorema 1 para provar a seguinte propriedade básica. TEOREMA 3

Dominância Estrita e Diagonal Matrizes estrita e diagonalmente dominantes são não-singulares.

Outros Teoremas de Inclusão Um teorema de inclusão é aquele que especifica um conjunto que contém ao menos um autovalor de uma dada matriz. Portanto, os Teoremas 1 e 2 são de inclusão e chegam mesmo a incluir a totalidade do espectro. Discutiremos agora alguns famosos teoremas que produzem outras inclusões de autovalores. Enunciaremos sem demonstração os dois primeiros deles (pois prová-los excederia o nível deste livro). Teorema de Schur3

TEOREMA 4

Consideremos A = [ajk] uma matriz n



n . Então, para cada um de seus autovalores λ1, n

n

lm2   li2    ajk2

(4)

i1

Em







,

λn,

n

(Desigualdade de Schur).

j1 k1

(4), o segundo sinal de igualdade se verifica se e somente se A seja tal que

(5)

T

T

A  A  AA .

As matrizes que satisfazem (5) são chamadas de matrizes normais. Não é difícil ver que as matrizes hermitianas, anti-hermitianas e unitárias são normais, o mesmo ocorrendo com as matrizes simétricas, anti-simétricas e ortogonais reais. EXEMPLO 3

Limites para os Autovalores Obtidos pela Desigualdade de Schur Para a matriz 26

A





2

2

2

21

4

4

2

28



Obtemos, pela desigualdade de Schur, l   1949  44,1475. Você pode verificar que os autovalores são 30, 25, e 20. Então, 30 2 + 25 2 + 202 = 1925 < 1949; de fato, A não é normal. 

Os teoremas precedentes são válidos para toda matriz quadrada real ou complexa. Outros teoremas aplicam-se somente a classes especiais de matrizes. O seguinte é famoso. TEOREMA 5

Teorema de Perron4 Consideremos que A seja uma matriz real n  n cujos elementos são todos positivos. Então,A tem um autovalor real positivoλ = r de multiplicidade 1. O autovetor correspondente pode ser escolhido com todas as componentes positivas. (Os outros autovalores são menores queρ em valor absoluto.)

Para a demonstração, veja a Ref. [B3], vol. II. O teorema também se aplica às matrizes com termos reais nãonegativos ( “Teorema de Perron–Frobenius”4), desde que A seja irredutível, isto é, não possa ser colocada na seguinte forma por meio da inversão das linhas e colunas; aqui, B e F são quadradas e 0 é uma matriz nula.

ISSAI SCHUR (1875–1941), matemático alemão, também conhecido por seus importantes trabalhos em teoria de grupos. 4 OSKAR PERRON (1880–1975), GEORG FROBENIUS (1849–1917), LOTHAR COLLATZ (1910–1990), matemáticos alemães, conhecidos por seus trabalhos em teoria do potencial, EDOs (Seção 5.4) e teoria de grupos e teoria numérica, respectivamente. 3

76

Parte E • Análise Numérica



B

C

0

F



O teorema de Perron tem várias aplicações, por exemplo, em economia. É interessante que ele pode ser obtido a partir de um teorema que fornece um algoritmo numérico: TEOREMA 6

Teorema da Inclusão de Collatz 4 Consideremos que A = [ajk] seja uma matriz real n  n cujos elementos são todos positivos. Chamemos de x um vetor real cujas componentes x1, , xn são positivas e chamemos de y1, , yn as componentes do vetor y = Ax. Então, o intervalo fechado no eixo real limitado pelo menor e pelo maior dos n coeficientes qj = yj/xj contém pelo menos um autovalor deA. •

PROVA











Temos Ax = y ou

y  Ax  0.

(6)

A transposta A satisfaz às condições do Teorema 5. Logo, A possui um autovalor positivo l e, correspondente a esse autovalor, um autovetor u cujas componentes uj são todas positivas. Portanto, A u = lu, e transpondo, obtemos u A = lu . Disso e de (6), temos T

T

T

T

T

u (y  Ax)  u y  u Ax  u y  lu x  u (y  lx)  0 T

T

T

T

T

T

ou escrevendo de forma compacta n

 uj ( yj  lxj)  0. j1

Visto que todas as componentes uj são positivas, segue-se que yj

(7)

 

lxj



0,

ou seja,

qj



para ao menos um j,

l

 

e

0, ou seja, para ao menos um Como A e A têm os mesmos autovalores,l é um autovalor de A e, de (7), decorre o enunciado do teorema. yj

lxj

j.

l

qj

T

EXEMPLO 4



Limites para a Obtenção de Autovalores pelo Teorema de Collatz. Iteração Para uma dada matrizA com elementos positivos, escolhemos umx = x0 e efetuamos iterações, ou seja, computamosx1 = Ax0, x2 = Ax1, , x20 = Ax19. Em cada passo, fazendox = xj e y = Axj = xj + 1 calculamos um intervalo de inclusão pelo Teorema de Collatz. Isso fornece (6S) •

0,49

0,02

0,22

A  0,02

0,28

0,20 , x0  1 , x1  0,50 , x2  0,3186 ,

0,22

0,20

0,40



e os intervalos 0,5 j

Tamanho



l



1

0,73

0,5481

      1

0,82

0,00216309







0,00155743

  







, x19  0,00108155 , x20  0,000778713

0,5886

0,00216309

0,00155743

0,82, 0,3186/0,5 = 0,6372  l  0,5481/0,73 = 0,7508522 etc. Esses intervalos têm os comprimentos

1 0,32

2 0,113622

3 0,0539835

10 0,0004217

15 0,0000132

20 0,0000004

Usando o polinômio característico, você pode verificar que os autovalores de A são 0,72, 0,36, 0,09, de modo que esses intervalos incluem o maior autovalor, 0,72. Seus comprimentos diminuíram com j, de modo que valeu a iteração foi proveitosa. A razão disso aparecerá na próxima seção, onde discutiremos um método iterativo para autovalores. 

PROBLEMAS PROPOSTOS 20.7 1–6

DISCOS DE GERSCHGORIN

Encontre e esboce os discos ou intervalos que contêm os autovalores. Se você possui um aplicativo computacional à disposição, encontre o espectro e compare.

1.





1

0

1

7

1

0

1

8

6 



Capítulo 20: Métodos Numéricos de Álgebra Linear

   

cas e ortogonais reais) são normais. Por que isso é de interesse prático? 13. (Raio espectral (A)) Mostre que r(A) não pode ser maior que a norma da soma das linhas deA. 14. (Autovalores sobre a circunferência) Use uma matriz 2  2 para ilustrar o fato de que um autovalor pode muito bem se situar sobre uma circunferência de Gerschgorin (de modo que os discos de Gerschgorin não possam em geral ser substituídos por discos menores sem se perder a propriedade da inclusão).

1i

Use (4) para obter um limite superior para o raio espectral: 15. No Problema 1. 16. No Problema 6. 17. No Problema 3.

5

10

10

2. 10

8

10

10

10

9

2

2

2

0

4

4

2

7

5.

6.

  



2

2

3. 2

5

2

2

2

4.

77

0,3i 0,1i 4i

0,3 

3  2i 0,2

0,1 4i

0,1i 0

0

1i

0

9i





1i

0,1i 

15–17 DESIGUALDADE DE SCHUR

0,5i

10

0,1

0,1

6

0

0,2

0

3





18–19 TEOREMA DE COLLATZ Aplique o Teorema 6, escolhendo os vetores dados como vetoresx. 18.



0,2

 

10

1

1

9

1

3

4

       1

1

1

2

3 , 1 , 2 , 3

11

2

2

1

1

1

2

1

4 2 , 2 , 1 7. (Similaridade) Encontre T–1AT de modo que, no Problema 2, o 19. 2 raio do círculo de Gerschgorin com centro 5 seja reduzido por um 2 2 4 1 1 fator de 1/100. 8. No Problema 6, por qual fator inteiro você pode obter uma máxima 20. EXPERIMENTO DE ÁLGEBRA COMPUTACIONAL. Iteração de Collatz. (a) Escreva um programa para fazer a iteração redução do círculo de Gerschgorin com centro 3? do Exemplo 4 (com algumA e x0), e que a cada passo imprima 

n nA ajkdiagonal –6 Se umapor matriz simétrica = [da ] tiver sido 9. exceto pequenos elementos fora e dediagonalizada tamanho 10 , o que você pode dizer sobre os autovalores? 10. (Teorema estendido de Gerschgorin) Prove o Teorema 2. 11. Prove o Teorema 3. 12. (Matrizes normais ) Mostre que as matrizes hermitianas, antihermitianas e unitárias (logo, matrizes simétricas, anti-simétri-

o ponto médio (por quê?), as extremidades e o comprimento do intervalo de inclusão. (b) Aplique o programa a matrizes simétricas de sua escolha. Explore como a convergência depende da escolha dos vetores iniciais. Você poderia elaborar casos onde os comprimentos dos intervalos de inclusão não decresçam monotonamente? Poderia explicar o motivo disto? Poderia testar o efeito dos arredondamentos?

20.8 Método de Potências para Autovalores Um simples procedimento-padrão para o cálculo de valores aproximados de autovalores de uma matriz n  n A = [ajk] é o método da potências. Nesse método, começamos a partir de um vetor qualquer x0 (0) com n componentes e calculamos sucessivamente

x1  Ax0,

x2  Ax1,







xs  Axs 1.

,



Para simplificar a notação, denotamos xs–1 por x e xs por y, logo, y = Ax. 

O método se aplica a qualquer matrizautovalores). um autovalor (um λotal que do seja A n n que dominante λ erro maior que o valor absoluto dos demais Sepossua , ela também fornecerá limite A for simétrica (2), além da aproximação (1). TEOREMA 1

Método da Potência, Limites dos Erros Consideremos que A seja uma matriz real simétrica n n. Façamos x componentes. Além disso, façamos que

y  Ax,

m0



x x, T

m1



x y, T

( 0) ser um vetor real com n m2



y y. T

78

Parte E • Análise Numérica

Então, o quociente

(1)

q



m

1

(Quociente de Rayleigh5)

m0

é uma aproximação para um autovalorλ de A (que usualmente seja o maior em valor absoluto, embora dessa forma não seja possível fazer generalizações). Além disso, se fizermos q = λ – e, onde e é o erro de q, então

PROVA

  . m2

 e  d 

(2)

q2



m0

δ2 denota o radicando em (2). Como m1 = qm0 por (1), temos

(y  qx) (y  qx)  m2  2 q m1  q 2m0  m2  q 2m0  d2m0.

(3)

T

Como A é real e simétrica, ela possui um conjunto ortogonal de n autovetores reais unitários z1, , zn correspondentes aos autovalores λ1, , λn, respectivamente (alguns dos quais podem ser iguais). (A prova disso está na Ref. [B3], vol. 1, pp. 270-272, listada no Apêndice 1.) Então x possui uma representação na forma •





x  a1 z1  Agora, Az1 =

λ1z1















an zn.

etc. e obtemos

y  Ax  a1l1z1 





anlnzn





e, como os zj são vetores unitários ortogonais, (4)

m0



x x  a12  T









an2.

Segue-se que, em (3),

y  qx  a1(l1  q) z1  Como os zj vetores unitários ortogonais, então obtemos de (3) •

(5)

d2m0









an(ln

( y  q x) ( y  q x)  a12 (l1  q)2 



T







q) zn.



an2 (ln



q)2.

Agora, façamos λc ser um autovalor de A para o qual q é o valor mais próximo, onde a letra c sugere “mais próximo”*. Então, (λc – q )2  ( λj – q )2 para j = 1, , n. Disso e de (5), obtemos a desigualdade •

d2m0







( lc  q)2(a12 









an2)



( lc  q)2m0.

Dividindo por m0, tomando a raiz quadrada e lembrando do significado de δ2, temos d

   m2



m0



q2



lc  q.

Isso mostra que δ é um limite para o erro e da aproximação q de um autovalor de A, e conclui a prova.



A principal vantagem desse método é a simplicidade. Ele é capaz de manipular matrizes esparsas muito grandes, de modo a armazená-las numa disposição quadrada cheia. Sua desvantagem é a possibilidade de convergir lentamente. Da demonstração do Teorema 1, vemos que a velocidade da convergência depende da relação da razão entre o autovalor dominante e o autovalor de segundo maior valor absoluto (2:1 no Exemplo 1, a seguir).

5 LORD RAYLEIGH (JOHN WILLIAM STRUTT) (1842–1919), grande físico e matemático inglês, catedrático em Cambridge e Londres, conhecido por suas importantes contribuições a várias áreas da matemática aplicada e da física teórica, em particular, da física ondulatória, elasticidade e hidrodinâmica. Recebeu o Prêmio Nobel de Física em 1904. *“Mais próximo”: closest no srcinal. (N.T.)

Capítulo 20: Métodos Numéricos de Álgebra Linear

79

Se desejarmos uma seqüência convergente de autovetores, então no início de cada passo escalonamos o vetor, ou seja, dividimos suas componentes por aquela de maior valor absoluto, como no Exemplo 1 seguinte. EXEMPLO 1

Aplicação do Teorema 1. Ajuste de Escala No Exemplo 4 da Seção 20.7, para a matriz simétrica A e x0 = [1 1 1] , obtemos de (1) e (2) e do escalonamento indicado T



     

0,49

0,02

0,22

1

A  0,02

0,28

0,20 , x0  1 , x1  0,609756 , x2  0,541284

0,890244

0,22

0,20

0,40

1

0,990663

0,931193

1

1

0,999707

x5  0,504682 ,

0,999991

x10  0,500146 ,

 

x15  0,500005 .

 

1

 

1

1

Aqui, Ax0 = [0,73 0,5 0,82] , com ajuste de escala para x1 = [0,73/0,82 0,5/0,82 1] etc. O autovalor dominante é 0,72, e um autovetor é [1 0,5 1] . Os q e δ correspondentes são computados antes de cada escalonamento. Portanto, no primeiro passo, T

T

q

d



  m2

m0





1/2

q2



m

1



m0

x Ax  x x 0

T

0

T

0



0

T

2,05   0,683333 3

    (Ax0)TAx0 x0Tx0

1/2



q2



1,4553 3



q2

1/2



0,134743.

Isso fornece os seguintes valores de q, δ e do erro e = 0,72 – q (calculados com 10D e arredondados para 6D): j

1

2

5

10

q

0,683333 0,134743 0,036667

0,716048 0,038887 0,003952

0,719944 0,004499 0,000056

0,720000 0,000141 5 10 8

d e





Os limites dos erros são muito maiores que os erros reais. Isso é usual, embora os limites não possam ser melhorados; isto é, para matrizes simétricas especiais, os limites equivalem-se aos erros. Nossos atuais resultados são um pouco melhores que os obtidos pelo método de Collatz no Exemplo 4 da Seção 20.7, porém à custa de um número maior de operações. 

O deslocamento espectral, ou seja, a transição de A para A – kI, desloca todo autovalor por um fator – k. Embora achar um processo automático de obtenção de um bom k seja algo difícil, pode ser de alguma valia a utilização de algum outro método ou de pequenos experimentos computacionais preliminares. No Exemplo 1, o teorema de Gerschgorin fornece –0,02  λ  0,82 para o espectro inteiro (verifique!). O deslocamento por um fator –0,4 pode ser excessivo (pois então –0,42  λ  0,42), de modo que tentamos –0,2. EXEMPLO 2

Método de Potências com Deslocamento Espectral Para A – 0,2I com A como no Exemplo 1, obtemos as seguintes melhorias substanciais (onde o índice 1 se refere ao Exemplo 1 e o índice 2 ao exemplo atual). j

d1 d2 e 1

e2

1 0,134743 0,134743 0,036667 0,036667

2 0,038887 0,034474 0,003952 0,002477

5 0,004499 0,000693 0,000056 1,3 10 

6

10 0,000141 1,8 10 5 10 9 10 





6

8

12



PROBLEMAS PROPOSTOS 20.8 1–7

MÉTODO DE POTÊNCIAS COM ESCALONAMENTO

Aplique o método de potências (3 passos) com escalonamento, usando x0 = [1 1] ou [1 1 1] ou [1 1 1 1] , conforme a aplicabilidade. T

T

T

Forneça os coeficientes de Rayleigh e os limites dos erros. Mostre os detalhes do que fizer.

80

1.

3.

4.

Parte E • Análise Numérica

     3,5

2,0

2,0

0,5

5

2

2



11. (Deslocamento espectral, menor autovalor) No Problema 5, faça B = A – 3I (como talvez sugerido pelos elementos da diagonal) e verifique se você pode obter uma seqüência deq’s convergindo para um autovalor deA que seja o menor deles (não o maior) em valor absoluto. Use x0 = [1 1 1] . Execute 8 passos. Verifique que A tem o espectro {0, 3, 5}. 12. EXPERIMENTO DEÁLGEBRA COMPUTACIONAL. Método de Potências com Escalonamento. Deslocamento. (a) Escreva um programa para matrizesn  n que imprima cada passo. Aplique-o à matriz (não-simétrica!) (20 passos), começando de [1 1 1] .

0,6

T

1

3

6

 

3

5.

6 

4

0

1

2

8

0

2

3

2

1

8

2



2



  7.



1

1

1

3

2

1

2

3

2





2

1

4



0,8 

7

2



0 6.

0,8

2

2



0,6

2.

T

5

1

0

0

1

3

1

0

0

1

3

1

0

0

1

5



A

12

3

18

44

18 .



19 36 7 (b) Experimente em (a) com o deslocamento. Qual é o deslocamento ótimo encontrado? (c) Escreva um programa como em (a), porém para matrizes simétricas, e que imprima os vetores, os vetores escalonados,q, e δ. Aplique-o à matriz do Problema 6. (d) Encontre uma matriz (não-simétrica) para a qualδ em (2) já não seja mais um limite do erro. (e) Faça experimentos sistemáticos com a velocidade de convergência, escolhendo matrizes com o segundo maior autovalor (i) quase igual ao maior, (ii) um pouco diferente e (iii) muito diferente.

8. (δ ótimo) No Problema 2, escolhax0 = [3 –1] e mostre que q = 0 e δ = 1 para todos os passos, e que os autovalores são ±1, de modo que o intervalo [q – δ, q + δ] não pode em geral ser encurtado! Experimente com outrosx0. 9. Prove que, em (2), se x é um autovetor, então δ = 0. Dê dois exemplos. 10. (Quociente de Rayleigh) Por que q é em geral uma aproximação do autovalor de maior valor absoluto? Quandoq será uma boa aproximação? T



15

Tridiagonalização e Fatoração QR

20.9

Consideremos o problema de calcular todos os autovalores de uma matriz real simétrica A = [ajk], discutindo um método extensamente usado na prática. No primeiro estágio, reduzimos a matriz dada a uma matriz tridiagonal, ou seja, a uma matriz com todos os elementos diferentes de zero na diagonal principal e nas posições imediatamente adjacentes à diagonal principal (como A3 na Fig. 447, Terceiro Passo). Essa redução foi concebida por A. S. Householder (J. Assn. Comput. Machinery 5 (1958), 335–342). Veja também a Ref. [E29] no Apêndice 1. Essa tridiagonalização de Householder simplificará a matriz sem alterar seus autovalores. Os últimos serão então determinados (aproximadamente) fatorando-se a matriz tridiagonalizada, conforme discutiremos depois nesta seção.

Método da Tridiagonalização de Householder Dada uma matriz n  n real simétrica A = [ajk], reduzimo-la por meio de n – 2 sucessivas transformações de similaridade (veja a Seção 20.6) envolvendo as matrizes P1, , Pn–2 à forma tridiagonal. Essas matrizes são ortogonais e simétricas. Portanto, P1–1 = P1 = P1 e algo similar ocorre com as outras. Essas transformações produzem, a partir de uma dada A0 = A = [ajk], as matrizes A1 = [ajk(1)], A2 = [ajk(2)], , An-2 = [ajk(n–2)] na forma •





T







A1  P1 A 0 P1 A2  P2 A1P2

(1) •



B  An



2





















Pn 2 An 3 Pn 2. 





As transformações (1) criam os zeros necessários, no primeiro passo na Linha 1 e Coluna 1, no segundo passo na Linha 2 e Coluna 2 etc., como ilustra a Fig. 447 para a matriz 5  5. B é tridiagonal. Como podemos determinar P1, P2, , Pn–2? Agora, todos esses Pr são da forma •

(2)





Pr  I  2 vrvr

T

(r  1,







, n  2)

81

Capítulo 20: Métodos Numéricos de Álgebra Linear

onde I é a matriz-identidade n  n e vr = [vjr] é um vetor unitário com as suas r primeiras componentes iguais a 0; portanto,

(3)

v1 

  0

0



0

 •















 0



v2 

,

0

,







vn

,

2



• • •

 

onde os asteriscos denotam as outras componentes (que serão diferentes de zero em geral). Passo 1. v1 tem as componentes v11

(4)

(a)

v21

(b)

vj1

0



1 2



a21

1

S1

aj1 sgn a 21

j

2v21S1



3, 4,







,n

onde (c)

a212

S1

a 312





a n12



onde S1 > 0, e sgn a21 = +1 se a21  0 e sgn a21 = –1 se a21 < 0. Com isso, calculamos P1 por (2) e então A1 por (1). Esse foi o primeiro passo. * *

* *

* *

* * *

* * * * * * * * * * *

* * * * * * * * *

PrimeiraE tapa

SegundaE tapa

TerceiraE tapa

* * * * * * *

A

1

* * *

= P1 AP1

A

2

P A P

=

Fig. 447. Método de Householder para uma matriz 5

2



1

A

2

3

= P3 A2P3

5. Os espaços em branco são zeros criados pelo método

Passo 2. Calculamos v2 por (4) com todos os subscritos aumentados de 1 unidade e os ajk substituídos por a jk(1), que são os elementos de A1 recém-calculados. Assim [veja também (3)], v12

(4*)

v22

0 1

v32

2



(1)

(1)

S2



(1)

a j2 sgn a 32

vj2

j

v S 2 32 2

onde S2

a 32

1

2

(1) a32

2

a (1) 42



4, 5,







,n

2







(1) an 2 .

Com isso, calculamos P2 por (2) e então A2 por (1). Passo 3 . Calculamos v3 por (4*) com todos os subscritos aumentados de 1 unidade e os a jk(1) substituídos pelos elementos a jk(2) de A2, e assim por diante.

82

Parte E • Análise Numérica

EXEMPLO 1

Tridiagonalização de Householder Tridiagonalize a matriz real simétrica

A  A0 

Solução. Passo cálculo direto,



6

4

1

1

4

6

1

1

1

1

5

2

1

1

2

5



.

1. De (4c), calculamos S12 = 42 + 1 2 + 12 = 18. Como a21 = 4 > 0, temos que sgn a 21 = +1 em (4b) e obtemos de (4), por

0

v1 

Disso e de (2),

P1 



0

v31

0,985 598 56 . 0,119 573 16

v41

0.119 573 16

v21

  

0



0,942 809 04



0,235 702 27



0,235 702 27



1



0



0



0



0



0,235 702 27



0

0,971 404 52



0,235 702 27 0,028 595 48

0,028 595 48

0,971 404 52



.

Da primeira linha de (1), agora temos



A1  P1A0P1 

18 

6

0



7

18 





0

1





1

0



1

9/2

3/2

0



1

3/2

9/2

.

Passo 2.De (4*) calculamos S22 = 2 e

  0

0

0

v2 

0



v32

0,923 879 53

v42

0,382 683 43

.

Disso e de (2),

P2 



1

0

0

0

0

1

0

0

0

0



1/2



1/2

0

0



12



1/2



.

A segunda linha em (1) agora fornece 6 

B



A

2 

PAP 2

1

2 



18 

0

0

18 

7

2

0

0

2 0

6

0 .

0

3

0





Essa matriz B é tridiagonal. Como nossa matriz dada tem ordem n = 4, precisamos de n – 2 = 2 passos para realizar essa redução, conforme dissemos. (Você vê que temos mais zeros do que podemos em geral esperar?) B é similar a A, como agora demonstramos em geral. Tal fato é essencial, visto que, assim, B possui o mesmo espectro de A, pelo Teorema 2 da Seção 20.6. 

B Similar a A. Afirmamos que B em (1) é similar a A = A0. A matriz Pr é simétrica; com efeito,

Capítulo 20: Métodos Numéricos de Álgebra Linear T

Pr



T T

( I  2 vrvr )

I



T

T T

2( vrvr )





T

I  2 vrvr



83

Pr.

Além disso, Pr é ortogonal, pois vr é um vetor unitário, de modo que vr v r = 1 e, portanto, T

T

Pr Pr



Pr2  ( I  2 vrvr )2  I  4 vrvr T

T



T

I  4 vrvr

T

T



4 vrvr vrvr



4 vr(vr vr)vr

T

T



I.

Logo, P = Pr = Pr e, de (1), agora obtemos –1 r

T

B  Pn 2 An 3 Pn 













Pn 2 Pn 

3

1

1

P

P



n 2



onde P = P1P2









2













P1AP1







Pn 3 Pn



n 3







P AP 1

1



2



1





P



P

n 3



n 2

1

P AP

Pn–2. Isso prova nossa afirmação.



Método da Fatoração QR Em 1958, o suíço H. Rutishauser propôs a idéia de se utilizar a fatoração LU (Seção 20.2; ele a chama de fatoração LR) na solução de problemas de autovalores. Uma versão aperfeiçoada do método de Rutishauser (que evita acidentes se certas submatrizes tornam-se singulares etc.; veja a Ref. [E29]) é o método QR, independentemente proposto pelo americano J. G. F. Francis ( Computer J. 4 (1961–62), 265–271, 332–345) e pelo russo V. N. Kublanovskaya (Zhurnal Vych. Mat. i Mat. Fiz. 1 (1961), 555–570). O método QR utiliza a fatoração QR com Q ortogonal e R triangular superior. Discutimos o método QR para uma matriz real simétrica. (Para extensões a matrizes gerais, veja a Ref. [E29] no Apêndice 1.) Neste método, primeiramente transformamos uma dada matriz A real simétrica n  n em uma matriz tridiagonal B0 = B pelo método de Householder. Isso cria muitos zeros e, portanto, reduz a quantidade de trabalho adicional. Então, calculamos B1, B2, passo a passo de acordo com o seguinte método iterativo. •





Passo 1. Fatoramos B0 = Q0R0 com Q0 ortogonal e R0 triangular superior. Então, calculamos B1 = R0Q0. Passo 2. Fatoramos B1 = Q1R1. Então, calculamos B2 = R1Q1. Passo Geral s + 1.

(a)

(5)

Fatorar Bs  QsRs.

(b)

Computar Bs

1



RsQs.

Aqui, Qs é ortogonal e Rs é triangular superior. A fatoração (5a) será explicada a seguir.

Bs+1 Similar a B. Convergência para uma Matriz Diagonal. De (5a), temos que Rs = Qs–1Bs. Substituindo em (5b), obtemos Bs

(6)

1



RsQs  Qs 1BsQs. 

Portanto, Bs+1 é similar a Bs. Logo, Bs+1 é similar a B0 = B para todo s. Pelo Teorema 2 da Seção 20.6, isso implica que Bs+1 tem os mesmos autovalores de B. Além disso, Bs+1 é simétrica, o que decorre por indução. Com efeito, B0 = B é simétrica. Supondo que Bs seja simétrica, ou seja, que Bs = Bs, e usando Qs–1 = Qs , (visto que Qs é ortogonal), temos a simetria utilizando (6), T

T

Bs

T

1



( Qs BsQs) T

T



Qs Bs Qs  Qs BsQs  Bs 1. T

T

T



Se os autovalores de B são diferentes em valor absoluto, ou seja, l1  l2 









ln, então,

lim Bs  D s





onde D é diagonal, com os elementos da diagonal principal no Apêndice 1.)

λ1, λ2,







,

λn.

(Veja a prova na Ref. [E29] listada

84

Parte E • Análise Numérica

Como Obter a Fatoração QR, ou seja, B = B0 = [bjk] = Q0R0. A matriz tridiagonal B tem geralmente n – 1 elementos diferentes de zero abaixo da diagonal principal. Eles são b21, b32, , bn,n–1. A partir da esquerda, multiplicamos B por uma matriz C2 tal que C2B = [b jk(2)] tenha b 21(2) = 0. Multiplicamos isso por uma matriz C3 tal que C3C2B = [b jk(3)] tenha b 32(3) = 0 etc. Após n – 1 multiplicações dessas, chegamos a uma matriz triangular superior R0, a saber, •

CnCn

(7)

1







C3C2B0  R0.



Essas matrizes n  n Cj são muito simples. Cj tem a submatriz 2







2



cos uj

sen uj

sen uj

cos uj



(uj apropriado)

em Linhas j – 1 e j e Colunas j – 1 e j; nos demais lugares da diagonal principal, a matriz Cj tem elementos 1; e todos os outros elementos são 0. (Essa submatriz é a matriz de uma rotação de uma rotação plana por um ângulo θj; veja o Projeto de Equipe 28 da Seção 7.2.) Por exemplo, se n = 4, escrevendo cj = cos θj e s j = sen θj, temos

C2 



c2

s2

0

0

s2

c2

0

0

0

0

1

0

0

0

0

1

  , C3 

1

0

0

0

0

c3

s3

0

0

s3

c3

0

0

0

0

1

  , C4 



1

0

0

0

1

0

0

0

0

0

c4

s4

0

0

s4

c4

.

Essas Cj são ortogonais. Logo, seu produto em (7) é ortogonal e o mesmo ocorre com a inversa desse produto. Chamemos essa inversa de Q0. Então, de (7),

B0  Q0R0

(8) onde, com Cj–1 = Cj , T

Q0  ( CnCn

(9)

1





C3C2)



1

C2 C3 T



T •





Cn

T

1

Cn . T

Essa é a nossa fatoração QR de B0. Disso, temos por (5) com s = 0 T

T

T

T

(10) B1  R0Q0  R0C2 C3 Cn 1 Cn . Não precisamos explicitamente de Q0, mas, para obter B1 de (10), primeiramente calculamos R0C2 , então (R0C2 ) C3 etc. Algo similar ocorre nos demais passos, que produzem B2, B3, . •







T

T

T







Determinação de cos θ j e sen θj. Finalmente, mostremos como encontrar os ângulos de rotação. Em C2, cos θ2 e sen θ2 devem ser tais que b 21(2) = 0 no produto

C2B 



c2

s2

0

s2

c2

0







































b11

b12

b13







b21

b22

b23































Agora, b 21(2) é obtida multiplicando-se a segunda linha de C2 pela primeira coluna de B, b 21(2)

 s2 b11 

c2b21

(sen u2) b11  (cos u2) b21  0.

 

Logo, tan θ2 = s2/c2 = b21/b11, e cos

1 tan 2

2

1

(11) sen

tan 2

1

Algo similar ocorre para θ3, θ4,







2

1

b21/b11

2

tan 2

1 (b21/b11)2

2

1

(b21/b11)2

O próximo exemplo ilustra tudo isso.

.



.

Capítulo 20: Métodos Numéricos de Álgebra Linear

EXEMPLO 2

85

Método da Fatoração QR Calcule todos os autovalores da matriz

A





6

4

1

1

4

6

1

1

1

1

5

2

1

1

2

5

.

Solução. Primeiramente, reduzimos A à forma tridiagonal. Aplicando o método de Householder, obtemos (veja o Exemplo 1) 18 

6

0

0

7

2

0

0

2

6

0 .

0

0

0

3



18 



A2 





Do determinante característico vemos que A2, e conseqüentemente A, tem o autovalor 3. (Você pode ver isso diretamente de A2?) Logo, isso é suficiente para a aplicação do método QR à matriz tridiagonal 3  3

B0  B 



18 

6



7

18 



2

0

0



2 . 6

Passo 1.Multiplicamos B à esquerda por

C2 



cos u2 sen u2





sen u2

0

cos u2

0

0

1

0

C2B por

e então,



0

1

C3  0 0

0





sen u3 .

cos u3 sen u3

cos u3

Aqui, (–sen θ2)  6 + (cos θ2)(–18 ) = 0 fornece (11) cosθ2 = 0,816 496 58 e sen θ2 = –0,577 350 27. Com esses valores, calculamos 7,348 469 23 C2 B  0



7,505 553 50



0

0,816 496 58



3,265 986 32

1,154 700 54 .

1,414 213 56

6,000 000 00



Em C3, temos de (–sen θ3)  3,265 986 32 + (cos θ3)  1,414 213 56 = 0 os valores cos θ3 = 0,917 662 94 e sen θ3 = 0,397 359 71. Isso fornece



7,505 553 50



3,559 026 08

3,443 784 13 .

0



0

5,047 146 15

7,348 469 23



0,816 496 58





R0  C3 C2 B  0 Disso, calculamos

B1  R0 C2T C3T 



2,054 804 67

0

2,054 804 67

4,035 087 72

2,005 532 51

0

2,005 532 51

4,631 578 95

10,333 333 33



 



que é simétrica e tridiagonal. Os elementos fora da diagonal em B1 são ainda grandes em valor absoluto. Logo, temos ainda que continuar. Passo 2. Fazemos os mesmos cálculos que no primeiro passo, com B0 = B substituído por B1 e C2 e C3 adequadamente modificados, com os novos ângulos sendo θ2 = –0,196 291 533 e θ3 = 0,513 415 589. Obtemos então,

10,535 653 75

R1 

e, disso,

B2 





2,802 322 41



 

3,988 240 28

0

3,068 326 68



0



10,879 879 88

0,391 145 88



4,083 295 84

0

0,796 379 18



0,796 379 18

5,447 386 64

0 1,507 025 00 .



0

1,507 025 00

2,672 733 48



86

Parte E • Análise Numérica

Vemos que os elementos de fora da diagonal são menores em valor absoluto que os Bde1, porém são ainda muito grandes para permitir que os elementos da diagonal sejam boas aproximações dos autovalores de B.

Passos Adicionais. Listamos os elementos da diagonal principal e o elemento de fora da diagonal com o maior valor absoluto, que é ( j) ( j) b 12   b 21  em todos os passos. Você pode mostrar que a matrizA dada possui o espectro 11, 6, 3, 2.

Passo j 3 5 7 9

( j)

( j)

b 11

10,966 892 9 10,997 087 2 10,999 742 1 10,999 977 2

( j)

b 22

max j k b jk(J) 0,585 235 82 0,120 653 34 0,035 911 07 0,010 684 77

b 33

5,945 898 56 6,001 815 41 6,000 244 39 6,000 022 67



2,087 208 51 2,001 097 38 2,000 013 55 2,000 000 17



Vendo nossa discussão em retrospecto, reconhecemos que o propósito da aplicação da tridiagonalização de Householder antes do método da fatoração QR é a redução substancial do custo em cada fatoração QR, em particular se A for grande. A aceleração da convergência e, portanto, a redução adicional do custo pode ser obtida por um deslocamento espectral, isto é, tomando-se Bs – ksI ao invés de Bs com um ks adequado. Possíveis escolhas para ks são discutidas na Ref. [E29].

PROBLEMAS PROPOSTOS 20.9 1–4

TRIDIAGONALIZAÇÃO DE HOUSEHOLDER

Tridiagonalize, mostrando os detalhes: 3,5 1,0 1,5 0 1



1. 1,0

 

5,0

1,5

2. 1

3,0

3,0

3,5

0,98 3. 0,04

0,04 0,56

0,44 0,40

0,44

0,40

0,80



4.

5–9



1

0 1

1



1

5. Matriz na resposta do Problema 1 6. Matriz na resposta do Problema 3 18 2 0 7.

0





8.



 



2

8

2

0

2

2 0,1

0

4,3

0,2

0,2

4,1

16,2



0,1





0

7,0

0,1

 

0

8

8

2

2

9. 0,1

4,0

0,1

8

8

2

2

0

0,1

1,0

2

2

6

4

2

2

4

6

FATORAÇÃO QR

Execute três passos da fatoração QR para encontrar aproximações dos autovalores da:

QUESTÕES E PROBLEMAS DE REVISÃO DO 1. Quais são as principais áreas problemáticas na álgebra linear numérica? 2. O que é pivotação? Quando e como podemos aplicá-la? 3. O que acontece se aplicarmos a eliminação de Gauss a sistemas que não possuem solução? 4. O que é o método de Doolittle? E qual a sua relação com a eliminação de Gauss? 5. O que é o método de Cholesky? Quando podemos aplicá-lo?

10. EXPERIMENTO DEÁLGEBRA COMPUTACIONAL. Método QR. Tente encontrar experimentalmente de quais propriedades da matriz a velocidade de decrescimento dos elementos de fora da diagonal depende. Para esse propósito, escreva um programa que primeiramente tridiagonalize e então execute os passos QR. Aplique o programa às matrizes dos problemas 1, 3, e 4. Sintetize seus resultados em um pequeno texto.

CAPÍTULO 20 6. O que você sabe sobre a convergência do método de Gauss– Seidel? 7. O que é mau condicionamento? O que é o número condicional e o seu significado? 8. O que é a aproximação por mínimos quadrados? O que são as equações normais? 9. O que é um autovalor de uma matriz? Por que os problemas de autovalores são importantes? Dê alguns exemplos típicos.

87

Capítulo 20: Métodos Numéricos de Álgebra Linear

10. Por que as transformações de similaridade de matrizes são impor- 25–26 MÉTODO DE GAUSS–SEIDEL tantes no desenvolvimento dos métodos numéricos? Dê exem- Execute 3 passos sem escalonamento, começando de[1 1 1] : plos. x1 x3 25. 15 x 2 11 11. O que é o método de potências para os autovalores? Quais são as suas vantagens e desvantagens? 10 x 1 3x2 17 12. Enuncie de memória o teorema de Gerschgorin. Você se lembra x2 2x1 5x3 5 de sua demonstração? 13. Enuncie a desigualdade de Schur e indique algumas de suas aplix2 26. 4 x 1 5, 5 cações. x3 4x2 0, 4 14. O que é tridiagonalização? Quando podemos aplicá-la? 15. Qual é a idéia do método QR? Quando podemos aplicar esse métox1 4x3 11,2 do? T

16–19 ELIMINAÇÃO DE GAUSS

27–32 NORMAS VETORIAIS

Resolva: 16.

Calcule as normas 1-, 2-, e  - dos vetores 27. [0 4 –8 3] 28. [3 8 –11] 29. [–4 1 0 2] 30. [0 0 1 0] 31.[–5 –2 7 0 0] 32. [0,3 1,4 0,2 –0,6] ∞

T

4x2

3x 3

11,8

5x1

3x2

x3

34,2

6x1

7x2

2x 3

3, 1

17. x 1

x2

x3

5

x1

2x 2

2x3

6

33–35 NORMA MATRICIAL

x1

2x 2

3x3

8

Calcule a norma matricial correspondente à norma vetorial a matriz dos coeficientes: 33. Do Problema 17 34. Do Problema 18 35. Do Problema 19

T

T

T

T

18. 5 x 1

2x1

x2

3x3

17

5x2

15 x 3

10

3x2

9x3

0

19. 2 x 1

3x1

T

3x3

15

4x2

x3

13

x2

5x3

26

20. Resolva o Problema 17 pelo método de Doolittle. 21. Resolva o Problema 17 pelo método de Cholesky.

22–24 MATRIZ INVERSA Calcule a inversa de: 1,0 2,0 0,5 22. 0,5 1,0 0,5

 

1,5

2,0

1,0

1,5

2,0

1,0

23. 2.0

3,5

1,5

1,0

1,5

9,0

5

1

1

24. 1

6

0

1

0

8





 



- para



36–38 NÚMERO CONDICIONAL Calcule o número condicional (correspondente à norma vetorial



-)



para a matriz dos coeficientes: 36. Do Problema 22 37. Do Problema 23 38. Do Problema 24

39–40 AJUSTE POR MÍNIMOS QUADRADOS Ajuste: 39. Uma linha reta para (–2, 0,1), (0, 1,9), (2, 3,8), (4, 6,1), (6, 7,8). 40. Uma parábola quadrática para (1, 9), (2, 5), (3, 4), (4, 5), (5, 7).

41–43 AUTOVALORES Encontre três discos circulares que devem conter todos os autovalores da matriz: 41. Do Problema 22 42. Do Problema 23 43. Do Problema 24 44. ( Método de potências) Execute 4 passos do método de potências para a matriz do Problema24, começando de[1 1 1] e calculando os coeficientes de Rayleigh e os limites dos erros. 45. (Householder e QR) Tridiagonalize a matriz do Problema 23. Então, aplique 3 passos QR. (Espectro (6S): 9,65971, 4,07684, 0,263451) T

88

Parte E • Análise Numérica

20

RESUMO DO CAPÍTULO

Métodos Numéricos de Álgebra Linear As principais atividades nesta área são a solução numérica de sistemas lineares (Seções 20.1–20.4), o ajuste de curvas (Seção 20.5) e os problemas de autovalores (Seções 20.6-20.9). Os sistemas lineares Ax = b com A = [ ajk], escritos como E1: a11x1   a1nxn  b1 E2:

(1)





a21x1













En:







an1x1





























a2nxn



















b2





annxn













bn

podem ser resolvidos por um método direto (no qual o número de operações numéricas pode ser especificado previamente, como, por exemplo, na eliminação de Gauss) ou por um método indireto ou iterativo (no qual uma aproximação inicial é aperfeiçoada passo a passo). A eliminação de Gauss (Seção 20.1) é direta, a saber, é um processo de eliminação sistemático que reduz (1) passo a passo à forma triangular. No Passo 1, eliminamos x1 das equações E 2 até En pela subtração de (a21/a11)E1 de E2, então (a31/a11)E1 de E 3 etc. A equação E1 é chamada de equação-pivô nesse passo e a11 é o pivô. No Passo 2, tomamos a nova segunda equação como equação-pivô e eliminamos x2 etc. Se a forma triangular for conseguida, temos xn a partir da última equação, e então xn–1 da penúltima etc. Apivotação parcial (= troca das posições das equações) é necessária caso os candidatos a pivô sejam nulos e aconselhável caso eles sejam pequenos em valor absoluto. Os métodos de Doolittle, Crout e Cholesky da Seção 20.2 são variantes da eliminação de Gauss. Eles fatoram A = LU (L é triangular inferior, U é triangular superior) e resolvem Ax = LUx = b por intermédio da resolução de Ly = b para y e então de Ux = y para x. Na iteração de Gauss-Seidel (Seção 20.3), fazemos a11 = a22 = = a nn = 1 (por divisão) e escrevemos Ax = (I + L + U)x = b; portanto, x = b –( L + U)x, o que sugere a fórmula de iteração •

x(m

(2)

1)



b  Lx(m

1)







Ux(m)

na qual sempre tomamos as aproximações xj’s mais recentes à direita. Se C < 1, onde C = –(I + L)–1U, então esse processo converge. Aqui, C denota uma norma matricial qualquer (Seção 20.3). Se o número condicional k(A) = A A–1 de A é grande, então o sistema Ax = b é mal condicionado (Seção 20.4), e um pequeno resíduo r = b – Ax não implica que x esteja próximo da solução exata. O ajuste do polinômio p(x) = b0 + b1x + + bmxm através dos pontos dados (pontos no plano xy) (x1, y1), , (xn, yn) pelo método dos mínimos quadrados é discutido na Seção 20.5 (e, em estatística, na Seção 25.9). Os autovalores λ (valores λ para os quais Ax = λx tem uma solução x  0, chamados de autovetores) podem ser caracterizados por desigualdades (Seção 20.7), como no teorema de Gerschgorin, que fornece n discos circulares contendo a totalidade do espectro (todos os autovalores) de A, de centros ajj e raios ∑ajk (com a soma em k de 1 a n, k  j). É possível obter valores aproximados para os autovalores por meio de iteração, começando de um x0  0 e computandose x1 = Ax0, x2 = Ax1, , xn = Axn–1. Nesse método de potências (Seção 20.8), o quociente de Rayleigh (Ax) x (3) q (x  xn) xx fornece uma aproximação de um autovalor (normalmente o de maior valor absoluto) e, se A for simétrica, o limite do erro é 





















 T

T

(4)

(Ax)TAx xTx

q2 .

A convergência pode ser lenta, mas pode ser acelerada por um deslocamento espectral. Para determinar todos os autovalores de uma matriz simétrica , é melhor primeiramente tridiagonalizar A e então aplicar o método QR (Seção 20.9), que se baseia na fatoração AA= QR com Q ortogonal e R triangular superior, e usando as transformações de similaridade.

21

CAPÍTULO

Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs) Os métodos numéricos para resolver equações diferenciais são de grande importância prática em engenharia e física, onde os problemas práticos freqüentemente levam a equações diferenciais que não podem ser resolvidas pelos métodos vistos nos Capítulos. de 1 a 6, nem pelos vistos no Capítulo 12, nem por métodos similares. Além disso, às vezes ocorre que uma EDO chega, de fato, a ter uma fórmula de solução (como as EDOs das Seções 1.3–1.5); a qual, entretanto, em alguns casos específicos, pode se tornar tão complicada que é preferível aplicar um método numérico para se resolver a equação. Este capítulo explica e fornece aplicações dos métodos básicos para se obterem soluções numéricas de EDOs (Seções 21.1–21.3) e EDPs (Seções 21.4–21.7). As Seções 21.1 e 21.2 podem ser estudadas imediatamente após o Capítulo1, e a Seção 21.3 imediatamente após o Capítulo2, visto que estas seções independem dos Capítulos 19 e 20. As Seções 21.4–21.7 , sobre EDPs, podem ser estudadas imediatamente após o Capítulo 12 se os estudantes já tiverem algum conhecimento de sistemas lineares de equações algébricas. Pré-requisito: Seções 1.1–1.5 para EDOs, Seções 12.1–12.3, 12.5, 12.10 para EDPs. Referências e Respostas dos Problemas: Parte E do Apêndice 1 (veja também as Partes A

e C) e Apên-

dice 2.

21.1 Métodos para EDOs de Primeira Ordem

Do Capítulo 1, sabemos que uma EDO de primeira ordem tem a forma F(x, y, y) = 0 e freqüentemente pode ser escrita na forma explícita y = f (x, y). Um problema de valor inicial para essa equação tem a forma (1)

y



ƒ( x, y),

y(x0)



y0

onde x0 e y0 são dados e supomos que o problema tenha uma solução única em algum intervalo aberto a < x < b contendo x0. Nesta seção, discutiremos métodos para calcular valores numéricos aproximados da solução y(x) de (1) em pontos eqüidistantes sobre o eixo x x1



x0



h,

x2



x0



2 h,

x3



x0



3 h,







onde o tamanho do passo h é um número fixo, por exemplo, 0,2 ou 0,1 ou 0,001, cuja escolha discutiremos mais tarde nesta seção. Esses são os métodos passo a passo , que usam uma mesma fórmula em cada um dos passos. Essas fórmulas são sugeridas pela série de Taylor h2 y(x  h)  y(x)  hy(x)   (2) 2 y (x)  . Para um h pequeno, as potências mais elevadas h2, h3, dão resultados muito pequenos. Isto sugere a aproximação grosseira y(x  h)  y(x)  h y(x) •





y(x)











hƒ(x, y)

(com a segunda linha obtida da EDO dada) e o seguinte processo de iteração. No primeiro passo, calculamos

90

Parte E • Análise Numérica

y1 = y0 + hf(x0, y0)

que é uma aproximação de y(x1) = y(x0 + h). No segundo passo, computamos y2 = y1 + hf(x1, y1)

que é uma aproximação de y(x2) = y(x0 + 2 h) etc. e, em geral, (3)

yn1



yn



hƒ(xn, yn)

(n  0, 1,





).



Este é o chamado método de Euler ou de Euler–Cauchy. Geometricamente, ele é uma aproximação da curva y(x) por um polígono cujo primeiro lado é tangente a esta curva em x0 (veja a Fig. 448). y

Inclinação f(x1, y1) Inclinação f(x0, y0)

y2

y1

y0 h

h

x0

x1

x2

x

Fig. 448. Método de Euler

Este método grosseiro é raramente usado na prática mas, devido à sua simplicidade, ele explica bem o princípio dos métodos baseados na série de Taylor. A fórmula de Taylor com um resto se escreve como y(x



h)

y(x)





hy(x)



_h y (j)

1 2 2

(onde x  j  x  h). Ela mostra que, no método de Euler, o erro de truncamento em cada passo, ou erro de truncamento local, é proporcional a h2 e se escreve como O(h2), onde O sugere ordem (veja também a Seção 20.1). Ora, em um intervalo fixo em x onde desejamos resolver uma EDO, o número de passos é proporcional a 1/h. Logo, o erro total ou erro global é proporcional a h2(1/h) = h1. Por este motivo, o método de Euler é chamado de método de primeira ordem. Além disso, há erros de a rredondamento neste e em outros métodos, que podem afetar a precisão dos valores y1, y2, progressivamente à medida que n cresce, conforme veremos. •





Tabela 21.1 Método de Euler Aplicado a (4) no Exemplo 1 e o Erro

EXEMPLO 1

n

xn

yn

0,2(xn  yn)

Valores exatos

Erro en

0 1 2 3 4 5

0,0 0,2 0,4 0,6 0,8 1,0

0,000 0,000 0,040 0,128 0,274 0,489

0,000 0,040 0,088 0,146 0,215

0,000 0,021 0,092 0,222 0,426 0,718

0,000 0,021 0,052 0,094 0,152 0,229

Método de Euler Aplique o método de Euler ao seguinte problema de valor inicial, escolhendo h = 0,2 e calculando y1,  y











, y5



x y, y(0) 0. (4) Solução. Aqui f(x, y) = x + y; logo f ( xn, yn) = xn + yn, e vemos que (3) se torna yn1



yn



0,2( xn  yn).

A Tabela 21.1 mostra os cálculos e os valores da solução exata para y(x) = ex – x

–1

obtida a partir de (4) na Seção 1.5, e os erros respectivos. Na prática, a solução exata é desconhecida, mas pode-se ter uma idéia da precisão dos valores aplicando-se mais uma vez o método de Euler, com a iteraçãoh 2= 0,4, fazendo yn* representar a aproximação agora obtida e comparando-se as aproximações correspondentes. Este cálculo é:

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

xn

yn*

0,4(xn  yn)

0,0 0,4 0,8

0,000 0,000 0,160

0,000 0,160

yn na

Tabela 21.1

91

Diferença yn  yn*

0,000 0,040 0,274

0,000 0,040 0,114

Chamemos de en e en* os erros dos cálculos com h e 2h, respectivamente. Uma vez que o erro é de ordem h2, quando trocamos h por 2h, esse erro fica multiplicado por 22 = 4, mas, visto que necessitamos somente de metade dos passos de antes, ele será multiplicado somente por 4/2 = 2. Logo, en*  2 en de modo que a diferença é en*  en  2 en  en  en. Ora, y  yn  en  yn*  en* pela definição de erro; por conseguinte, en*  en  yn  yn* indica en qualitativamente. Em nossos cálculos, y2 – y2* = 0,04 – 0 = 0,04 (o erro real é 0,052, veja  a Tabela 21.1) e y4 – y4* = 0,274 – 0,160 = 0,114 (na verdade, 0,152).

EXEMPLO 2

Método de Euler para uma EDO Não-linear A Fig. 449 diz respeito ao problema de valor inicial (5)

y

( y  0,01x 2)2 sen (x 2)  0,02 x,



y(0)



0,4

e mostra a curva da solução y = 1/[2,5 – S(x)] + 0,01x2, onde S(x) é a integral de Fresnel (38) no Apêndice 3.1. Ela também mostra 80 valores aproximados para 0  x  4 obtidos pelo método de Euler a partir de (3), yn1



yn



0,05 [( yn  0,01xn2) 2 sen (xn2 )  0,02 xn] .

Embora h = 0,05 seja menor do que h no Exemplo 1, a precisão ainda não é boa. É interessante notar que o erro não aumenta monotonamente, o que é óbvio, visto que a solução não é monótona. Retornaremos a esta EDO em Problemas Propostos.  y

0,70

0,60

0,50

0,40 0

1

2

3

x

4

Fig. 449. Curva de solução e aproximação de Euler do Exemplo 2

Seleção Automática do Tamanho do Passo Variável Usando-se Modernos Programas Computacionais A idéia de integração adaptativa, que foi justificada e explicada na Seção 19.5, se aplica igualmente bem à solução de EDOs por métodos numéricos. Ela é agora utilizada para alterar automaticamente o tamanho h do passo, dependendo da variabilidade de y = f determinado por (6*)

y



ƒ   ƒ x  ƒ yy  ƒ x  ƒ yƒ.

Dessa forma, um programa computacional moderno seleciona automaticamente os tamanhos hn dos passos de tal modo que o erro da solução não exceda um tamanho máximo dado TOL (termo que sugere tolerância). Ora, para o método de Euler, quando o tamanho do passo é h = h n, o erro local em xn vale cerca de 12 hn2  y (xn). Nossa exigência é de que ele seja igual a uma dada tolerância TOL, (6)

(a)

1 2 2 n

h

 y (xn)TOL, 

portanto

(b)

hn



2y TOL (xn) .

 

y(x) não pode ser nula no intervalo J: x0  x = xN no qual se deseja obter uma solução. Chamemos de K o mínimo valor de y(x) em J e suponhamos que K > 0. Por (6), o mínimo valor de y(x) corresponde ao máximo valor de h  H  2 TOL/ . Podemos inserir isto em (6b), obtendo diretamente K de (6). Portanto, 2 TOL  HK por álgebra,





   ( ) . K

(7)

hn



w(xn) H

onde

w(xn)



y  xn

92

Parte E • Análise Numérica

Para outros métodos, a seleção automática do tamanho dos passos baseia-se no mesmo princípio.

Método de Euler Aperfeiçoado Se, em (2), incluirmos mais termos, obteremos métodos numéricos de ordem mais alta e de maior precisão. Porém, existe um problema prático. Se substituirmos y  = f(x, y(x)) em (2), teremos (2*)

y(x



h)



y(x)





1 2



h2ƒ



1 6

h3ƒ 









.

Ora, y em f depende de x, de modo que temos f  conforme mostrada em (6*) e as derivadas f , f  ficam muito mais difíceis de serem manipuladas. A estratégia geral agora é evitar o cálculo dessas derivadas e substituí-lo pelo cálculo de f para um ou vários valores auxiliares de (x, y) escolhidos adequadamente. “Adequadamente” significa que esses valores são escolhidos de modo a fazer com que a ordem do método seja a mais alta possível (para se obter uma alta precisão). Discutamos dois desses métodos de importância prática, a saber, o método de Euler aperfeiçoado e o (clássico) método de Runge–Kutta. No método de Euler aperfeiçoado ou método de Euler–Cauchy aperfeiçoado (também às vezes chamado de método de Heun), em cada passo calculamos primeiro o valor auxiliar (8a)

y* n1



yn



hƒ(xn, yn)

e então o novo valor (8b)

yn1



yn



1 2

h [ƒ(xn, yn)



ƒ( xn 1, y*n 1)]. 



Este método possui uma interpretação geométrica simples. De fato, podemos dizer que, no intervalo de xn a xn + 12 h, obtemos uma aproximação da solução y por meio de uma reta passando pelo ponto (xn, yn) com a inclinação f(xn, y n), e então continuamos ao longo da reta de inclinação ƒ(xn 1, y* n 1) até x atingir xn+1. O método de Euler–Cauchy aperfeiçoado é um método preditivo-corretivo, porque, em cada passo, primeiro predizemos um valor usando (8a) e então o corrigimos usando (8b). Em forma algorítmica, usando as notações k1  hƒ(xn, yn) em (8a) e k2  hƒ(xn 1, y*n 1) em (8b), podemos escrever este método como mostra a Tabela 21.2. 







Tabela 21.2 Método de Euler Aperfeiçoado (Método de Heun)

ALGORITMO DE EULER (f, x0, y0, h, N) Este algoritmo calcula a solução do problema valor inicial y  ƒ(x, y), y(x0)  y0 em pontos eqüidistantes , xN  x0  Nh; aqui, f é tal que este problema tem uma solução única no x1  x0  h, x2  x0  2 h, intervalo [x0, xN] (veja a Seção 1.7). ENTRADA: Valores iniciais x0, y0, tamanho do passo h, número de iterações N SAÍDA: Aproximação yn+1 da solução y(xn 1) de xn 1  x0  ( n  1) h onde n = 0, , N– 1 •









Para n

0, 1, xn

1







,N

xn







1 faça:

h

hƒ(xn, y n)

k1

hƒ(xn

, y n k1) _1 (k k2) 2 1 SAÍDA xn 1, y n 1 k2

yn

1

1

yn

Fim Pare

Fim EULER EXEMPLO 3

Método de Euler Aperfeiçoado Aplique o método aperfeiçoado de Euler ao problema de valor inicial (4), escolhendo h = 0,2 como antes.

Solução. Para o problema atual, temos na Tabela 21.2,

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

k1 k2 yn1



yn



0,2 2



93

0,2(xn  yn)

0,2(xn  0,2  yn  0,2( xn  yn))



(2,2 xn  2,2 yn  0,2)  yn  0,22( xn  yn)  0,02.

A Tabela 21.3 mostra que os resultados agora obtidos são mais precisos que os do Exemplo 1; veja também a Tabela 21.6.



Tabela 21.3 Método de Euler Aperfeiçoado Aplicado a (4) e o Erro n

xn

yn

0 1 2

0,0 0,2 0,4

0,0000 0,0200 0,0884

3 4 5

0,6 0,8 1,0

0,2158 0,4153 0,7027

Erro

0,22(xn  yn)  0,02 0,0200 0,0684 0,1274

Valores exatos (4D) 0,0000 0,0214 0,0918

0,0000 0,0014 0,0034

0,1995 0,2874

0,2221 0,4255 0,7183

0,0063 0,0102 0,0156

Erro do Método de Euler Aperfeiçoado. O erro local é de ordem h3 e o erro global é de ordem h2, de modo que temos um método de segunda ordem.

PROVA

Fazendo ƒn  ƒ( xn, y(xn)) e usando (2*), temos 

(9a)

y(xn



h)



y(xn)





hƒn



1 2





h2ƒn  16 h3ƒn 







.

Uma aproximação para a expressão entre parênteses em (8b) é ƒ n  ƒ n 1 e usando novamente a expansão de Taylor, obtemos de (8b) 





yn1



yn

(9b)

 12 h [ƒn  ƒn 1] 





 

1 2

h [ƒ n 



hƒn



 1 2

( ƒn  hƒn 







1 2

)]



h2ƒn 









1 3 n  4

h ƒn  h ƒ 2







(onde  = d/dxn etc.). Subtraindo (9b) de (9a), obtemos o erro local h3

h3

 ƒn   ƒn 

6



4

h3









 

12



ƒn 







.

Uma vez que o número de iterações sobre um intervalo fixo de x é proporcional a 1/h, o erro global é de ordem  h3/h = h2, de modo que o método é de segunda ordem.

Métodos de Runge–Kutta (Métodos RK) Um método de grande importância prática e de muito maior precisão que o método de Euler aperfeiçoado é o , que sucintamente chamaremos de Método de Runge–Kutta1, clássico método de Runge–Kutta de quarta ordem mostrado na Tabela 21.4. Vemos que, em cada iteração, primeiro calculamos quatro quantidades auxiliares k1, k2, k3, k4 e então o novo valor yn+1. Este método se adequa bem aos computadores, pois não necessita de nenhum procedimento inicial especial, exige pouca memória de armazenamento e utiliza repetidamente os mesmos procedimentos computacionais diretos. Trata-se de um método numericamente estável. Note que, se f depende somente de x, esse método se reduz à regra de integração de Simpson (Seção 19.5). Note também que k1, k 2, k3, k 4 dependem de n e geralmente mudam a cada iteração. Tabela 21.4 Clássico Método de Runge–Kutta de Quarta Ordem

ALGORITMO DE RUNGE–KUTTA (f, x0, y0, h, N) Este algoritmo calcula a solução do problema de valor inicialy= f(x, y), y(x0) = y0 em pontos eqüidistantes x1



x0



h, x2



x0



2 h,







, xN  x0  Nh;

1 O método tem esse nome em homenagem aos matemáticos alemães KARL RUNGE (Seção 19.4) e WILHELM KUTTA (1867–1944). Runge [Math. A nnalen 46 (1895), 167–178], KARL HEUN [ Zeitschr. Math. Phys. 45 (1900), 23–38] e Kutta [Zeitschr. Math. Phys. 46 (1901), 435–453] desenvolveram diversos métodos desse tipo. Teoricamente, existe um número infinito de métodos de quarta ordem que usam quatro valores da função em cada passo. O método mostrado na Tabela 21.4, que se deve a Kutta, é o mais popular do ponto de vista prático devido à sua forma “simétrica” e a seus coeficientes simples.

94

Parte E • Análise Numérica

aqui, f é tal que este problema tem uma solução única no intervalo [ x0, xN] (veja a Seção 1.7). ENTRADA: Função f, valores iniciais x0, y0, tamanho do passo h, número de iterações N SAÍDA: Aproximação yn+1 da solução y(xn+1) em x n+1 = x0 + ( n + 1) h, onde n = 0, , N– 1 •

Para n

0, 1,





, N 1 faça: hƒ(xn, y n) _1 h, y _1 k ) hƒ(xn n 2 2 1 _1 h, y _1 k ) hƒ(xn n 2 2 2 hƒ(xn h, y n k3)

k1 k2 k3 k4 xn

1

yn

1







xn

SAÍDA

yn xn

h

_1 6 k1 ( 2k2 , yn 1

2k3

k4)

1

Fim Pare Fim RUNGE–KUTTA

EXEMPLO 4

Método Clássico de Runge–Kutta Aplique o método de Runge–Kutta ao problema de valor inicial(4) no Exemplo 1, escolhendo h = 0,2 como antes e fazendo cinco passos.

Solução. Para este problema, temos f(x, y) = x + y. Logo, k1



0,2(xn  yn),

k3



0,2(xn  0,1  yn  0,5 k2),

k2



k4

0,2(xn  0,1  yn  0,5 k1),



0,2(xn  0,2  yn  k3).

A Tabela 21.5 mostra os resultados e seus erros, que são menores por fatores de 103 e 104 do que aqueles para os dois métodos de Euler. Veja também a Tabela 21.6. Mencionamos de passagem que, como os presentes k1, k2, k3, k4 são simples, poderíamos poupar operações substituindo k1 por k 2 e então k2 por k3 etc.; a fórmula resultante é mostrada na Coluna 4 da Tabela 21.5. 

Tabela 21.5 Método de Runge–Kutta Aplicado a (4) 0,2214(xn  yn)  n xn yn 0,0214

0 1 2 3 4 5

0,0 0,2 0,4 0,6 0,8 1,0

0 0,021 400 0,091 818 0,222107 0,425521 0,718 251

0,021 400 0,070 418 0,130 289 0,203414 0,292730

Valores exatos (6D) y  ex  x  1 0,000 000 0,021 403 0,091 825 0,222119 0,425541 0,718 282

106  Erro de yn 0 3 7 12 20 31

Tabela 21.6 Comparação da Precisão dos Três Métodos Considerados no Caso do Problema de Valor Inicial (4), com h = 0,2

Erro x

0,2 0,4 0,6 0,8 1,0

y



ex



x

0,021 403 0,091 825 0,222 119 0,425 541 0,718 282



1

Euler (Tabela 21.1) 0,021 0,052 0,094 0,152 0,229

Euler aperfeiçoado (Tabela 21.3) 0,0014 0,0034 0,0063 0,0102 0,0156

Runge–Kutta (Tabela 21.5) 0,000 003 0,000 007 0,000 011 0,000 020 0,000 031

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

95

Erro e Controle do Tamanho do Passo. RKF (Runge–Kutta–Fehlberg) A idéia da integração adaptativa (Seção 19.5) tem casos análogos para os métodos de Runge–Kutta (e outros). Na Tabela 21.4 sobre RK (Runge–Kutta), se em cada passo calcularmos as aproximações y e y com tamanhos do passo h e 2 h, respectivamente, ocorre um erro por iteração igual a 25 = 32 vezes o do anterior; todavia, como temos apenas a metade do número de passos para 2h, o fator real é 2 5/2 = 16, de modo que, por exemplo, e(2h)  16 e(h) e portanto y(h)  y(2h)  e(2h)  e(h)  (16  1) e(h). Logo, o erro e  e(h) para o tamanho do passo é cerca de (10)

e



1 15

 

(y  y) 

onde y  y  y(h)  y(2h), como se disse antes. A Tabela 21.7 ilustra (10) para o problema de valor inicial (11) y  ( y  x  1) 2  2, y(0)  1, o tamanho do passo h = 0,1 e 0  x  0,4. Vemos que a estimativa está próxima do erro real. Esse método de estimativa de erro é simples, mas pode ser instável. 

 

Tabela 21.7 Método de Runge–Kutta Aplicado ao Problema de Valor Inicial (11) e Estimativa de Erro (10). Solução Exata y = tan x + x + 1 

 

x

(Tamanho da iteração h)

(Tamanho da iteração 2h)

0,0 0,1 0,2 0,3 0,4

1,000 000 000 1,200334589 1,402 709 878 1,609336039 1,822 792 993

y

y

Erro estimado (10)

1,000 000 000

0,000 000 000

1,402 707 408

0,000 000 165

1,822 788 993

0,000 000 267

Erro real 0,000 000 000 0,000000083 0,000 000 157 0,000000210 0,000 000 226

Solução exata (9D) 1,000 000 000 1,200334672 1,402 710 036 1,609336250 1,822 793 219

RKF. E. Fehlberg [ Computing 6 (1970), 61–71] propôs e desenvolveu o controle do erro pelo uso de dois métodos RK de diferentes ordens para ir de (xn, yn) a ( xn+1, yn+1). A diferença entre os valores calculados de y em xn+1 fornece uma estimativa de erro a ser usada para o controle do tamanho do passo. Fehlberg descobriu duas fórmulas RK que, juntas, precisam apenas de seis resultados por iteração. Apresentamos estas fórmulas aqui porque o RKF tornou-se bem popular. Por exemplo, o Maple o utiliza (também para sistemas de EDOs). O método RK de quinta ordem de Fehlberg é (12a) yn 1  yn  g1k1   g6 k6 com o vetor coeficiente g  [g1 g6], 



(12b)







16 6656 28561 0 [ 135 12825 56430 Seu método RK de quarta ordem é * (13a) y* n 1  yn  g1 k1  com o vetor coeficiente 25 1408 (13b) g*  [ 216 0 2565

g



















9 50

2 55

].

g5*k5

2197 4104

1

.

5]

Em ambas as fórmulas, usamos simultaneamente por iteração somente seis resultados, quais sejam,

(14)

k1

hƒ(xn, y n)

k2

hƒ(xn

_1 h, 4

yn

k3

hƒ(xn

_3 h,

yn

8

k4

hƒ(xn

_ h, 12 13

yn

k5

hƒ(xn

h,

yn

k6

hƒ(xn

_1 h,

yn

2

_1k ) 4 1

_k ) 3 32 1

_k ) 9 32 2

_k ) _ k ) _ k ) _ k ) 8k ) _ k _ k ) _k _k ) 2k ) _ k 1932 2197 1

7200 2197 2

7296 2197 3

439 216 1

2

3680 513

3

845 4104 4

8 27 1

2

3544 2565 3

1859 4104 4

_ k ). 11 40 5

96

Parte E • Análise Numérica

A diferença entre (12) e (13) dá o erro estimado (15)

EXEMPLO 5

n

1



yn

1

y* n

_k

1 360 1

1

_k _k 128 4275 3

_k

2197 75240 4

1 50 5

_k . 2 55 6

Runge–Kutta–Fehlberg Para o problema de valor inicial (11), obtemos de (12)–(14) com h = 0,1 na primeira iteração, os valores 12S k1



0,200000 000000

k2



0,200062 500000

k3



0,200140 756867

k4



0,200856 926154

k5



0,201006 676700

k6



0,200250 418651

y1* y1

 

1,200334 66949 1,200334 67253

e o erro estimado e1



y1



y*1  0,000000 00304.

O valor exato 12S é y(0,1) = 1,200334 67209. Logo, o erro real de y1 é –4,4 10 –10, ou seja, menor por um fator de 200 que o da Tabela 21.7.  

A Tabela 21.8 resume as características essenciais dos métodos nesta seção. Pode-se mostrar que esses métodos são numericamente estáveis (definição na Seção 19.1). Eles são métodos de uma iteração, porque, em cada passo, utilizamos os dados de apenas uma iteração precedente, em contraste com os métodos multi-iterativos, onde em cada iteração utilizam-se dados de várias iterações anteriores, como veremos na próxima seção. Tabela 21.8 Métodos Considerados e Suas Ordens (= Seu Erro Global)

Método Euler Euleraperfeiçoado RK o (4a rdem) RKF

Avaliaçãodafunçãoporiteração 1 2 4 6

Erro global O(h) O(h2) O(h4) O(h5)

Errolocal O(h2) O(h3) O(h5) O(h6)

Método de Euler Reverso. EDOs Rígidas A fórmula reversa de Euler para se obter uma solução numérica de (1) é (16)

yn1



yn



hƒ(xn1, yn1)

(n  0, 1,





).



Esta fórmula é obtida calculando-se o valor do lado direito da equação no novo ponto (xn+1, yn+1); este é o chamado esquema de Euler reverso. Para um valor conhecido de yn, ele fornece yn+1 implicitamente, de modo que define assim um método implícito, diferentemente do método de Euler (3), que fornece yn+1 explicitamente. Logo, é preciso resolver (16) para yn+1. O grau de dificuldade desse método depende de f em (1). Para uma EDO linear, não há qualquer problema, como mostra o Exemplo 6 (a seguir). Este método é particularmente útil para EDOs “rígidas”, como as que freqüentemente ocorrem no estudo de vibrações, circuitos elétricos, reações químicas, etc. A situação de rigidez é, grosso modo, a seguinte; detalhes podem, por exemplo, ser vistos em [E5], [E25] e [E26] no Apêndice 1. Nos métodos até nos aquiperguntar considerados, termos referentes aosherros envolvem de ordem aumentar superior. Poderíamos, então, o queosacontece se fizermos aumentar . Ora,uma se oderivada erro (a derivada) rapidamente e a solução desejada também aumentar rapidamente, nada acontecerá. Entretanto, se essa solução não aumentar rapidamente, então, com o crescimento de h, o termo do erro pode atingir um tamanho tal que deixará o resultado completamente sem sentido, conforme se vê na Fig. 450. Portanto, chamamos de rígidos tanto a EDO para a qual h deve se restringir a pequenos valores, quanto o sistema físico modelado por essa EDO. O uso desse termo é sugerido pelo sistema massa-mola apresentando uma mola rígida (ou seja, uma mola com um grande valor de k; veja a Seção 2.4). O Exemplo 6 ilustra o fato de que os métodos implícitos removem a dificuldade decorrente do aumento de h no caso de rigidez; pode-se demonstrar que, na aplicação de um método implícito, a solução permanece estável sob qualquer aumento de h, embora a precisão diminua à medida que h aumenta.

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

EXEMPLO 6

97

Método de Euler Reverso. EDO Rígida. O problema de valor inicial y



ƒ( x, y)  20 y  20 x 2  2 x,

y(0)



1

tem a solução (verifique!) y



e20x



x 2.

A fórmula de Euler reversa (16) é yn1



yn



hƒ(xn1, yn1)



yn



h (20 yn1



20 x 2n1  2 xn1).

Notando que xn+1 = xn + h, passando o termo –20hyn+1 para a esquerda e dividindo, obtemos yn

(16*)

yn

h [20( xn

2

h)

1

1

2(xn

h)]

20 h

.

Os resultados numéricos na Tabela 21.9 mostram o seguinte. h

Estabilidade do método de Euler reverso para h = 0,05 e também para h = 0,2 com um incremento de erro de cerca de um fator 4 para = 0,2, Estabilidade do método de Euler reverso para h = 0,05, mas instabilidade para h = 0,1 (Fig. 450), Estabilidade de RK para h = 0,1, mas instabilidade para h = 0,2.

Isto ilustra que a EDO é rígida. Note que, mesmo no caso de estabilidade, a aproximação da solução próximo de x = 0 é ruim.



A rigidez será considerada posteriormente, na Seção 21.3, em conexão com os sistemas de EDOs. y

2,0

1,0

0

0,2

0,4

0,6

0,8

1,0 x

–1,0

Fig. 450. Método de Euler com h = 0,1 para a EDO rígida do Exemplo 6 e a solução exata

Tabela 21.9 Método de Euler Reverso (MER) para o Exemplo 6. Comparação entre Euler e RK x

0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

h

MER  0,05

1,00000 0,26188 0,10484 0,10809 0,16640 0,25347 0,36274 0,49256 0,64252 0,81250 1,00250

h

MER  0,2

1,00000 0,24800 0,20960 0,37792 0,65158 1,01032

h

Euler  0,05

1,00000 0,00750 0,03750 0,08750 0,15750 0,24750 0,35750 0,48750 0,63750 0,80750 0,99750

h

Euler  0,1

1,00000 1,00000 1,04000 0,92000 1,16000 0,76000 1,36000 0,52000 1,64000 0,20000 2,00000

h

RK 0,1



1,00000 0,34500 0,15333 0,12944 0,17482 0,25660 0,36387 0,49296 0,64265 0,81255 1,00252

h

RK 0 ,2



1,000 5,093 25,48 127,0 634,0 3168

Exato 1,00000 0,14534 0,05832 0,09248 0,16034 0,25004 0,36001 0,49001 0,64000 0,81000 1,00000

98

Parte E • Análise Numérica

PROBLEMAS PROPOSTOS 21.1 1–4 MÉTODO DE EULER Faça 10 iterações. Resolva o problema exatamente. Calcule o erro. (Mostre os detalhes.) 1. y   y , y (0)  1, h  0,1 2. y   y , y (0)  1, h  0,01 3. y   ( y  x ) 2, y (0)  0, h  0,1 4. y   ( y  x ) 2, y (0)  0, h  0,1

14. 15. 16. 17. 18.

( y / x  x / y ), y (2)  2, h  0,2 tan x  sen 2 x , y (0)  1, h  0,1 No Problema 15, use h = 0,2 (5 iterações) e compare o erro. y   5 x 4y 2  0, y (0)  1, h  0,2 O método de Kutta de terceira ordem é definido por yn 1  yn  16 (k1  4 k2  k3*) com k1 e k 2 como em RK (Tabela 21.4) e k3*  hƒ(xn 1, yn  k1  2k2). Aplique esse método a (4) no Exemplo 1. Escolha h = 0,2 e faça 5 iterações. Compare com a Tabela 21.6. y



1 2

y



y





5–10 MÉTODO DE EULER APERFEIÇOADO Faça 10 iterações. Resolva exatamente. Calcule o erro. (Mostre os detalhes.) 19. EXPERIMENTO DE RK. ÁLGEBRA COMPUTACIONAL. Euler–Cauchy versus 5. y = y, y(0) = 1, h = 0,1. Compare com o Problema 1 e comente. (a) Resolva (5) no Exemplo (2) pelos métodos de Euler, Euler 6. (População logística) y  y  y 2, y(0)  0,2, h  0,1 Aperfeiçoado e RK para 0  x  5 com uma iteração h = 0,2. 7. y   xy 2  0, y (0)  1, h  0,1 Compare os erros parax = 1, 3, 5 e comente. 8. y   y tan x  sen 2 x , y (0)  1, h  0,1 (b) Represente graficamente as curvas de soluções da EDO em (5) para vários valores iniciais negativos e positivos. 9. Resolva o Problema 7 usando o método de Euler comh = 0,1 e compare a precisão. (c) Faça um experimento similar ao de (a) para um problema de valor inicial que tenha uma solução monótona crescente ou decrescente. 10. y   1  14 y 2 , y (0)  0, h  0,1 Compare o comportamento do erro com o de (a). Comente. 11–17 CLÁSSICO MÉTODO DE RUNGE–KUTTA DE 20. EXPERIMENTO DE ÁLGEBRACOMPUTACIONAL. RKF. QUARTA ORDEM (a) Escreva um programa para RKF que forneçaxn, yn, a estimativa Faça 10 iterações. Compare conforme o indicado. Comente. (Mostre (10) e, se a solução for conhecida, o erro realen. os detalhes.) (b) Aplique o programa ao Exemplo (5) no texto (10 iterações, 11. y – xy2 = 0, y(0) = 1, h = 0,1. Compare com o Problema 7. Aplique h = 0,1) . (10) a y10. (c) Em (b), en dá uma idéia relativamente boa do tamanho do erro 12. y = y – y2 , y(0) = 0,2, h = 0,1. Compare com o Problema 6. real. Isso é típico ou acidental? Descubra, por experimentação com Aplique (10) a y10. outros problemas, de quais propriedades da EDO ou da solução 13. y   (1  x 1) y , y (1)  e , h  0,2 isso poderia depender. 

21.2 Métodos Multi-iterativos Em um método mono-iterativo, calculamos yn+1 usando somente uma única iteração, a saber, o valor anterior yn. Métodos mono-iterativos são “auto-iniciáveis”; eles não precisam de ajuda para continuar o processo porque obtêm y1 do valor inicial y 0 etc. Todos os métodos da Seção 21.1 são deste tipo. Por outro lado, um método multi-iterativo utiliza em cada iteração valores de duas ou mais iterações anteriores. Estes métodos são induzidos pela expectativa de que as informações adicionais aumentarão a precisão e a estabilidade. Mas, para que se iniciem, precisam de valores, digamos, y0, y1, y2, y3 em um método de 4 iterações obtido por Runge–Kutta ou por outro método preciso. Portanto, os métodos multi-iterativos não são auto-iniciáveis. Esses métodos são obtidos do seguinte modo.

Métodos de Adams–Bashforth Consideremos um problema de valor inicial (1)

y



ƒ( x, y),

y(x0)



y0

como antes, com f tal que o problema tenha uma única solução em algum intervalo contendo x0. Integramos y  ƒ( x, y) de xn a xn 1  xn  h. Isso fornece 



xn1

xn

y(x) dx



y(xn1)



y(xn)





xn1

ƒ(x, y(x)) dx.

xn

Agora vem a idéia central. Substituímos f(x, y(x)) por um polinômio de interpolação p(x) (veja a Seção 19.3), de modo que poderemos integrar mais tarde. Isso fornece as aproximações yn+1 de y (xn+1) e y n de y (xn),

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

(2)

yn1

yn







99

xn1

p(x) dx. xn

Diferentes escolhas de p(x) produzirão agora diferentes métodos. Expliquemos este princípio considerando um polinômio cúbico, digamos, o polinômio p3(x) que em (eqüidistante) xn,

xn1,

xn2,

xn3

tem os respectivos valores ƒn (3)

ƒn

1

ƒn

2

ƒn

3



ƒ( xn, yn)



ƒ( xn 1, yn 1)



ƒ( xn 2, yn 2)



ƒ( xn 3, yn 3).













Isto levará a uma fórmula de utilidade prática. Podemos obter p 3(x) da fórmula da diferença reversa de Newton (18), Seção 19.3: p3(x)



ƒ n  rƒn  12 r (r  1) 2ƒn  16 r (r  1)( r  2) 3ƒn

onde x x  . h 

r



n

Integramos p 3(x) em x de xn até x n+1 = xn + h, portanto, em r de 0 até 1. Uma vez que x



xn



hr,

temos

dx

h dr.



A integral de r (r  1) é 5/12 e a de r (r  1)( r  2) é 3/8. Obtemos, portanto, 1 2

1 6

xn

1

1

(4)

p3 dx

h

p3 dr

xn

h

0

ƒ

1 2

n

5 12

ƒn

3 8

ƒn

2



ƒn .

3

É prático substituir essas diferenças por suas expressões em termos de f: ƒn  ƒ n  ƒ n 1  ƒn  ƒ n  2ƒ n 1  ƒ n 



2



ƒn  ƒ n  3ƒ n

3

1



2

3ƒ n

2



ƒ n 3. 

Substituímos isto em (4) e agrupamos os termos. O resultado é a fórmula multi-iterativa do método de Adams– Bashforth de quarta ordem (5)

yn1



yn



h

 (55ƒn  59ƒ n 24

1



37ƒ n

2



9ƒ n 3). 

Ela expressa o novo valor yn+1 [aproximação da solução y de (1) em xn+1] em termos de quatro valores de f calculados a partir dos valores de y obtidos nas quatro iterações precedentes. O erro de truncamento local é de ordem h5, como se pode mostrar, de modo que o erro global é de ordem h4; logo, (5) realmente define um método de quarta ordem.

Métodos de Adams–Moulton Os métodos de Adams–Moulton são obtidos se, para p(x) em (2), escolhermos um polinômio que faça uma interpolação f(x, y(x)) em xn+1, x n, x n–1, (opondo-se assim ao xn, x n–1, usado antes; este é o ponto principal). Expliquemos este princípio para o polinômio cúbico p3(x) que faz uma interpolação em xn+1, xn, xn–1, xn–2. (Antes, tivemos x n, xn–1, x n–2, x n–3.) De novo usando (18) na Seção 19.3, porém fazendo agora r = ( x – x n+1)/h, temos •













p3(x)





ƒn

1

ƒn

 r

1



1 2

r (r



1) 2ƒn

1



1 6

r (r



1)( r  2) 3ƒn 1. 

Agora, integramos em x, de x n a xn+1, como antes. Isto corresponde a integrar em r de –1 a 0. Obtemos xn

1

p3(x) dx xn

h

ƒ

n

1

1 2

ƒn

1

1 12

ƒn

2

1

1 24

ƒn

3

.

1

100

Parte E • Análise Numérica

Substituindo as diferenças como antes, chegamos a



xn1

h

 (9ƒ n 1  19ƒ n  5ƒ n 1  ƒ n 2). 24 Esta é a usualmente chamada fórmula de Adams–Moulton. Trata-se de uma fórmula implícita, porque fn+1 = f(xn+1, yn+1) aparece no lado direito, de modo que ela define yn+1 apenas implicitamente, em contraste com (5), que é uma fórmula explícita, não envolvendo yn+1 no lado direito. Para usarmos (6), precisamos predizer um valor y* n+1, por exemplo, usando (5), ou seja,

(6)

yn1



yn

(7a)



y* n1

p3(x) dx





yn









yn



h

 (55ƒn  59ƒ n 24

1



37ƒ n

2



9ƒ n 3). 

O novo valor corrigido yn+1 é então obtido de (6) com fn+1 substituído por ƒ*n como em (6); portanto,

1

(7b)



xn

yn1



yn



h

 (9ƒ *n 24

1



19ƒ n  5ƒ n

1





ƒ(xn 1, y*n 1) e os outros f s 



ƒ n 2). 

Este método preditivo-corretivo (7a), (7b) é usualmente chamado de método de Adams–Moulton de quarta ordem. Uma vantagem sua em relação ao método RK é que (7) fornece a estimativa de erro

 151 ( yn 1  y*n 1), como se pode demonstrar. Isto é análogo a (10) da Seção 21.1. Às vezes, o nome “método de Adams–Moulton” reserva-se ao método com várias correções por iteração usando-se (7b) até se atingir uma precisão específica. Para ambas as versões do método, há códigos de grande utilização. en1





Inicialização. Em (5), precisamos de f0, f1, f2, f3. Logo, de (3), vemos que precisamos primeiro calcular y1, y2, usando algum outro método de precisão comparável, por exemplo, RK ou RKF. Sobre outras escolhas, veja a Ref. [E26] listada no Apêndice 1.

y3

EXEMPLO 1

Previsão de Adams–Moulton (7a), Correção de Adams–Moulton (7b) Resolva o problema de valor inicial (8)

y = x + y, y(0)

=0

usando (7a) e (7b) no intervalo 0  x  2 e escolhendo h = 0,2.

Solução. O problema é o mesmo dos Exemplos 1-3 da Seção 21.1, de modo que podemos comparar os resultados. Calculamos os valores iniciais y1, y2, y3 usando o clássico método de Runge–Kutta. Então, em cada iteração, fazemos uma previsão usando (7a) e uma correção usando (7b), antes de executarmos a próxima iteração. Os resultados são mostrados e comparados com os valores exatos da Tabela 21.10.  Vemos que as correções aumentam consideravelmente a precisão. Isto ocorre usualmente.

Tabela 21.10 Método de Adams–Moulton Aplicado ao Problema de valor Inicial (8); Valores Previstos Calculados por (7a) e Valores Corrigidos por (7b) n

xn

0 1 2 3 4

0,0 0,2 0,4 0,6 0,8

5 6 7 8 9 10

1,0 1,2 1,4 1,6 1,8 2,0

Início yn

Previsto yn*

Corrigido yn

0,000 000 0,021 400 0,091 818 0,222 107

Valores exatos

0,425 361

0,425 529

0,000 000 0,021 403 0,091 825 0,222 119 0,425 541

0,718 066 1,119 855 1,654 885 2,352 653 3,249 190 4,388505

0,718 270 1,120 106 1,655 191 2,353 026 3,249 646 4,389062

0,718 282 1,120 117 1,655 200 2,353 032 3,249 647 4,389056

106 Erro de yn 

0 3 7 12 12 12 11 9 6 1 

6

Comentários sobre a Comparação dos Métodos. Em geral, uma fórmula de Adams–Moulton é muito mais precisa que uma de Adams-Bashforth de mesma ordem. Isto explica porque é mais complicado e trabalhoso usar

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

101

a primeira. O método (7a), (7b) é numericamente estável, ao passo que a utilização exclusiva de (7a) poderia causar instabilidade. O controle do tamanho do passo é relativamente simples. Se Correção – Previsão > TOL, use uma interpolação para gerar resultados “antigos” na metade do tamanho do passo atual e tente então usar h/2 como uma nova iteração. Enquanto no uso da fórmula de Adams–Moulton (7a), (7b) precisamos calcular somente dois valores por iteração, na fórmula de Runge–Kutta precisamos de 4; entretanto, com o método de Runge–Kutta, é possível tomar um tamanho do passo mais que duas vezes maior, de modo que uma comparação desse tipo (generalizada na literatura) fica sem sentido. Para mais detalhes, veja as Refs. [E25] e [E26] listadas no Apêndice 1.

PROBLEMAS PROPOSTOS 21.2

1. Desenvolva e apresente os detalhes dos cálculos que levam a (4)–(7) no texto.

y* n1



yn



h

 (23ƒn  16ƒn 12

1



5ƒ n 2), 

h

2–11 MÉTODO DE ADAMS–MOULTON (7a), (7b) yn 1  yn   (5ƒn 1  8ƒ n  ƒ n 1). 12 Resolva os problemas de valor inicial usando o método de Adams– 13. Use o Problema 12 pararesolvery = 2xy, y(0) = 1 (10 iterações,h = Moulton e fazendo 10 iterações com uma correção por iteração. Resol0,1, valores iniciais RK). Compare com a solução exata e comente. va exatamente e calcule o erro. (Use RK quando não forem dados 14. Em quanto é possível reduzir o erro no Problema 13 dividindo valores iniciais.) h pela metade (20 iterações,h = 0,05)? Responda primeiro por 2. y   y , y (0)  1, h  0,1 (1,105171, 1,221403, 1,349859) palpite, depois calcule. 3. y    0,2 xy , y (0)  1, h  0,2 15. PROJETO DE ÁLGEBRA COMPUTACIONAL. Adams– 4. y   2 xy , y (0)  1, h  0,1 Moulton. (a) Em (7a) e (7b), um início preciso é importante. 2 5. y   1  y , y (0)  0, h  0,1 Ilustre esse fato no Exemplo 1 do texto, usando valores iniciais 6. Faça o Problema 4 por RK, 5 iterações,h = 0,2. Compare os obtidos pelo método de Euler-Cauchy aperfeiçoado e compare os erros. resultados com os da Tabela 21.9. 7. Faça o Problema 5 por RK, 5 iterações,h = 0,2. Compare os (b) De quanto o erro no Problema 11 diminui se você usar valores erros. iniciais exatos (em vez de valores RK)? 8. y   x / y , y (1)  3, h  0,2 (c) Experimente descobrir para quais EDOs um início ruim é muito prejudicial e para quais ele não o é. 9. y   ( x  y  4) 2 , y (0)  4, h  0,2, apenas 7 iterações (por quê?) (d) O clássico método RK freqüentemente fornece a mesma pre10. y   1  4 y 2, y (0)  0, h  0,1 cisão com uma iteração 2h do que o método de Adams–Moulton 11. y   x  y , y (0)  0, h  0,1 (0,00517083, 0,0214026, com uma iteração h, de modo que o número total de cálculos de 0,0498585) valores da função é o mesmo em ambos os casos. Ilustre isto com o Problema 8. (Conseqüentemente, comparações correspondentes 12. Mostre que, aplicando-se a um polinômio de segundo grau o e favoráveis ao método de Adams, encontradas na literatura, não método visto no texto, obtemos as fórmulas de previsão e correção são válidas. Veja também os Problemas 6 e 7.) 



21.3 Métodos para Sistemas e EDOs de Ordem Superior

Para os sistemas de EDOs de primeira ordem, os problemas do valor inicial têm a forma: (1)

y  f (x, y),

y(x0)  y0,

em componentes y1  ƒ 1(x, y1,







, ym),

y1(x0)



y10 .

y2  ƒ 2(x, y1,







, ym),

y2(x0)



y20 .





ym 



















ƒ m(x, y1,





















, ym).











ym(x0)















ym0 .



102

Parte E • Análise Numérica

Supõe-se que f seja tal que o problema tenha uma única solução y(x) em algum intervalo aberto x contendo x0. Nossa discussão será independente do Capítulo 4 sobre sistemas de equações. Antes de explicarmos os métodos de solução, é importante notar que (1) inclui os problemas do valor inicial para EDOs únicas de m-ésima ordem, (2)

y(m)



ƒ( x, y, y, y ,

e as condições iniciais y(x0)  K1, y(x0)  K2, De fato, percebemos essa conexão fazendo (3)

y1



y,

y2



, y(m 1)) 







, y(m 1)(x0)  Km como casos especiais. 







y,

y3

y ,



, ym  y(m 1). 







Então, obtemos o sistema y1  y2 y2  y3

(4)

• • •

ym  1 ym 



e as condições iniciais y1(x0)  K1, y2(x0)  K2,

ƒ( x, y1, •



ym











, ym)

, ym(x0)  Km.

Método de Euler para Sistemas Podemos de uma maneira simples estender a sistemas (1) os métodos usados nas EDOs únicas de primeira ordem, bastando para isso escrever as funções vetoriais y e f no lugar das funções escalares y e f, enquanto x segue sendo uma variável escalar. Comecemos com o método de Euler. Tal como acontece para uma EDO única, este método não terá uma precisão suficiente para propósitos práticos, embora seja capaz de ilustrar muito bem o princípio da extensão. EXEMPLO 1

Método de Euler para uma EDO de Segunda Ordem. Sistema Massa–Mola Resolva o problema de valor inicial para um sistema massa-mola amortecido y



2 y  0,75 y  0,

y(0)



3,

y(0)

2,5

 

usando o método de Euler com uma iteração h = 0,2 para x variando de 0 a 1 (onde x é o tempo).

Solução. O método de Euler (3) na Seção 21.1 promove uma generalização para os sistemas que têm a forma (5)

yn

1



yn  h f(xn, yn),

em componentes y1,n1



y1,n



hƒ1(xn, y1,n , y2,n)

y2,n1



y2,n



hƒ2 (xn, y1,n , y2,n)

ocorrendo algo similar com os sistemas de mais de duas equações. Por (4), a EDO dada converte-se no sistema y 1  ƒ 1(x, y1, y2)



y 2  ƒ 2 (x, y1, y2)

 

y2

2y2  0,75y1.

Logo (5) fica y1,n1



y1,n



0,2 y2,n

y2,n1



y2,n



0,2( 2y2,n  0,75y1,n).

As condições iniciais são y(0) = y1(0) = 3, y(0) = y2(0) = –2,5. Os cálculos estão mostrados na Tabela 21.11. Quanto às EDOs únicas, os resultados não seriam precisos o suficiente para propósitos práticos. Este exemplo tão somente serve para ilustrar o método, já que a solução exata do problema pode ser prontamente obtida, y



y1



2e

0,5 x



e1,5 x,

portanto

y



y2

0,5 x

 e



1,5 e

.

1,5 x



103

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

Tabela 21.11 Método de Euler para Sistemas do Exemplo 1 (Sistema Massa–Mola) y1 n

xn

y1,n

0 1 2 3 4 5

0,0 0,2 0,4 0,6 0,8 1,0

3,00000 2,50000 2,11000 1,80100 1,55230 1,34905

Exato (5D)

Erro e1



3,00000 2,55049 2,18627 1,88821 1,64183 1,43619

y1

Erro

y2

y1,n



Exato (5D)

y2,n

0,00000 0,05049 0,76270 0,08721 0,08953 0,08714

2,50000 1,95000 1,54500 1,24350 1,01625 0,84260

e2

2,50000 2,01606 1,64195 1,35067 1,12211 0,94123







y2



y2,n

0,00000 0,06606 0,09695 0,10717 0,10586 0,09863

Métodos de Runge–Kutta para Sistemas

Como nos métodos de Euler, é possível obter métodos RK para um problema de valor inicial (1) simplesmente escrevendo fórmulas vetoriais para vetores com m componentes, que, no caso de m = 1, reduzem-se às fórmulas escalares anteriores. Portanto, para o clássico método RK de quarta ordem mostrado na Tabela 21.4, obtemos (6a)

y(x0)  y0

e para cada iteração n  0, 1,







(Valores iniciais)

, N  1 obtemos os 4 valores auxiliares k1  h f(xn, yn)

(6b)

k2  h f(xn  12 h,

yn  12k1)

k3  h f(xn  h,

yn  12k2)

k4  h f(xn  h,

yn  k3)

1 2

e o novo valor [aproximação da solução y(x) em xn (6c) EXEMPLO 2

yn

1



1



x0



( n  1) h]

yn  (k1  2 k2  2 k3  k4). 1 6

Método RK para Sistemas. Equação de Airy. Função de Airy Ai( x) Resolva o problema de valor inicial y



xy ,

y(0)



1/(32/3





(2/3))  0,35502 805,

y(0)

1/(31/3

 





(1/3))  0,25881 940

pelo método de Runge–Kutta para sistemas com h = 0,2; faça 5 iterações. Esta é a equação de Airy2, que surge em óptica (veja a Ref. [A13] listada no Apêndice 1).  é a função gama (veja o Apêndice A3.1). As condições iniciais são tais que obtemos uma solução-padrão, a função de Airy Ai(x), uma função especial que foi exaustivamente investigada; sobre os valores numéricos, veja a Ref.[GR1].

Solução. Para y =

xy, fazendo y1 = y, y 2 = y 1 = y,

obtemos o sistema (4) y1 = y 2 y2 = xy1.

Logo, em (1), f  [ƒ1 ƒ2]T possui as componentes ƒ1(x, y)  y2, ƒ 2(x, y)  xy 1. Agora escrevemos (6) por suas componentes. As condições iniciais (6a) são y1,0  0,35502 805, y2,0  0,25881 940. Em (6b), teremos menos números subscritos simplesmente escrevendo k1  a, k2  b, k 3  c, k4  d, de forma que a  [a1 a2]T, etc. Então, (6b) toma a forma a

h

y2,n

  xn y1,n

(6b*) b

h



y2,n

(xn

_a 1 2

2

_ h)( y 1 2

1,n

_1 a ) 2 1



Nome dado em homenagem a Sir GEORGE BIDELL AIRY (1801–1892), matemático inglês conhecido por seus trabalhos em elasticidade e EDPs. 2

104

Parte E • Análise Numérica

c

h



y2,n



y2,n

(6b*) [continuação] d

h

_b 1 2

2

_1 h)( y

(xn

_b ) 1 1 2

1,n

2

c2

(xn

h)( y1,n

c1)





.

Por exemplo, a segunda componente de b é obtida como se segue. f(x, y) tem a segunda componente f2(x, y) = xy1. Ora, em b (= k2), o primeiro argumento é x

xn



1

 2h

.

O segundo argumento em b é y  yn  12 a,

e a primeira componente desse é y1



y1,n

1

.

 2 a1

Juntos, xy 1



( xn  12 h)( y1,n  12 a1).

Similarmente para as outras componentes em (6b*). Finalmente, (6c*)

yn1  yn  16 (a  2 b  2 c  d).

A Tabela 21.12 mostra os valoresy(x) = y1(x) da função de Airy Ai(x) e de sua derivaday(x) = y2(x), bem como do erro (um tanto pequeno!) de y(x). 

Tabela 21.12 Método RK para Sistemas: Valores y1,n(xn) da Função de Airy Ai( x) do Exemplo 2 n

xn

0 1 2 3 4 5

0,0 0,2 0,4 0,6 0,8 1,0

y1,n(xn)

y1(xn) Exato (8D)

0,35502805 0,30370303 0,25474211 0,20979973 0,16984596 0,13529207

10

0,35502805 0,30370315 0,25474235 0,20980006 0,16984632 0,13529242

8



Erro de y1

0 12 24 33 36 35

y2,n(xn)

0,25881 940 0,25240 464 0,23583 073 0,21279 185 0,18641 171 0,15914 687 

Métodos de Runge–Kutta–Nyström (Métodos RKN) Os métodos RKN são extensões diretas dos métodos RK (métodos de Runge–Kutta) para as EDOs de segunda ordem y = f(x, y, y), conforme dado pelo matemático finlandês E. J. Nyström [Acta Soc. Sci. fenn., 1925, L,no 13]. O mais conhecido deles utiliza as seguintes fórmulas, onde n = 0, 1, , N – 1 (N é o número de iterações): •

(7a)

k1



1 2

hƒ(xn, yn, yn)

k2



1 2

hƒ(xn

k3



1 2

k4



1 2



1 2

h, yn



K, yn  k1)

hƒ(xn



1 2

h, yn



K, yn  k2)

hƒ(xn



h, yn





(7b)

1



yn1



yn





onde K  12 h ( y n  12k1)

L, yn  2 k3)

Disto, calculamos a aproximação y n 1 de y(xn 1) a xn



onde L  h ( y n  k3). 

h ( yn 

x0 1 3



( n  1) h,

(k1  k2  k3)),

e a aproximação y n+1 da derivada y (xn+1) necessária na iteração seguinte, (7c)

yn1



yn 

1 3

(k1  2 k2  2 k3  k4).

RKN para EDOs y = f(x, y) que não Contêm y. Então k2 = k3 em (7), o que torna o método particularmente vantajoso e reduz (7) a

105

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)



1 2

hƒ(xn, yn)

k2



1 2

hƒ(xn



1 2

k4



1 2

hƒ(xn



h, yn

yn1



yn

yn1



yn 

k1

(7*)

EXEMPLO 3



_h, y n

h( yn  1 3

1 3





_h( y   1_k )) n 2 1

1 2



k3

h( yn  k2))

(k1  2 k2))

(k1  4 k2  k4).

Método RKN. Equação de Airy. Função de Airy Ai( x) Para o problema no Exemplo 2 e h = 0,2 como antes, obtemos de (7*) simplesmente k1  0,1 xn yn e k2



k3



0,1(xn  0,1)( yn  0,1 yn  0,05k1),

k4



0,1(xn  0,2)( yn  0,2 yn  0,2 k2).

A Tabela 21.13 mostra os resultados. A precisão é a mesma do Exemplo 2, mas ficou muito menos trabalhoso.



Tabela 21.13 Método de Runge–Kutta–Nyström Aplicado à Equação de Airy. Cálculo da Função de Airy y = Ai(x) xn

0,0 0,2 0,4 0,6 0,8 1,0

yn

y(x)

yn

0,35502805 0,30370304 0,25474211 0,20979974 0,16984599 0,13529218

Exato (8D)

108 Erro de yn 0 11 24 32 33 24 

0,35502805 0,30370315 0,25474235 0,20980006 0,16984632 0,13529242

0,258 819 40 0,252 404 64 0,235 830 70 0,212 791 72 0,186 411 34 0,159 146 09 

Nosso trabalho nos Exemplos 2 e 3 também ilustra a utilidade dos métodos para EDOs no cálculo de valores de “funções transcendentais superiores”.

Método de Euler Reverso para Sistemas. Sistemas Rígidos A fórmula de Euler reversa (16) na Seção 21.1 é uma generalização para os sistemas na forma (8)

yn

1



yn  h f (xn 1, yn 1) 

(n  0, 1,







).



Este é, de novo, um método implícito, pois implicitamente fornece yn+1 para um dado yn. Logo, deve-se resolver (8) para yn+1. Isto é mostrado no próximo exemplo para um sistema linear. Este exemplo também ilustra o fato de que, semelhantemente ao caso de uma EDO única na Seção 21.1, esse método é muito útil para sistemas rígidos, ou seja, sistemas de EDOs cuja matriz tem autovalores l de magnitudes muito diferentes, tendo o efeito de que, exatamente como na Seção 21.1, a iteração nos métodos diretos (RK, por exemplo), não pode ser incrementada além de um certo limite sem se perder estabilidade. ( l = –1 e –10 no Exemplo 4, porém, diferenças maiores de fato ocorrem nas aplicações.) EXEMPLO 4

Método de Euler Reverso para Sistemas de EDOs. Sistemas Rígidos Compare o método de Euler reverso (8) com o método de Euler e o RK na resolução numérica do problema de valor inicial y



11 y  10 y  10 x  11,

y(0)



2,

y(0)

 

10

convertido a um sistema de EDOs de primeira ordem.

Solução. O problema dado pode ser facilmente resolvido, obtendo-se y



ex



e10x



x

de modo que podemos calcular os erros. A conversão para um sistema fazendo y  y1, y  y2 [veja (4)] fornece y 1  y2 y 2 

A matriz dos coeficientes

10 y1  11 y2  10 x  11



y1(0)



y2 (0)

 

2. 10.

106

Parte E • Análise Numérica



A

cujo valor é l2  11l  10



yn

0

1

10

11



1

tem o determinante característico 10

11

( l  1)( l  10). Logo, os autovalores são –1 e –10 conforme aqui afirmado. A fórmula de Euler reversa é 1

y1,n

1

y1,n

y2,n

1

y2,n

 

h



10 y1,n

1

y2,n

1

11y2,n

1

10 xn

11

1



.

A reordenação dos termos fornece o sistema linear para as incógnitas y1,n+1 e y2,n+1 y1,n1

h y2,n1





y1,n

10 hy 1,n1  (1  11h)y2,n1  y2,n  10 h (xn  h)  11h. O determinante dos coeficientes é D = 1 + 11h + 10h2 e a regra de Cramer fornece a solução (1 yn

1

1 D

11 h)y



10h2x

hy

1,n

2,n

n

10 hy1,n

y2,n

10hxn

11h2

10h3

11h

10h2



.

Tabela 21.14 Método de Euler Reverso (MER) para o Exemplo 4. Comparação com Euler e RK x

0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0

h

MER  0,2

2,00000 1,36667 1,20556 1,21574 1,29460 1,40599 1,53627 1,67954 1,83272 1,99386 2,16152

h

MER  0,4

h

2,00000

Euler  0,1

2,00000 1,01000 1,56100 1,13144 1,23047 1,34868 1,48243 1,62877 1,78530 1,95009 2,12158

1,31429 1,35020 1,57243 1,86191 2,18625

h

Euler  0,2

2,00000 0,00000 2,04000 0,11200 2,20960 0,32768 2,46214 0,60972 2,76777 0,93422 3,10737

h

RK 0,2



2,00000 1,35207 1,18144 1,18585 1,26168 1,37200 1,50257 1,64706 1,80205 1,96535 2,13536

h

RK 0 ,3



2,00000

3,03947

5,07569

8,72329

Exato 2,00000 1,15407 1,08864 1,15129 1,24966 1,36792 1,50120 1,64660 1,80190 1,96530 2,13534

A Tabela 21.14 mostra o seguinte. Estabilidade do método de Euler reverso para h = 0,2 e 0,4 (e, de fato, para qualquer h; tente h = 5,0) com a precisão diminuindo à medida que h vai aumentando, Estabilidade do método de Euler para h = 0,1, mas instabilidade para h = 0,2, Estabilidade de RK para h = 0,2, mas instabilidade para h = 0,3. A Fig. 451 mostra o método de Euler parah = 0,18, um caso interessante, com um salto inicial (de cerca de x < 3), porém monótono mais  tarde, seguindo a curva-solução de y = y1. Veja também o Experimento de Álgebra Computacional 21. y

4,0

3,0

2,0

1,0

0

1234

x

Fig. 451. Método de Euler com h = 0,18 do Exemplo 4

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

107

PROBLEMAS PROPOSTOS 21.3 1. Verifique os cálculos no Exemplo 1. 2–7

EULER PARA SISTEMAS E EDOs DE SEGUNDA ORDEM

Resolva pelo método de Euler 2. y1  3y1  y2, y2  y1  3 y2, y1(0)  2, y2(0)  0, h  0,1, 5 iterações 3. y 1  y1, y 2  y2 , y1 (0)  1, y2(0)  1, h  0,2, 5 iterações 4. y 1  y1, y 2  y 2, y1(0)  2, y 2(0)  2, h  0,1, 10 iterações 5. y   4 y  0, y (0)  1, y  (0)  0, h  0,2, 5 iterações 6. y   y  x , y (0)  1, y  (0)   2, h  0,1, 5 iterações 7. y 1   y 1  y 2, y 2   y 1  y 2 , y 1(0)  0, y 2(0)  4, h  0,1, 10 iterações 8. Verifique as fórmulas e os cálculos para a equação de Airy no Exemplo 2.

16–19 MÉTODO DE RUNGE–KUTTA–NYSTRÖM Faça por RKN: 16. O Problema 12 (Função de Bessel J0). Compare os resultados. 17. y   xy   4 y  0, y (0)  3, y  (0)  0, h  0,2, 5 iterações (Exata: y  x 4  6 x 2  3.) 18. ( x 2  x ) y   xy   y  0, y ( 12 )  1  12 ln 2, y  ( 12 )  1  ln 2, h  0,1, 4 iterações 19. O Problema 11. Compare os resultados. 20. EXPERIMENTO DE ÁLGEBRA COMPUTACIONAL. Com-

paração de métodos. (a) Escreva programas para sistemas usando RKN e RK. (b) Experimente-os em EDOs de segunda ordem de sua escolha para descobrir empiricamente qual método é melhor em casos específicos. (c) Ao se usar o RKN, valeria a pena primeiro eliminary (veja o Problema 29 em Problemas Propostos 5.5)? Descubra isso experimentalmente. 21. EXPERIMENTO DEÁLGEBRA COMPUTACIONAL. Méto9–14 RK PARA SISTEMAS do de Euler Reverso e Rigidez. Estenda o Exemplo 4 como se Resolva usando o método RK clássico: segue. 9. O sistema no Problema 7. Quão menor é o erro? (a) Verifique os valores da Tabela 21.14 e represente-os grafica10. A EDO no Problema 6. Por qual fator o erro diminuiu? mente como na Fig. 451. 11. Pêndulo Não-amortecido. y   sen y  0, y(p)  0, y (p)  (b) Calcule e represente graficamente os valores obtidos por Euler 1, h  0,2, 5 iterações. Como o seu resultado se aplica à Fig. 92 para um h próximo do valor “crítico”h = 0,18, com o propósito da Seção 4.5? de determinar mais exatamente quando a instabilidade se inicia. 12. Função de Bessel J0. xy   y   xy  0, (c) Calcule e represente graficamente os valores obtidos por RK y (1)  0,765198, y(1)  0,440051, h  0,5, 5 iterações. (Isto para h entre 0, 2 e 0,3, com o propósito de encontrar o valor deh fornece a solução-padrãoJ0(x) na Fig. 107 da Seção 5.5.) para o qual a aproximação RK começa a crescer afastando-se da   

13. 14. 15.

 



42,





0, O sistema no Problema 2. Quão menor é o erro? Verifique os cálculos para a equação de Airy do Exemplo 3. 1 yy 2 (0)

y 1 h y 20,1, y1 , y 2 5 iterações. 4 y 2, y 1(0) 

solução exata. (d) Calcule e represente graficamente os valores obtidos por Euler para h grande; confirme a estabilidade e investigue o crescimento do erro à medida que h aumenta.

21.4 Métodos para EDPs Elípticas As seções restantes deste capítulo tratam dos métodos numéricos para EDPs (equações diferenciais parciais), particularmente as equações de Laplace, de Poisson, do calor e da onda. Estas EDPs são fundamentais nas aplicações e, ao mesmo tempo, são modelos de casos para as EDPs elípticas, parabólicas e hiperbólicas, respectivamente. As definições são as seguintes (lembre também da Seção 12.4). Uma EDP é chamada de quase-linear se ela é linear nas derivadas superiores. Logo, uma EDP quase-linear de segunda ordem com duas variáveis independentes x, y tem a forma (1) u

auxx



2 buxy  cuyy  F(x, y, u, ux, uy).

é uma função desconhecida de x e y (uma solução procurada). F é uma função dada das variáveis indicadas. 2

Dependendo do discriminante ac – b , dizemos que a EDP(1) é do tipo: elíptico se ac – b>2 0 (exemplo: equação de Laplace) 2 parabólico se ac – b= 0 (exemplo: equação do calor) 2 hiperbólico se ac – b < 0 (exemplo: equação da onda). Aqui, nas equações da onda e do calor, y é o tempo t. Os coeficientes a, b, c podem ser funções de x, y, de modo que o tipo de (1) pode ser diferente em diferentes regiões do plano xy. Esta classificação não é uma questão meramente formal, mas é de grande importância prática, porque o comportamenmto geral das soluções difere-se tipo a tipo, o mesmo acontecendo com as condições adicionais (condições iniciais e de contorno) que devem ser levadas em conta.

108

Parte E • Análise Numérica

As aplicações envolvendo as equações elípticas usualmente levam a um problema de valor de contorno em uma região R, chamado de primeiro problema de valor de contorno ou problema de Dirichlet caso se prescreva u para a curva de contorno C de R; é chamado de segundo problema de valor de contorno ou problema de Neumann se un = u/n (derivada normal de u) é determinada em C, e de terceiro problema ou problema misto se u for determinada em uma parte de C e un na parte restante. Usualmente, C é uma curva fechada (ou às vezes consiste em duas ou mais dessas curvas).

Equações de Diferença para as Equações de Laplace e de Poisson Nesta seção, consideraremos a equação de Laplace (2)

2u 

uxx



uyy



uyy





0

e a Equação de Poisson (3)

2u 

uxx

ƒ( x, y).

Estas são as EDPs elípticas mais importantes nas aplicações. Para obtermos métodos de solução numérica, as derivadas parciais são substituídas pelos correspondentes quocientes de diferença como se segue. Pela fórmula de Taylor, (4)

(a) u(x  h, y)  u(x, y)  hux(x, y)  12 h2uxx(x, y)  16 h3uxxx(x, y)  (b) u(x  h, y)  u(x, y)  hux(x, y)  12 h2uxx(x, y)  16 h3uxxx(x, y) 













.

Subtraímos (4b) de (4a), desprezamos os termos em h , h , , e resolvemos para ux. Então, 1 (5a) ux(x, y)   [u(x  h, y)  u(x  h, y)]. 2h 3

4







Similarmente, u(x, y



k)



u(x, y)



kuy(x, y)



1 2

k 2uyy(x, y)









e u(x, y



k)



u(x, y)

Subtraindo, desprezamos os termos em k , k ,



kuy(x, y)



1 2

k 2uyy(x, y)









.

, e resolvemos para uy, obtendo 1 (5b) uy(x, y)   [u(x, y  k)  u(x, y  k)]. 2k Passamos agora para as derivadas segundas. Somando (4a) e (4b) e desprezando os termos em h4, h5, obtemos u(x  h, y)  u(x  h, y)  2 u(x, y)  h2uxx(x, y). Resolvendo para uxx, temos 1 (6a) uxx(x, y)  2 [u (x  h, y)  2 u (x, y)  u (x  h, y)]. h 3

4













,

Similarmente, (6b)

uyy(x, y)

1  2 [u (x, y  k)  2 u (x, y)  u (x, y  k)]. k

Não precisaremos de (veja o Problema 1) 1 (6c) uxy(x, y)   [u (x  h, y  k)  u (x  h, y  k)  u (x  h, y  k)  u (x  h, y  k)]. 4hk A Fig. 452a mostra os pontos (x + h, y), ( x – h, y), em (5) e (6). Agora substituímos (6a) e (6b) na equação de Poisson (3), escolhendo k = h para obtermos uma fórmula simples: •

(7)





u(x  h, y)  u(x, y  h)  u(x  h, y)  u(x, y  h)  4 u(x, y)  h2ƒ(x, y).

109

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

Esta é uma equação de diferença correspondente a (3). Logo, para a equação de Laplace (2), a correspondente equação de diferença é (8)

u(x



h, y)



u(x, y



h)



u(x



h, y)



u(x, y



h)



4 u(x, y)  0.

h é chamado o tamanho da malha. A equação (8) relaciona u em (x, y) a u nos quatro pontos vizinhos mostrados na Fig. 452b. Ela tem uma interpretação notável: u em (x, y) é igual à média dos valores de u nos quatro pontos vizinhos. Trata-se de um caso análogo à propriedade do valor médio das funções harmônicas (Seção 18.6). Freqüentemente se chamam esses vizinhos de L (Leste), N (Norte), O (Oeste), S (Sul). Então, a Fig. 452b torna-se a Fig. 452c e (7) fica como

(7*)

u(E )



u(N )



u(W )



u(S )



4 u(x, y)  h2ƒ(x, y). N

(x, y + h) (x, y + k)

(x – h, y)

h k

h

h

k h

(x + h, y)

h

(x – h, y)

h

(x, y)

(x + h, y)

W

h

h

E

(x, y)

(x, y) h

h (x, y – k)

(a) Pontos em (5) e (6)

(x, y – h)

S

(b) Pontos em (7) e (8)

(c) Notação em (7*)

Fig. 452 Pontos e notações em (5)–(8) e (7*)

Nossa aproximação de h2 2u em (7) e (8) é uma aproximação de 5 pontos obtida usando-se o esquema de coeficientes ou estêncil (também chamado de padrão, molécula ou estrela). 1 (9)

 1

4

1



1 . Nós podemos agora escrever (7) como

1

1

4

1 u

h2ƒ(x, y ).

1

Problema de Dirichlet Nos métodos numéricos empregados no problema de Dirichlet, em uma região R, escolhemos um h e introduzimos uma grade quadrada de linhas retas verticais e horizontais de distância h. As interseções dessas linhas são chamadas de pontos da malha (ou pontos da treliça ou nós). Veja a Fig. 453. Então, obtemos uma aproximação da EDP dada usando uma equação de diferença [(8) para a equação de Laplace], que relaciona os valores desconhecidos de u nos pontos da malha em R a cada um dos demais valores e aos valores de contorno dados (detalhes a seguir). Isto gera um sistema linear de equações algébricas. Resolvendo-o, obtemos as aproximações dos valores desconhecidos de u nos pontos da malha em R . Veremos que o número de equações é igual ao número de incógnitas. Agora vem um ponto importante. Se o número de pontos internos da malha, que podemos chamar de p, for pequeno, digamos, p < 100, então se pode aplicar um método direto de solução a esse sistema linear de p < 100 equações em p incógnitas. Entretanto, se p for grande, surgirá um problema de armazenamento. Ora, como cada incógnita está relacionada a somente 4 de suas vizinhas, a matriz de coeficientes do sistema é uma matriz isto10.000, é, uma quando matriz com um número esparsa, em relativamente pequeno de elementos não-nulos (por exemplo, 500 elementos Logo, p = 100). para p grande, podemos evitar os problemas de armazenagem usando um método iterativo, notavelmente o de Gauss–Seidel (Seção 20.3), que no caso das EDPs é também chamado de método de Liebmann. Lembre que, neste método, em termos de armazenagem, temos a conveniência de poder sobrescrever qualquer componente da solução (valor de u) tão logo um “novo” valor fique disponível. Ambos os casos, tanto o de p grande quanto o de p pequeno, são de interesse em engenharia: p grande se uma grade refinada for usada para se obter uma alta precisão; e p pequeno se os valores de contorno forem conhecidos apenas de uma maneira um tanto quanto imprecisa, de modo que uma grade grosseira resolverá o problema, visto que, neste caso, não faria sentido tentar obter uma maior precisão no interior da região R.

110

Parte E • Análise Numérica

Ilustremos este método com um exemplo, mantendo o número de equações pequeno por simplicidade. Por conveniência, usaremos as seguintes notações para os pontos da malha e os correspondentes valores da solução (e das soluções aproximadas)(veja também a Fig. 453) (10)

Pij



( ih, jh),

uij



u(ih, jh).

y

Pij P12

P22

P11

P21

P31

x

5h

0

Fig. 453. Região do plano xy coberta por uma rede com malha h , mostrando também os nós P11 = ( h, h), , Pij = ( ih, jh), •











Com esta notação, podemos escrever (8) para qualquer ponto de malha Pij na forma (11) EXEMPLO 1

ui1, j



ui, j1



ui1, j



ui, j1



4 uij  0.

Equação de Laplace. Método de Liebmann Numa chapa quadrada e constituída de material homogêneo, seus quatro lados têm 12 cm cada um e são mantidos às temperaturas constantes de 0°C e 100°C, conforme mostra a Fig. 454a. Usando uma grade (muito grande) com malhas de 4 cm e aplicando o método de Liebmann (isto é, a iteração de Gauss–Seidel), ache a temperatura (permanente) nos nós.

Solução. No caso da independência em relação ao tempo, a equação do calor (veja a Seção 10.8) ut



c 2(uxx  uyy)

se reduz à equação de Laplace. Logo, para esta última, temos um problema de Dirichlet. Escolhamos a grade mostrada na Fig. 454b e consideremos os nós na ordem P , P , P , P . Usamos então (11) e, em cada equação, passamos para o lado direito todos os termos resultantes 11 21 12 22 dos valores de contorno dados. Então, obtemos o sistema  200 4u11  u21  u12 u11

(12)



4u21 

u11 u21



4u12 u12



u22

 

200



u22

 

100

4u22

 

100.



Na prática, poderíamos resolver um sistema pequeno como esse pela eliminação de Gauss, encontrando u11  u21  87,5, u12  u22  62,5. Valores mais exatos (exatos até 3S) da solução do problema real [diferentemente do seu modelo (12)] são 88,1 e 61,9, respectivamente. (Estes valores foram obtidos por série de Fourier.) Logo, o erro é de cerca de 1%, um resultado surpreendentemente preciso para uma rede com um tamanho de malha h tão grande. Se o sistema de equações fosse grande, nós o resolveríamos por um método indireto, como o de Liebmann. No caso de (12), fazemos isto do seguinte modo. Escrevemos (12) na forma (dividindo por –4 e passando os termos para o lado direito) u11



u21



0,25u11

u12



0,25u11

u22



0,25u21  0,25u12



50



0,25u22  50



0,25u22  25

0,25u21  0,25u12



25.

Estas equações são agora usadas na iteração de Gauss–Seidel. Elas são idênticas a (2) na Seção 20.3 onde u11  x1, u21  x2, u12  x3, u22  x4, e onde também a iteração é explicada, escolhendo-se os números 100, 100, 100, 100 como valores iniciais. Poupa-se algum trabalho escolhendo-se melhores valores iniciais, geralmente calculando-se a média dos valores de contorno que entram no sistema linear. Asolução exata do sistema ué11  u21  87,5, u12  u22  62,5, como se pode verificar.

Observação. É interessante notar que, se escolhermos um tamanho de malha h = L/n (L = lado de R) e considerarmos os ( n – 1)2 nós internos (isto é, os nós não situados sobre o contorno), linha a linha na ordem P11, P21,







, Pn

, P12, P22,

1,1



então o sistema de equações terá a matriz de coeficientes ( n – 1) 2 × (n – 1) 2





, Pn

,

1,2







,

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs) u=0

y

111

u=0

12 u = 100 R

u = 100

0 0

P02

P12

P22

P01

P11

P21

P10

P20

u = 100

x

12 u = 100

u = 100

(a) Problema dado

(b) Grade e nós

Fig. 454. Exemplo 1

(13)

A



B

I

I

B

I •

.





I

 

Aqui

B

I

I

B

4

1

1

4

1 •

B





1

4

1

1

4



é uma matriz (n – 1) × ( n – 1). (Em (12), temos n = 3, ( n – 1) 2 = 4 nós internos, duas sub-matrizes B e duas sub-matrizes I.) A matriz A é não-singular. Isto decorre notando-se que, em cada linha de A, os elementos fora da diagonal têm soma 3 (ou 2), ao passo que cada elemento da diagonal de A é igual a –4, o que implica a ocorrência de não-singularidade pelo teorema de Gerschgorin na Seção 20.7, visto que nenhum disco de Gerschgorin pode incluir 0. 

Dizemos que uma matriz chama-se matriz banda se ela tiver todos os elementos não-nulos em sua diagonal principal e nas linhas diagonais paralelas a ela (separadas ou não por linhas diagonais de zeros). Por exemplo, A em (13) é uma matriz banda. Embora o método de eliminação de Gauss não preserve os zeros entre as bandas, ele tampouco introduz elementos diferentes de zero fora dos limites definidos pelas bandas srcinais. Logo, uma estrutura de banda é vantajosa. Em (13), ela foi conseguida por meio de um cuidadoso ordenamento dos nós da malha.

Método ADI Uma matriz é chamada de matriz tridiagonal se ela possuir todos os seus elementos não-nulos na diagonal principal e nas duas linhas diagonais paralelas situadas acima e abaixo da diagonal principal. (Veja também a Seção 20.9.) Neste caso, a eliminação de Gauss se torna particularmente simples. Isto levanta a questão de, na solução do problema de Dirichlet para as equações de Laplace ou de Poisson, se poder obter um sistema de equações cuja matriz dos coeficientes seja tridiagonal. A resposta é sim, e um método popular desse tipo, chamado de método ADI (método implícito de direção alternada)*, foi desenvolvido por Peaceman e Rachford. A idéia é a seguinte. Em (9), o estêncil mostra que poderíamos obter uma matriz tridiagonal se houvesse somente os três pontos em uma linha (ou somente os três pontos em uma coluna). Isto sugere que escrevamos (11) na forma (14a)

ui1, j



4 uij  ui

1, j

 ui, j1 

ui, j1

de modo que o lado esquerdo pertence somente à linha j de y e o lado direito pertence à coluna i de x. Naturalmente, também podemos escrever (11) na forma (14b) ui, j 1  4 uij  ui, j 

1

 ui1, j 

ui1, j

de modo que o lado esquerdo pertença à Coluna i, e o lado direito, à Linha j. No método ADI, procedemos por iteração. Em cada nó, escolhemos um valor inicial arbitrário u ij(0). Em cada iteração, calculamos novos valores em todos os nós. Em uma iteração, usamos uma fórmula iterativa resultante de (14a) e, na próxima iteração, uma fórmula iterativa resultante de (14b), e assim por diante alternadamente. *ADI: abreviatura da expressão srcinal em inglês ( alternating direction implicit method ).

(N. T.)

112

Parte E • Análise Numérica

Um detalhe: suponha que tenham sido calculadas as aproximações u ij(m). Então, para obtermos as próximas aproximações u ij(m 1), substituímos os u ij(m) no lado direito de (14a) e resolvemos para os u ij(m 1), no lado esquerdo; ou seja, usamos 



(15a)

u (im1, 1) j

4 u(ijm

u (im1, 1) j

1)

) u (im ,j 1

) u (im , j 1.

Utilizamos (15a) para um j fixo, isto é, para uma linha fixa j, e para todos os nós internos nesta linha. Isto fornece um sistema linear de N equações algébricas (N = número de nós internos por linha) em N incógnitas, que são as novas aproximações de u nesses nós. Note que (15a) envolve não somente as aproximações calculadas na iteração anterior, mas também os valores de contorno dados. Resolvemos o sistema (15a) (com j fixo!) pela eliminação de Gauss. Então, passamos para a próxima linha, obtemos um outro sistema de N equações, resolvêmo-lo por Gauss e assim por diante, até que todas as linhas sejam processadas. Na iteração seguinte, alternamos a direção, ou seja, calculamos as próximas aproximações u ij(m 2) coluna a coluna, a partir dos valores de u ij(m 1) e dos valores de contorno dados, usando uma fórmula obtida de (14b) pela substituição de u ij(m 1) no lado direito: 





(15b)

u (im ,j

4u ij(m

2) 1

u (im ,j

2)

2) 1

u (im1, 1) j

u (im1, 1) j .

Para cada i fixo, ou seja, para cada coluna, este é um sistema de de M equações (M = número de nós internos por coluna) com M incógnitas, que resolvemos pela eliminação de Gauss. Então, passamos para a próxima coluna, e assim por diante, até que todas as colunas sejam processadas. Consideremos um exemplo que meramente servirá para explicar todo o método. EXEMPLO 2

Problema de Dirichlet. Método ADI Explique o procedimento e as fórmulas do método ADI em termos do problema no Exemplo 1, usando a mesma grade e os valores iniciais 100, 100, 100, 100.

Solução. Enquanto trabalhamos, devemos ficar de olho na Fig. 454b e nos valores de contorno dados. Obtemos as primeiras aproximações (1) (1) (1) u (1) 11, u 21, u 12, u 22 de (15a) com m  0. Escrevemos os valores de contorno contidos em (15a) sem os índices superiores, para termos uma melhor identificação e para indicarmos que esses valores dados permanecem os mesmos durante a iteração. De (15a) com m = 0, temos para j = 1 (primeira linha), o sistema (i (i

A solução é u (1) 11

A solução é u (1) 12

(1)

u 21

u (1) 22

1) 2)

u01

(1)

(1)

11 4u (1)

u 21 4u (1) 21

u 11

(0)

u31

u10 u20

u 12 (0) u 22.

100. Para j = 2 (segunda linha), obtemos de (15a) o sistema (i

1)

(i

2)

u02

4u (1) 12

u (1) 22

(1)

4u (1) 22

u 12

u (0) 11 u32

(0)

u 21

u13 u23.

66,667.

(2) (2) (2) As segundas aproximaçõesu (2) 11, u 21, u 12, u 22 são agora obtidas de (15b) com m = 1 pelo uso das primeiras aproximações recém-calculadas e dos valores de contorno. Para i = 1 (primeira coluna), obtemos de (15b) o sistema

(j (j

A solução é

u (2) 11

91,11,

u (2) 12

1)

u10

4u (2) 11

u (2) 12

u (2) 11

u (2) 12

2)

4

u13

u01

u (1) 21

u02

u (1) 22.

64,44. Para i = 2 (segunda coluna), obtemos de (15b) o sistema (j

1)

(j

2)

u20

4u (2) 21

u (2) 22

u (2) 21

4u (2) 22

u23

u (1) 11

u31

(1) u 12

u32.

A solução é u (2) 91,11, u (2) 64,44. 21 22 Neste exemplo, que meramente serve para explicar os procedimentos práticos do método ADI, a precisão das segundas aproximações é quase a mesma das iterações de Gauss–Seidel que fizemos na Seção 20.3 (onde u11  x1, u21  x2, u12  x3, u22  x4), como mostra a tabela a seguir.

Método ADI,segundasaproximações Gauss–Seidel,segundasaproximações Soluçãoexatade(12)

u11

u21

u12

u22

91,11 93,75 87,50

91,11 90,62 87,50

64,44 65,62 62,50

64,44 64,06 62,50



Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

113

Melhorando a Convergência. Para melhorarmos ainda mais a convergência dos resultados do método ADI, usamos uma idéia interessante, que é a seguinte. Introduzindo um parâmetro p, podemos também escrever (11) na forma

(a) ui

1, j

(16)

(b) ui, j

1



(2



p) uij



ui1, j

 ui, j1 

(2



p) uij



ui, j1



(2



p) uij



ui, j1

 ui1, j 

(2



p) uij



ui1, j.

Isto fornece as fórmulas mais gerais de iteração ADI (a)

u (im1, 1) j

(2

p) u (ijm

1)

(b)

u (im ,j

(2

p) u (ijm

2)

(17)

2) 1

u (im1, 1) j

) u (im ,j

u i(m ,j

u (im1, 1) j

2) 1

1

(2

p) u (ijm)

(2

p) u (ijm

) u (im ,j 1 1)

u (im1,1) j .

Para p = 2, isto corresponde a (15). O parâmetro p pode ser usado para melhorar a convergência. De fato, podese mostrar que o método ADI converge para valores positivos de p e que o valor ótimo para a taxa máxima de convergência é (18)

p0



p

2 sen  K

onde K é o maior valor entre M + 1 e N + 1. Podemos obter resultados ainda melhores fazendop variar a cada iteração. Mais detalhes sobre o método ADI e suas variantes são discutidos na Ref. [E25] listada no Apêndice 1.

PROBLEMAS PROPOSTOS 21.4 1. Deduza (5b), (6b) e (6c).

10. (Grade 3  3) Resolva o Exemplo 1 escolhendoh = 3 e os valores iniciais 100, 100, . 11. Para o quadrado 0  x  4, 0  y  4, considere que as temperaturas sejam de 0°C nas bordas horizontais e de 50°C nas bordas Para a grade da Fig. 455, calcule o potencial nos quatro pontos interverticais. Determine as temperaturas nos pontos interiores de uma nos usando o método de Gauss, e por 5 iterações usando o métograde quadrada com h = 1. do de Gauss–Seidel, com os valores iniciais de 100, 100, 100, 100 12. Tente esboçar algumas isotermas usando a resposta do Problema 11. (mostrando bordas são: os detalhes do que fizer) se os valores de contorno nas 13. Encontre as 1isotermas para o quadrado e a grade1 do Problema 11 se u  sen 4 px nas bordas horizontais esen 4 py nas bordas 2. u = 0 à esquerda, x3 na borda inferior, 27 – 9y2 à direita, x3 – 27x verticais. Tente esboçar algumas isotermas. na borda superior. 14. (Influência dos valores iniciais) Resolva o Problema 5 por Gauss– 3. u(1, 0) = 60, u (2, 0) = 300, u = 100 nas outras três bordas. Seidel, começando de0. Compare e comente. 4. u = x4 na borda inferior, 81 – 54y2 + y4 à direita, x4 – 54x2 + 15. Encontre o potencial na Fig. 456 usando: (a) a grade grosseira, (b) 81 na margem superior, y4 à esquerda. Verifique a solução exata a grade refinada junto com a eliminação de Gauss.Sugestão: em x4 – 6x2y2 + y4 e determine o erro. (b), use a simetria; considereu = 0 como valor de contorno nos 1 5. u  sen 3 px na borda superior, 0 nas demais. 10 iterações. dois pontos nos quais o potencial dá um salto. 6. u = 220 nas bordas superior e inferior, 110 à esquerda e à direita. u = 110 V 7. V0 nas bordas superior e inferior, –V0 à esquerda e à direita. Esboce as linhas eqüipotenciais. 2–7

ELIMINAÇÃO DE GAUSS, ITERAÇÃO DE GAUSS–SEIDEL







u = 110 V

3 2 y

1

P12

P22

P11

P21

P12

u = 110 V

P11 u = –110 V

0

u = –110 V

u = –110 V

0

1

x

2

3

Fig. 455. Problemas 2–7

Fig. 456. Região e grades do Problema 15

16. (ADI) Aplique o método ADI ao Problema 5, de Dirichlet, usando, 8. Verifique os cálculos no Exemplo 1. Descubra experimentalmente como antes, a grade da Fig. 455 e valores iniciais nulos. quantas iterações são necessárias para se obter a solução do sistema 17. Qual p0 em (18) deveria ser escolhido para o Problema 16? Aplique linear com uma precisão de 3S. ao Problema 16 as fórmulas ADI (17) comp0 = 1,7, realizando 9. (Uso de simetria) Usando os valores de contorno do Exemplo 1, 1 iteração. Mostre a melhoria da convergência por meio de uma conclua que u21 = u11 e u22 = u12 . Mostre que isto leva a um sistema comparação com os valores correspondentes de 0,077, 0,308 após a de duas equações e resolva-o. primeira iteração no Problema 16 (use os valores iniciais nulos).

114

Parte E • Análise Numérica

18. PROJETO DE ÁLGEBRA COMPUTACIONAL. Equação de Laplace (a) Escreva um programa para Gauss–Seidel com 16 equações em 16 incógnitas, compondo a matriz (13) a partir das submatrizes 4  4 indicadas e incluindo uma transformação do vetor dos valores de contorno para o vetorb de Ax = b.

(b) Aplique o programa à grade quadrada em 0 x  5, 0  y  5 com h = 1 e u = 220 nas bordas superior e inferior,u = 110 na borda esquerda eu = –10 na borda direita. Resolva o sistema linear também pela eliminação de Gauss. Que precisão será atingida na vigésima iteração de Gauss–Seidel?

21.5 Problemas de Neumann e Problemas Mistos. Contorno Irregular

Continuemos nossa discussão de problemas de valor de contorno para EDPs elípticas em uma região R no plano xy. O problema de Dirichlet foi estudado na última seção. Resolvendo o problema de Neumann e o problema misto (definidos na última seção), deparamo-nos com uma nova situação, visto não haver pontos do contorno nos quais a derivada normal (exterior) un = ∂u/∂n da solução é dada, mas a própria u é desconhecida, já que ela não é dada. Para manipular esses pontos, precisamos de uma nova idéia, que é a mesma utilizada tanto nos problemas de Neumann quanto nos problemas mistos. Logo, podemos explicá-la em conexão com um desses dois tipos de problemas. Isto é o que faremos agora, considerando um exemplo típico, que é o seguinte. EXEMPLO 1

Problema de Valor de Contorno Misto para a Equação de Poisson Resolva o problema do valor de contorno misto para a equação de Poisson 2



u



uxx  uyy



ƒ( x, y)  12 xy

mostrada na Fig. 457a.

y

P13

P23

P12

P22

un = 6x P02

1,0

1,0

P32

un = 3 un = 6 u = 3

u=0

3

u = 3y

P

R

P

u 01 =0

0,5

P

11

21

P10

P20

P 31

u = 0,375

u=0

0 0

0

x

1,5

u=0 u=0 0,5 1,0 1,5

0

u=0

(a) Região Re valoresdecontorno

(

b) Grade (h = 0,5)

Fig. 457. Problema do valor de contorno misto do Exemplo 1 Solução. Usemos a grade mostrada na Fig. 457b, onde h = 0,5. Lembremos que (7) na Seção 21.4 tem o lado direito h 2ƒ(x, y)  0,5 2 12 xy  3 xy . Usando as fórmulas u = 3y3 e un = 6x dadas para o contorno, calculamos os dados referentes a esse contorno (1)

u31



0,375,

u32



 n u12

3,



 y u12



   6 n y u22

6 0,5  3, 

u22



1





6.

P11 e P21 são nós internos e podem ser manipulados como na última seção. Com efeito, de (7) na Seção 21.4, com h2 = 0,25 e h2f(x, y) = 3xy e dos valores de contorno dados, obtemos duas equações correspondentes a P11 e P21, como se segue (com –0 resultante do contorno esquerdo). 

4u11 

u21



u12



12(0,5 0,5) 



1 4



0

0,75



(2a) 









1





u11 u22 4u21 12(1 0,5) 4 0,375 1,125 A única dificuldade com essas equações parece ser o fato de que elas envolvem os valores desconhecidos u12 e u22 de u em P12 e P22 no contorno, onde a derivada normal un = ∂u/∂n = ∂u/∂y é dada, ao invés de u; porém, superaremos esta dificuldade do seguinte modo. Consideremos P 12 e P22. A idéia que irá nos ajudar aqui é a seguinte. Imaginemos a região R sendo estendida para cima até a primeira linha de nós externos (correspondendo a y = 1,5), e suponhamos que a equação de Poisson também se verifica nesta região estendida. Podemos então escrever duas outras equações como antes (Fig. 457b) 

u11

(2b) u21



4u12  u12



u22

4u22



u13 

u23



1,5  0



3



3





0.

1,5

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

115

À direita, 1,5 é 12xyh2 em (0,5, 1) e 3 é 12 xyh2 em (1, 1), e 0 (em P02) e 3 (em P32) são os valores de contorno dados. Lembremos que ainda não utilizamos a condição de contorno na parte superior do contorno de R e notemos também que, em (2b), introduzimos mais duas incógnitas u13 e u23. Mas podemos agora usar essa condição e assim eliminarmos u13, u23 aplicando a fórmula da diferença central para du/dy. De (1), obtemos então (veja a Fig. 457b)

 2  2   y

u13

u22

u23

u12

3 6



u11

h

y



u21

h



u13



u11,

logo

u13



u11



3



u23



u21,

logo

u23



u21



6.

Substituindo estes resultados em (2b) e simplificando, temos  4u12  2u11

u22



1,5  3

2u21  u12  4u22



3



3

1,5

 



6

 

6.

Junto com (2a) isto fornece escrevendo-se na forma matricial,



(3)

4

1

1

1

4

0

2

0

4

0

2

1

0

u11

0,75

1

u21

1,125

1

u12

1,5

4

u22

0

     

0,75 1,125

3

.

1,5

6

6

(Os elementos 2 vêm de u13 e u23, o mesmo ocorrendo com –3 e –6 à direita.) A solução de (3) (obtida pela eliminação de Gauss) é como se segue; os valores exatos do problema estão dados entre parênteses. u12



0,866 (1 exato)

u22



1,812 (2 exato)

u11



0,077 (0,125 exato)

u21



0,191 (0,25 exato).



Contorno Irregular Continuemos nossa discussão dos problemas de valor de contorno para EDPs elípticas em uma região R do plano xy. Se R tem uma forma geométrica simples, usualmente podemos arranjar que alguns nós se situem no contorno C de R, e então podemos obter aproximações das derivadas parciais pela maneira explicada na última seção. Entretanto, se C intercepta a grade em pontos que não são nós, então, em pontos próximos do contorno, precisamos proceder de modo diferente, como se segue. O nó O na Fig. 458 é desse tipo. Para O e seus vizinhos A e P, obtemos a partir do teorema de Taylor 1 2uO u (a) uA  uO  ah O   ( ah)2   2 x 2 x (4) uO 1 2 2uO (b) uP  uO  h    h  .  x 2 x 2 •











Desconsideramos os termos assinalados por pontos e eliminamos uO /x. A Equação (4b) multiplicada por a e somada à equação (4a) fornece 1 2uO . uA  auP  (1  a) uO   a (a  1) h2  2 x 2 B bh P

O

A

ah h

C

Q

Fig. 458. Curva de contorno C de uma região R, um nó O próximo a C, e os vizinhos A, B, P, Q

Resolvemos algebricamente para a derivada esta última equação, obtendo uO

2

x2

h2

2



1 a(1

a)

uA

1 1

a

uP

1 a

uO

.

116

Parte E • Análise Numérica

Similarmente, considerando os pontos O, B e Q, uO

2

y2

h2

2



1 b(1

b)

1

uB

1

1

uQ

b

b

uO

.

Por adição, (5)

2

2

uO

h2



uA

uB

a (1

a)

uP

b (1

b)

1

(a

uQ

1

a

b) uO

b

ab

.

Por exemplo, se a = , b = , então ao invés do estêncil (ver a Seção 21.4) 1 2

1 2

_

1 1

4 3

4

 

1

_2

agoratemos

4

3

 

1

_. 4 3

_

2 3

Porque 1/[a(1  a)]  43 etc. A soma de todos os cinco termos ainda é igual a zero (o que é útil na verificação). Usando essas mesmas idéias, você pode mostrar isto para o caso da Fig. 459. (6)

2

uO

2 h2



uA a(a

uB p)

uP

b(b

q)

p( p

uQ a)

q(q

ap b)

bq

abpq

uO

,

uma fórmula que abarca todos os casos concebíveis. B bh ph

P

ah

O

A

qh Q

Fig. 459. Pontos A, B, P, Q vizinhos de um nó O e notações na fórmula (6)

EXEMPLO 2

Problema de Dirichlet para a Equação de Laplace. Contorno Curvo

Encontre o potencial u na região da Fig. 460 que possui os valores de contorno dados naquela figura; aqui, a porção curva do contorno é um arco do círculo de raio 10 em torno de (0, 0). Use a grade da figura. , Solução. u é uma solução da equação de Laplace. Usando as fórmulas dadas para os valores de contorno u  x 3, u  512  24 y 2, calculamos os valores nos pontos onde necessitamos desses valores; o resultado está mostrado na figura. Para P11 e P12, temos o costumeiro estêncil regular e, para P21 e P22, usamos (6), obtendo •

  

  

1

(7)

P11, P 12:

1

4

0,5

1 ,

P21:

0,6

1

2,5

0,9

0,9 ,

P22:

0,6

0,5

3

0,9 .

0,6

3

y

u = x – 243x u = –702

9

3

u = 4x – 300x u = –936

6

u=0

P12

P22

u=0

P11

P21

u = 27

u= 216

u = –352 2

u = 512 – 24 y

u=0

3

0

0

3 u=x

6

u = 296

8

x

3

Fig. 460. Região, valores de contorno do potencial e grade do Exemplo 2 Utilizamos isto e os valores de contorno, e tomamos os nós na ordem costumeira: P11, P21, P12, P22. Então, obtemos o sistema





Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs) 4 u11

u21

0,6 u11

2,5 u21

0

u12

0,5 u22 4 u12

u22

0,6 u12

3 u22

u11

0,6 u21

27

27

0,9 296

0,5



702

117



216

374,4

936

1159,2.

0

702

0,9 352

0,9





Na forma matricial,



(8)

4

1

1

0,6

2,5

0

1

0

4

0

0,6

0,6

0

u11

27

0,5

u21

374,4

1

u12

702

3

u22

1159,2

  

.

A eliminação de Gauss fornece os valores (arredondados) u11 = –55,6, u21 = 49,2, u12 = –298,5, u22 = –436,3. Obviamente, de uma grade com tão poucos nós, não podemos esperar uma grande precisão. A solução exata da EDP (não da equação de diferença) com os valores de contorno dados é u = x3 – 3xy2 e fornece os valores u11 = –54, u21 = 54, u12 = –297, u22 = –432. Na prática, usaríamos uma grade muito mais refinada e empregaríamos um método indireto para resolver o grande sistema resultante.



PROBLEMAS PROPOSTOS 21.5 1. Verifique o cálculo para a equação de Poisson no Exemplo 1. Con- 10. Resolva  2u  p2y sen 1 px para a grade da Fig. 461 eu (1, 3) y 3 fira os valores de (3) no final. 1  uy(2, 3)  2  243, u  0 nos outros três lados do quadrado. 1 2. Deduza (5), em particular quandoa = b = 2 . CONTORNOS IRREGULARES 3. Deduza com todos os detalhes a fórmula geral do estêncil (6). 4. Verifique o cálculo para o problema de valor de contorno do Exem- 11. Resolva a equação de Laplace para a região e os valores de contorno mostrados na Fig. 462, usando a grade indicada. (A porção plo 2. diagonal do contorno éy = 4,5 – x.) 5. Faça o Exemplo 1 do texto para 2u  0 com a grade e dados de y u=0 contorno como antes.

PROBLEMAS DE VALOR DE CONTORNO MISTO

2

3

u = x – 1,5x

6. Resolva o problema de valor de contorno misto para a equação de 2 P12 P22 Laplace  2u  0 no retângulo da Fig. 457a (usando a grade da u=0 u = 9 – 3y Fig. 457b) e as condições de contornoux = 0 na borda esquerda, 1 P11 P21 ux = 3 na borda direita, u = x2 na borda inferior e u = x2 – 1 na 0 borda superior. x 0123 7. Resolva o Problema 6 quandoun = 1 na borda superior eu = 1 u = 3x nas demais bordas. Fig. 462. Problema 11 8. Resolva o problema do valor do contorno misto para a equação de Poisson  2u  2(x 2  y 2) para a região e as condições de contorno 12. Se, no Problema 11, os eixos estiverem aterrados u( = 0), qual deve mostradas na Fig. 461, usando a grade indicada. ser o potencial constante que a outra porção do contorno deve ter para produzir 100 volts emP11? y 2 u = 9x 13. Que potencial temos no Problema 11 seu = 190 volts nos eixos e 3 u = 0 na outra porção do contorno? P12 P22 14. Resolva a equação de Poisson2u  2 para a região e os valoresde 2 contorno mostrados na Fig. 463 usando a grade também mostrada P11 P21 2 u=0 na figura. u = 6y 1

0 0123 u=0

y

x

3

x

Fig. 461. Problemas 8 e 10

2

u=0

P12

u = y – 3y

1,5 2

9. EXPERIMENTO DE ÁLGEBRA COMPUTACIONAL. Problema Misto. Faça o Exemplo 1 do texto com grades progressivamente mais refinadas de sua própria escolha, e estude a precisão dos valores aproximados, comparando-os com a solução exatau = 2xy3. Verifique esta última.

P11

u = y – 1,5y

P21

0 0

3 u=0

Fig. 463. Problema 14

x

118

Parte E • Análise Numérica

21.6 Métodos para EDPs Parabólicas As duas últimas seções trataram das EDPs elípticas e agora passaremos para as EDPs parabólicas. Lembre que as definições de EDPs elípticas, parabólicas e hiperbólicas foram dadas na Seção 21.4. Lá também se mencionou que o comportamento geral das soluções difere tipo a tipo, o mesmo ocorrendo com os problemas de interesse prático. Isto se reflete nos métodos numéricos do seguinte modo. Para todos os três tipos, substituímos a EDP por uma correspondente equação de diferença mas, para as EDPs parabólicas e as hiperbólicas, isto não garante automaticamente a convergência da solução aproximada em direção à solução exata à medida que o tamanho da malha h 0; de fato, isto não garante nem mesmo a própria convergência. Para esses dois tipos de EDPs, precisamos de condições adicionais (desigualdades) para nos assegurarmos da convergência e da estabilidade, esta última significando que pequenas perturbações nos dados iniciais (ou pequenos erros a qualquer momento) causam somente pequenas alterações posteriormente. Nesta seção, explicaremos a solução numérica do protótipo das EDPs parabólicas, a equação do calor unidimensional →

ut = c2uxx

(c constante)

Esta EDP é usualmente considerada para x em algum intervalo fixo, digamos, 0  x  L , e para o tempo t  0; prescrevem-se a temperatura inicial u(x, 0) = f(x) (f dada) e as condições de contorno em x = 0 e x = L para todo t  0, por exemplo, u(0, t) = 0, u(L, t) = 0. Podemos fazer c = 1 e L = 1; isto sempre pode ser conseguido por uma transformação linear de x e t (Problema 1). Então, a equação do calor e essas condições são (1)

ut

(2)

u(x,

(3)

u(0, t)



0  x  1, t  0

uxx

0)  ƒ( x)



u(1, t0)

(Condição inicial) (Condições de contorno).



Uma simples aproximação de (1) por diferença finita é [veja (6a) na Seção 21.4; j é o número da iteração temporal]  1 ( ui, j1  uij) 

(4)

k

ui  h12 (

1, j



2 uij  ui

).

1, j

A Fig. 464 mostra uma grade correspondente e os nós. O tamanho da malha é h na direção x e k na direção t. A fórmula (4) envolve os quatro pontos mostrados na Fig. 465. À esquerda, em (4), usamos um quociente de diferença progressivo, uma vez que não temos informações sobre t negativo no início. A partir de (4), calculamos ui,j+1, que corresponde à linha do tempo j + 1, em termos das três outras u que correspondem à linha do tempo j. Resolvendo (4) para u i,j+1, temos (5)

ui, j1



(1



2 r)uij  r (ui

1, j



ui1, j),

r



k

2 . h

t

( j = 3) ( j = 2)

u=0

u=0

(i, j + 1)

( j = 1) k h

0

k

0

1

x

(i – 1, j)

u = f(x)

Fig. 464. Grade e os nós correspondentes a (4), (5)

Fig. 465.

h

(i, j)

h

(i + 1, j)

Os quatro pontos em (4) e (5)

Os cálculos, por este método explícito baseado em (5) são simples. Entretanto, pode-se mostrar que a condição a seguir é fundamental para a convergência deste método: k 1 (6) r   . 2 h2

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

119

Ou seja, uij deve ter um coeficiente positivo em (5) ou (para r = 12 ) estar ausente de (5). Intuitivamente, (6) significa que não devemos nos afastar muito rapidamente na direção t. Um exemplo disto é dado a seguir.

Método de Crank–Nicolson A condição (6) é um obstáculo na prática. Com efeito, para conseguirmos precisão suficiente, nossa escolha para h tem que ser pequena, o que torna k muito pequeno, segundo (6). Por exemplo, se h = 0,1, então k  0,005. Dessa forma, devemos buscar uma discretização mais satisfatória para a equação do calor. Um método que não impõe qualquer restrição a r = k/h2 é o método de Crank–Nicolson, que utiliza valores de u em seis pontos da Fig. 466. Sua idéia é substituir, no lado direito de (4), o quociente da diferença pela metade da soma de dois desses quocientes da diferença em duas linhas de tempo (veja a Fig. 466). Em vez de (4), temos então 1 k

(7)

(ui, j

1 (u 2h 2 i 1 (u 2h 2 i

uij )

1

2uij

1, j

1, j

2ui, j

1

1

)

ui

1, j

ui

1, j

).

1

Multiplicando por 2k e escrevendo r = k/h como antes, agrupamos os termos correspondentes à linha de tempo j + 1 no lado esquerdo, e os termos correspondentes à linha de tempo j no lado direito: 2

(2  2 r) ui, j

(8)



1

r (ui1, j1



ui1, j1)



(2



2 r) uij  r (ui

1, j



ui1, j).

Como utilizar (8)? Em geral, os três valores à esquerda são desconhecidos, enquanto os três à direita são conhecidos. Se dividirmos o intervalo x, 0  x  1 em (1), em n intervalos iguais, teremos n – 1 nós internos por linha de tempo (veja a Fig. 464, onde n = 4). Então, para j = 0 e i = 1, , n – 1 , a fórmula (8) fornece um sistema linear de n – 1 equações para os n – 1 valores incógnitos u11, u21, , un–1,1 da primeira linha de tempo em termos dos valores iniciais u00, u10, , un0 e dos valores de contorno u01 (= 0), u n1 (= 0). Algo similar ocorre para j = 1, j = 2, e assim por diante; ou seja, para cada linha de tempo, temos que resolver esse sistema linear de n – 1 equações resultando de (8). Embora r = k/h2 não seja mais restrito, menores valores de r ainda produzirão resultados melhores. Na prática, escolhe-se um k que possibilite poupar uma considerável quantidade de trabalho, sem que se faça r muito grande. Por exemplo, freqüentemente r = 1 é uma boa escolha (o que seria impossível no método anterior). Assim, (8) torna-se simplesmente •











4ui, j

(9)







1



ui1, j1



ui1, j1



ui1, j



ui1, j .

0,20

j=5

0,16

j=4

0,12 0,08 0,04

Linha de tempo j + 1 k

Linha de tempo j

h

h

Fig. 466. Os seis pontos nas fórmulas de Crank– Nicolson (7) e (8)

EXEMPLO 1

t=0 x=0 i=0

j=3 P12

P22

P11

P21

P10

P20

0,2 i=1

0,4 i=2

j=2 j=1 P30

0,6 i=3

P40

0,8 i=4

j=0 1,0 i=5

Fig. 467. Grade do Exemplo 1

Temperatura em uma Barra Metálica. Método de Crank–Nicolson, Método Explícito Considere uma barra metálica lateralmente isolada, de comprimento 1 e tal que c2 = 1 na equação do calor. Suponha que suas extremidades estejam mantidas à temperaturau = 0°C e que a temperatura da barra em algum instante t — digamos t = 0 —, seja dada por f(x) = sen px. Aplicando o método de Crank–Nicolson com h = 0,2 e r = 1, encontre a temperatura u(x, t) na barra para 0  t  0,2. Compare os resultados com a solução exata. Aplique também (5) com um r satisfazendo a (6), digamos, r = 0,25, e também com os valores não satisfazendo a (6), digamos, r = 1 e r = 2,5.

Solução por Crank–Nicolson. Como r = 1, a fórmula (8) toma a forma (9). Uma vez que h = 0,2 e r = k/h2 = 1, temos k = h2 = 0,04. Portanto, devemos executar 5 iterações. A rede está mostrada pela Fig. 467. Precisaremos dos valores iniciais

120

Parte E • Análise Numérica u10



sen 0,2p  0,587 785,

u20

sen 0,4p  0,951 057.



Além disso, u 30 = u20 e u 40 = u 10. (Lembre que u10 significa u em P10 na Fig. 467 etc.). Em cada linha de tempo na Fig. 467, existem 4 nós internos. Logo, em cada iteração temporal, teríamos que resolver quatro equações com quatro incógnitas. Porém, como a distribuição da temperatura inicial é simétrica em relação a x = 0,5 e u = 0 em ambas as extremidades para todo t, então temos que u31 = u21 e u 41 = u 11 na primeira linha de tempo, e algo similar para todas as demais linhas. Isto reduz cada sistema a duas equações com duas incógnitas. Por (9), visto que u31 = u21 e u 01 = 0, para j = 0 estas equações são (i  1)

4u11 

u21

(i  2)

u11 

4u21



u21



u00



u20



0,951 057



u10



u20



1,538 842.

A solução é u 11 = 0,399 274, u21 = 0,646 039. Similarmente, para a linha de tempo j = 1, temos o sistema (i  1)

4u12 

(i  2)

u12 

u22



u01



u21



0,646 039

3u22  u11  u21  1,045 313.

A solução é u12 = 0,271 221, u22 = 0,438 844, e assim por diante. Isto fornece a distribuição de temperatura (Fig. 468): t

0,00 0,04 0,08 0,12 0,16 0,20

x



0

x

0 0 0 0 0 0



0,2

x

0,588 0,399 0,271 0,184 0,125 0,085



0,4

x

0,951 0,646 0,439 0,298 0,202 0,138



0,6

0,951 0,646 0,439 0,298 0,202 0,138

x



0,8

0,588 0,399 0,271 0,184 0,125 0,085

x



1

0 0 0 0 0 0

u(x, t)

1

t=0

t = 0,04 t = 0,08

0,5

0 0

0,5

1 x

Fig. 468. Distribuição de temperatura na barra do Exemplo 1

Comparação com a solução exata. O problema atual pode ser resolvido de modo exato por separação de variáveis (Seção 12.5); o resultado é (10)

u(x, t)

sen px e



p

2

.

t

Solução pelo método explícito(5) com r = 0,25. Para h = 0,2 e r = k/h2 = 0,25, temos que k = rh2 = 0,25  0,04 = 0,01. Logo, temos que executar quatro vezes mais iterações do que teríamos com o método de Crank–Nicolson! A fórmula (5) com r = 0,25 é (11)

ui, j1



0,25( ui

1, j



2 uij  ui1, j).

De novo podemos usar a simetria. Para j = 0, precisamos de u00 = 0, u10 = 0,587 785, u20 = u30 = 0,951 057 e calculamos u11



0,25( u00  2 u10  u20)  0,531 657

u21



0,25( u10  2 u20  u30)  0,25( u10  3 u20)  0,860 239.

Naturalmente, podemos omitir os termos de contorno u01 = 0, u02 = 0







das fórmulas. Para j = 1, calculamos

u12



0,25(2 u11  u21)  0,480 888

u22



0,25( u11  3 u21)  0,778 094

e assim por diante. Temos que executar 20 iterações ao invés das 5 de CN, mas os valores numéricos mostram que a precisão agora só chega a ser aproximadamente igual à dos valores obtidos com o método de Crank–Nicolson. Os valores exatos até três dígitos decorrem de (10).

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

t

0,04 0,08 0,12 0,16 0,20

CN 0,399 0,271 0,184 0,125 0,085

x  0,2 Por(11) 0,393 0,263 0,176 0,118 0,079

Exato 0,396 0,267 0,180 0,121 0,082

x  0,4 Por(11) 0,637 0,426 0,285 0,191 0,128

CN 0,646 0,439 0,298 0,202 0,138

121

Exato 0,641 0,432 0,291 0,196 0,132

Falha de (5) com r violando (6). A fórmula (5) com h = 0,2 e r = 1, assim violando (6), é ui, j1



ui1, j



uij



ui1, j

e dá resultados muito ruins, alguns dos quais são t

x



0,2

Exato

x



0,4

Exato

0,363 0,588 0,04 0,396 0,641 0,139 0,225 0,12 0,180 0,291 0,053 0,086 0,20 0,082 0,132 A fórmula (5) com um valor ainda maior der = 2,5 (e h = 0,2 como antes) fornece resultados completamente absurdos, como, por exemplo, t

0,1 0,3

0,2

Exato

0,0265 0,0001

0,2191 0,0304

x



x

0,4

Exato

0,0429 0,0001

0,3545 0,0492.





PROBLEMAS PROPOSTOS 21.6 1. (Forma não-dimensional) Mostre que é possível transformar a equação do caloru t c 2 u xx , 0 x L na forma-padrão “nãodimensional” ut  uxx, 0  x  1, fazendo-se x  x/L, t  c 2 t /L2,  u u /u0, onde u0 é qualquer temperatura constante. 2. Deduza a aproximação da diferença (4) da equação do calor. 



a 1 se u(x, 0) = 0, com a extremidade esquerda estando isolada e a direita sendo mantida à temperaturag(t)  sen 503 pt. Sugestão: use 0  u0 j /x  ( u1 j  u 1, j)/2h. 

lateralmente isolada considere9. Em mos uma que barra a temperatura inicial sejaf(xde ) =comprimento x se 0  x 1,0,2, f(x) = 0,25(1 – x) se 0,2  x  1. Consideremos também queu(0, t) = 3. Deduza (5) de (4). 0, u(1, t) = 0 para todo t. Aplique o método explícito comh = 0,2 4. Usando o método explícito [(5) comh = 1 e k = 0,5], encontre a e k = 0,01. Faça cinco iterações. temperatura em t = 2 de uma barra de comprimento 10, lateralmente isolada com suas extremidades mantidas à temperatura 0 e 10. Resolva o Problema 9 paraf (x) = x se 0  x  0,5, f(x) = 1 – x temperatura inicial f(x) = x – 0,1x2. se 0,5  x  1, mantendo-se todos os demais dados como antes. Você poderia esperar que a solução satisfizesse au(x, t)  u(1  5. Resolva o problema do calor (1)–(3) por Crank–Nicolson para 0 x, t) para todo t?  t  0,20 com h = 0,2 e k  0,04 quando ƒ(x)  x se 0  x  1 , ƒ(x)  1  x se 12  x  1. Compare com os valores exatos 11. Resolva o Problema 9por (9) com h = 0,2 e duas iterações. Com2 para t = 0,20 obtido das séries (2 termos) da Seção 12.5. pare com os valores exatos obtidos com as séries da Seção 12.5 6. Resolva o Problema 5 pelo método explícito comh = 0,2 e k = 0,01. (2 termos) com coeficientes apropriados. Faça oito iterações. Compare os últimos valores com os valores 12. EXPERIMENTO DE ÁLGEBRA COMPUTACINAL. Com3S de Crank–Nicolson 0,107, 0,175 e os valores 3S exatos 0,108, paração de Métodos. 0,175. (a) Escreva programas para os métodos explícito e de Crank– 7. A precisão do método explícito depende der ( 12 ). Ilustre isto Nicolson. para o Problema 6, escolhendor = 12 ( e h = 0,2 como antes). Faça (b) Aplique esses programas ao problema do calor de uma barra quatro iterações. Compare os valores parat = 0,04 e 0,08 com os lateralmente isolada de comprimento 1 comu(x, 0)  sen px e valores 3S do Problema 6, que são 0,156, 0,254 t(= 0,04), 0,105, u(0, t)  u(1, t)  0 para todo t, usando h = 0,2 e k = 0,01 para t = 0,08). 0,170 ( o método explícito (20 iterações),h = 0,2 e (9) para o método 8. Se a extremidade esquerda de uma barra lateralmente isolada estende Crank–Nicolson (cinco iterações). Obtenha valores 6D exatos dendo-se de x = 0 a x = 1 é isolada, a condição de contorno emx usando uma série apropriada e compare. = 0 é un(0, t) = ux(0, t) = 0. Mostre que, na aplicação do método (c) Desenhe as curvas de temperatura em (b), usando duas figuras explícito dado por (5), podemos calcularu0, j+1 pela fórmula semelhantes à Fig. 296 na Seção 12.6. u 0, j 1  (1  2 r ) u 0j  2 ru 1 j . (d) Experimente comh menor (0,1, 0,05 etc.) para ambos os métodos a fim de descobrir até que ponto a precisão é aumentada devido Aplique isto com h = 0,2 e r = 0,25 para determinar a temperatura u(x, t) em uma barra lateralmente isolada estendendo-se dex = 0 à ocorrência de variações sistemáticas deh e k. 

122

Parte E • Análise Numérica

14. ƒ( x )  x (1  x ), h  0,1 (Compare com o Problema 13.) 15. ƒ( x )  5 x se 0  x  0,2, ƒ( x )  1,25(1  x ) se 0,2  x  1, h  0,2

13–15 CRANK–NICOLSON Resolva (1)–(3) por Crank–Nicolson com r = 1 (5 iterações), onde 13. ƒ( x )  x (1  x ), h  0,2

21.7 Método para EDPs Hiperbólicas Nesta seção, consideraremos a solução numérica de problemas envolvendo EDPs hiperbólicas. Explicaremos um método-padrão em termos de um arranjo típico para o protótipo de uma EDP hiperbólica, a equação da onda: (1) (2)

utt  uxx u(x, 0)  ƒ( x)

(3)

ut(x,

(4)

u(0, t)

0  x  1, t  0 (Deslocamento inicial dado)

0)  g(x)



u(1, t0)

(Velocidade inicial dada) (Condições de contorno).



Note que uma equação utt = c uxx e um outro intervalo x podem ser reduzidos à forma (1) por uma transformação linear de x e t. Isto é similar ao Problema 1 da Seção 21.6. Por exemplo, (1)–(4) é o modelo de uma corda elástica vibratória com as extremidades fixas em x = 0 e x = 1 (veja a Seção 12.2). Embora uma solução analítica do problema seja dada em (13) da Seção 12.4, utilizaremos este problema para explicar as idéias básicas da abordagem numérica que também são relevantes para EDPs hipérbólicas mais complicadas. Substituindo as derivadas pelos quocientes da diferença como antes, obtemos de (1) [veja (6) na Seção 21.4, com y = t] 1 1 (5) 2 ( ui, j 1  2 uij  ui, j 1)  2 ( ui 1, j  2 uij  ui 1, j) 2

k









h

onde h é o tamanho da malha em x e k o tamanho da malha em t. Esta equação de diferença relaciona 5 pontos, conforme mostra a Fig. 469a. Ela sugere uma grade retangular semelhante às grades para as equações parabólicas vistas na seção anterior. Escolhemos r* = k2/h2 = 1. Então, uij é eliminado e temos (6)

ui, j1



ui1, j



ui1, j



ui, j1

(Fig. 469b).

Pode-se mostrar que, para 0 < r*  1 o atual método explícito é estável, de modo que, a partir de (6), podemos esperar resultados razoáveis para os dados iniciais que não têm descontinuidades. (Para uma EDP hiperbólica, estes últimos se propagariam para o domínio da solução — um fenômeno com o qual teríamos dificuldade em lidar com nossa grade atual. Sobre métodos implícitos incondicionalmente estáveis, veja [E1] no Apêndice 1.) A Equação (6) ainda envolve três iterações temporais j – 1, j, j + 1, enquanto as fórmulas no caso parabólico envolvem somente duas iterações temporais. Além disso, temos agora duas condições iniciais. Linha de tempo j + 1 k h

h

Linha de tempo j

k

Linha de tempo j – 1 (a) Fórmula (5)

(b) Fórmula (6)

Fig. 469. Nós usados em (5) e (6)

Então, perguntamo-nos como começar e de que modo usar a condição inicial (3). Isto pode ser feito como se segue. De ut(x, 0) = g(x), deduzimos a fórmula da diferença 1 (7) logo ui, 1  ui1  2 kgi  ( ui1  ui, 1)  gi, 2k onde gi(x, 0) = g(ih). Para t = 0, isto é, j = 0, a Equação (6) é 



123

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

ui1



ui1,0



ui1,0



ui,1.

Nesta, substituímos ui,–1 como dado em (7). Obtemos ui1  ui

1,0

(8)

ui1



1 2

(ui



1,0

ui1,0)





ui1,0



ui1



2 kgi e, por simplificação,

kgi.

Esta equação expressa ui1 em termos dos dados iniciais e é usada apenas no início. Então, usamos (6). EXEMPLO 1

Corda Vibratória, Equação da Onda Aplique o presente método com h = k = 0,2 ao Problema (1)–(4) onde f(x)

= sen px

g(x)

= 0.

Solução. A grade é a mesma da Fig. 467, Seção 21.6, exceto para os valores de t, que agora são 0,2, 0,4, ). Os valores iniciais u00, u 10, são os mesmos do Exemplo 1, Seção 21.6. De (8) e de g(x) = 0, temos •















(em vez de 0,04, 0,08,



ui1

1

 2

(u i

1,0



ui1,0).

Com esta equação, computamos, usando u10  u40  sen 0,2p  0,587 785, u20  u30  0,951 057, (i  1) u11  12 (u00  u20) 

1 2

(i  2) u21  12 (u10  u30) 

1 2





0,951 057  0,475 528 1,538 842  0,769 421

e u31 = u 21, u41 = u 11 por simetria como na Seção 21.6, Exemplo 1. De (6) com j = 1, agora calculamos, usando u01  u02  (i  1)

u12



u01



u21



u10



0,769 421  0,587 785



0,181 636

(i  2)

u22



u11



u31



u20



0,475 528  0,769 421  0,951 057



0,293 892,









0,

e u32  u22, u42  u12 por simetria; e assim por diante. Desta forma, obtemos os seguintes valores do deslocamento u(x, t) da corda sobre o primeiro meio-ciclo: t

x



0,0 0,2

0 0

0,4 0,6 0,8 1,0

0 0 0 0

0

x



0,2

x

0,588 0,476



0,4

x

0,951 0,769

0,182 0,182 0,476 0,588

0,294 0,294 0,769 0,951







0,6

x

0,951 0,769 0,294 0,294 0,769 0,951 



0,8

x



0,588 0,476

0 0

0,182 0,182 0,476 0,588

0 0 0 0



1

Esses valores são exatos em 3D (três decimais), sendo a solução exata do problema (veja a Seção 12.3) u(x, t)



sen px cos pt.

A causa da exatidão decorre da solução de d’Alembert (4), na Seção 12.4 (veja o Problema 4 a seguir).



Isto encerra o Capítulo 21 sobre métodos numéricos para EDPs e EDOs, um campo de aplicações básicas e pesquisas interessantes, de rápido crescimento e no qual é possível abordar e resolver computacionalmente complicados problemas práticos e de grande escala.

PROBLEMAS PROPOSTOS 21.7 5. Se a corda governada pela equação da onda (1) começa a vibrar 1–3 CORDA VIBRATÓRIA Resolva (1)–(4) pelo presente método, com h = k = 0,2 para a deflexão ag(partir de sua posição de equilíbrio com uma velocidade inicial x) = sen px, qual é o seu deslocamento no tempot = 0,4 e x = inicial f(x) dada e uma velocidade inicial 0 no intervalo t dado. 0,2, 0,4, 0,6 e 0,8? (Use o presente método comh = 0,2 e k = 0,2. 1. ƒ( x )  0,01 x (1  x ), 0  t  2 Use (8). Compare com os valores exatos obtidos de (12) na Seção 2. ƒ( x )  x 2(1  x ), 0  t  1 12.4.) 3. ƒ( x )  x se 0  x  0,2, ƒ( x )  0,25(1  x ) se 0,2  x 6. Calcule valores aproximados no Problema 5, usando uma grade  1 refinada (h = 0,1 e k = 0,1) e perceba o aumento da precisão. 4. Mostre que, a partir da solução de d’Alembert (13) na Seção 12.4 7. Ilustre o procedimento inicial quando ambosf e g não são idencom c = 1, decorre que (6) na presente seção fornece o valor exato ticamente nulos, digamos, ƒ(x)  1  cos 2px, g(x)  x  x 2. u i, j 1  u(ih, ( j  1) h). Escolha h = k = 0,1 e faça duas iterações. 

124

Parte E • Análise Numérica

8. Mostre que (12) na Seção 12.4 fornece uma outra fórmula inicial 9. Calcule u no Problema 7 para t = 0,1 e x = 0,1, 0,2, , 0,9 usando a fórmula do Problema 8 e compare os valores. 1 1 x k u i 1   ( u i 1,0  u i 1,0 )   g ( s ) ds 10. Resolva (1)–(3) (h = k = 0,2, 5 iterações temporais) sujeitas a ƒ( x) 2 2 x k  x 2, g (x)  2 x, ux (0, t)  2 t, u(1, t)  (1  t)2. (onde se pode avaliar a integral numericamente se necessário). Em qual caso isto é idêntico a (8)? •







QUESTÕES E PROBLEMAS DE REVISÃO DO







h mais. = 1, = 0,1. Mostre que o resultado é exato para 5 deci22. Resolva y = (x + y)2, y(0) = 0 por RK com h = 0,2 e 5 iterações. 23. Mostre que, aplicando o método da Seção 21.2 a um polinômio de primeiro grau, obtemos as fórmulas multi-iterativas de previsão e correção 

yn



CAPÍTULO 21 y n1



yn

h





2

(ƒ *n

1



h



2 (3ƒ n



ƒ n 1) 

ƒ n)

método ao problema 24. Aplique de valor oinicial y = multi-iterativo x + y, y(0) = 0 do comProblema h = 0,2 e23 fazendo cinco iterações. Compare com os valores exatos. 2 25. Resolva y  ( y  x  1)  2, y(0)  1 para 0  x  1 por Adams–Moulton comh = 0,1 e os valores iniciais 1, 1,200334589, 1,402709878, 1,609336039. 26. Resolva y + y = 0, y(0) = 0, y(0) = 1 por RKN com h = 0,2 e cinco iterações. Calcule o erro. 27. Resolva y1  4y1  3y2, y2  5y1  6y2, y1(0)  3, y2(0)  5 por RK para sistemas comh = 0,1 e cinco iterações. 28. Resolva y1  5y1  3 y2, y2  3y1  5 y2, y1(0)  2, y2(0)  2 por RK para sistemas comh = 0,1 e cinco iterações. 29. Encontre aproximações grosseiras do valor do potencial eletrostático em P11, P12, P13 na Fig. 470, situados em um campo entre placas condutoras (que na Fig. 470 aparecem como lados de um retângulo) mantidas nos potenciais de 0 e 110 volts, conforme mostrado. (Use a grade indicada.) y u = 110 V

4 P13 P12

2 u=0

u=0

P11

0

0

1

x

2

u=0

Fig. 470. Problema 29 30–32 POTENCIAL Encontre o potencial na Fig. 471, usando a grade dada e as condições de contorno: 30. u = 70 nos lados superior e esquerdo,u = 0 nos lados inferior e direito.



y, y (0)

y *n 1



i 

1. Explique em termos geométricos o método de Euler e o de Euler aperfeiçoado. 2. O que são as ordens globais e locais de um método? Exemplifique. 3. O que você sabe sobre as estimativas de erros? Por que elas são importantes? 4. Como obtivemos métodos numéricos pelo uso da série de Taylor? 5. Em cada iteração de Runge–Kutta, calculamos valores auxiliares. Quantos? Por quê? 6. Quais são os métodos mono e multi-iterativos? Dê exemplos. 7. Qual é a idéia de um método preditivo-corretivo? Mencione algum desses métodos. 8. Qual é a idéia do método de Runge–Kutta–Fehlberg? 9. Como se pode generalizar o método de Runge–Kutta para sistemas de EDOs? 10. O que é o controle automático do tamanho da iteração? Como ele é feito na prática? 11. Por que e como utilizamos diferenças finitas neste capítulo? 12. Faça uma lista dos tipos de EDPs, problemas correspondentes e métodos empregados para obter suas soluções numéricas. 13. Como obtivemos uma aproximação da equação de Laplace? E da equação de Poisson? 14. A equação de diferença fornece soluções exatas de uma EDP? 15. De que modo tratamos: (a) de domínios com formatos irregulares e (b) de derivadas normais dadas nos contornos? 16. Resolva y = 2 xy, y(0) = 1, pelo método de Euler comh = 0,1 e 10 iterações. Calcule o erro. 17. Resolva y = 1 + y2, y(0) = 0 pelo método de Euler aperfeiçoado com h = 0,1 e 5 iterações. Calcule o erro. 18. Resolva y = ( x + y – 4)2, y(0) = 4 pelo método RK comh = 0,2 e 7 iterações. 19. Resolva o Problema 17pelo método RKcom h = 0,1 e 5 iterações. Calcule o erro. Compare com o Problema 17. 20. (Comparação justa) Resolva y  2 x 1y  ln x  x 1, y(1)  0 para 1  x  1,8 (a) pelo método de Euler comh = 0,1, (b) pelo método de Euler aperfeiçoado comh = 0,2 e (c) por RK comh = 0,4. Verifique que a solução exata éy  (ln x)2  ln x. Calcule e compare os erros. Por que a comparação é justa? 21. Calcule ex para x = 0, 0,1, , 1,0 pela aplicação de RK ay = •



i 

P13

P23

P33

P12

P22

P32

P11

P21

P31

P10

P20

P30

Fig. 471. Problemas 30-32

125

Capítulo 21: Métodos Numéricos para Equações Diferenciais Ordinárias (EDOs) e Equações Diferenciais Parciais (EDPs)

31. u(P10) = u(P30) = 960, u(P20) = –480, u = 0 em qualquer outro u(t, 1)  g(t)  sen 253pt. lugar do contorno Encontre a temperatura u(x, t) na barra [solução de (1) na Seção 32. u ( P 01 )  u ( P 03 )  u ( P 41 )  u ( P 43 )  200, 21.6] pelo método explícito comh = 0,2 e r = 0,5 (um período, u ( P 10 )  u ( P 30 )   400, u ( P 20 )  1600, ou seja, 0  t  0,24). u ( P 02 )  u ( P 42 )  u ( P 14 )  u ( P 24 )  37. Encontre u(x, 0,12) e u(x, 0,24) no Problema 36 se a extremidade u ( P 34 )  0 esquerda da barra for mantida em –g(t) (em vez de 0), com todos 33. Verifique (13) na Seção 21.4 para o sistema (12) e mostre queA os demais dados sendo como antes. em (12) é não-singular. 38. Descubra como podemos usar os resultados do Problema 36 para 34. Deduza a aproximação da diferença da equação do calor. obtermos os resultados do Problema 37. Use os valores 0,054, 35. Resolva a equação do calor (1) da Seção 21.6 para a condição inicial 0,172, 0,325, 0,406 (t = 0,12, x = 0,2; 0,4; 0,6; 0,8) e –0,009; –0,086; –0,252; –0,353 (t = 0,24), a partir da resposta do Problema ƒ(x)  x se 0  x  0,2, ƒ(x)  0,25(1  x) se 0,2  x  1 e a 36, para conferir sua resposta dada ao Problema 37. condição inicial (3), Seção 21.6, pelo método explícito [fórmula (5) na Seção 21.6] comh = 0,2 e k = 0,01 de modo que você obtenha 39. Resolva ut  uxx (0  x  1, t  0), como resposta os valores da temperatura no tempot = 0,05. u(x, 0)  x 2(1  x), u(0, t)  u (1, t)  0 por Crank–Nicolson com h = 0,2, k = 0,04 e cinco iterações temporais. 36. Uma barra homogênea, lateralmente isolada e com extremidades em x = 0 e x = 1, tem uma temperatura inicial 0. A sua extremidade 40. Ache a solução para o problema da corda vibratóriautt  uxx, u(x, esquerda é mantida a 0, enquanto a temperatura na extremidade 0)  x(1  x), ut  0, u(0, t)  u(1, t)  0 usando o método da direita varia senoidalmente de acordo com Seção 21.7 com h = 0,1 e k = 0,1 para t = 0,3.

RESUMO DO CAPÍTULO

MÉTODOS NUMÉRICOS

21 P ARA

EDOS E EDPS

Neste capítulo, discutimos métodos numéricos para EDOs (Seções 21.1–21.3) e EDPs (Seções 21.4–21.7). Os métodos para problemas de valor inicial y

(1)



ƒ( x, y),

y(x0)



y0

envolvendo uma EDO de primeira ordem são obtidos pelo truncamento da série de Taylor y(x



h)



y(x)



hy(x)

yn1



yn

h2

 y (x) 



2 onde, por (1), y  ƒ, y   ƒ   ƒ/x  (ƒ/y)y, etc. O truncamento após o termo hy leva-nos ao método de Euler no qual calculamos iteração a iteração (2)









hƒ(xn, yn)

(n  0, 1,





).



Levando em consideração mais um termo, obtemos o método de Euler aperfeiçoado . Ambos os métodos mostram a idéia básica, mas são por demais imprecisos na maioria dos casos. O truncamento após o termo em h4 leva-nos ao clássico e importante método de Runge–Kutta (RK) de quarta ordem. A idéia essencial deste método é substituirmos o incômodo cálculo dos valores das derivadas pelo cálculo de valores de f(x, y) em pontos adequados (x, y); portanto, em cada iteração calculamos primeiro quatro quantidades auxiliares (Seção 21.1) k1  hƒ(xn, yn) k2

(3a)



hƒ(xn

1

 2 h,

xn  12 h

k3



hƒ(

k4



hƒ(xn



yn

 6 (k1 



yn

1

 2 k1)

, yn  12 k2)

h , yn



k3)

e então o novo valor (3b)

yn1

1

2 k2  2 k3  k4).

O controle do erro e do tamanho do passo são possíveis pela divisão ao meio desta iteração ou pelo uso do método RKF (Runge–Kutta–Fehlberg). Os métodos na Seção 21.1 sãométodos mono-iterativos, uma vez que eles obtêmyn+1 a partir do resultadoyn de uma única iteração. Ummétodo multi-iterativo (Seção 21.2) utiliza os valores de yn, yn–1, de várias iterações paracalcular yn+1. A integração de polinômios cúbicos interpolados fornece método o de previsão de Adams–Bashforth(Seção 21.2) •





126

Parte E • Análise Numérica

(4a)

y* n1



yn



1  h (55ƒn  59ƒ n 24

1



37ƒ n

2



9ƒ n 3) 

onde fj = f(xj, yj) e um método de correção de Adams–Moulton (o novo valor real) 1 (4b) yn 1  yn   h (9ƒ* n 1  19ƒ n  5ƒ n 1  ƒ n 2), 24 onde ƒ *n 1  ƒ(xn 1, y *n 1). Aqui, para iniciarmos, devemos calcular y1, y2, y3 pelo método de Runge–Kutta ou por algum outro método preciso. A Seção 19.3 trata da extensão dos métodos de Euler e de RK aos sistemas y  f (x, y), então yj  ƒ j (x, y1, , ym), j  1, , m. 

























m-ésimaRKN Isto inclui EDOs únicas ordem, que são reduzidas a sistemas. As particularmente equações de segunda ordempara também podem ser as resolvidas pelos de métodos (Runge–Kutta–Nyström). Estes são vantajosos y = não contém y . Os métodos numéricos para EDPs são obtidos pela substituição das derivadas parciais por quocientes de diferença. Isto leva à obtenção de valores de aproximação para as equações de diferença; no caso da equação de Laplace , leva a f(x, y) onde f

(5)

ui1, j



ui, j1





ui, j1

0 4 uij 

2 ( ui



2 uij  ui

ui1, j

(Seção 21.4)

para a equação do calor leva a 1

(6)

 ( ui, j1  uij ) 

k

1

h

1, j

)

(Seção 21.6)

1, j

e, no caso da equação da onda, leva a (7)

1

2 ( ui, j k

1



1 2 uij  ui, j 1)  2 ( ui 

h

1, j



2 uij  ui

)

1, j

(Seção 21.7);

aqui, h e k representam os tamanhos das malhas de uma grade nas direções x e y, respectivamente, onde em (6) e (7) a variável y é o tempo t. Estas EDPs são elípticas, parabólicas e hiperbólicas, respectivamente. Os métodos numéricos correspondentes diferem entre si pelo seguinte motivo. Para as EDPs elípticas, temos problemas de valor de contorno e discutimos para eles (também conhecido como de ) einicial, o método 21.4, método de Gauss–Seidel método de Liebmann ADI (Seções 21.5).o Para as EDPs parabólicas, são informadas as condições contorno e a condição e discutimos um método explícito e o método de Crank–Nicolson (Seção 21.6). Para as EDPs hiperbólicas, os problemas são similares, embora nos seja dada uma segunda condição inicial (Seção 21.7).

PARTE

F

Otimização, Grafos C A P Í T U L O 2 2 Otimização sem Restrições. Programação Linear CAPÍTULO 23 Grafos. Otimização Combinatória As idéias de otimização e a aplicação de grafos desempenham um papel cada vez mais importante em engenharia, computação, teoria dos sistemas, economia e outras áreas. No primeiro capítulo desta parte, explicaremos alguns conceitos básicos, métodos e resultados de otimização com ou sem restrições. O segundo capítulo é dedicado aos grafos e à correspondente área conhecida como otimização combinatória, um campo interessante, relativamente novo e ainda em desenvolvimento de pesquisa teórica e aplicada.

CAPÍTULO

22

Otimização sem Restrições. Programação Linear Os princípios de otimização são de fundamental importância em problemas modernos de modelagem em engenharia, bem como na operação de sistemas em diversas áreas. Seu desenvolvimento recente tem sido influenciado pelatécnicas disponibilidade de computadores capazes resolver problemas de grande e pela criação de novas correspondentes de otimização, de de modo que todo esse campo veio aescala se transformar por si só numa área de grande interesse. Neste capítulo, faremos uma introdução aos mais importantes conceitos, métodos e resultados de otimização sem restrições (o chamado método do gradiente), bem como aos métodos de otimização com restrições (programação linear). Pré-requisito: Um modesto conhecimento no trato com sistemas de equações lineares Referências e Respostas dos Problemas: Parte F do Apêndice 1 e Apêndice 2.

22.1 Conceitos Básicos. Otimização sem Restrições Em uma otimização sem restrições o objetivo é otimizar (maximizar ou minimizar) uma certa função f, chamada de função-objetivo. Por exemplo, uma função-objetivof a ser maximizada pode ser a receita auferida com a produção de aparelhos de TV, o rendimento por minuto de um processo químico, a quilometragem por litro feita por um certo tipo de automóvel, o número de clientes atendidos por hora em um banco, a dureza de um aço ou a resistência à tração de uma corda. De modo similar, pode-nos ser de interesse minimizar f, se f for o custo unitário de produção de certas máquinas fotográficas, o custo operacional de uma usina de energia, a perda diária de calor em um sistema de calefação, o tempo ocioso de um torno mecânico, ou o tempo necessário para produzir um pára-choque. Na maioria dos problemas de otimização, a função-objetivo f depende de várias variáveis x1,







, xn.

Estas são as chamadas variáveis de controle, porque podemos “controlá-las”, ou seja, escolher seus valores. Por exemplo, o rendimento de um processo químico pode depender da pressão x1 e da temperatura x2. A eficiência de um certo sistema de condicionamento de ar pode depender da temperatura x1, da pressão do ar x2, da taxa de umidade do ar x3, da área da seção transversal do escape x4, e assim por diante. A teoria da otimização desenvolve métodos para se fazerem escolhas ótimas de x1, , xn, que maximizem (ou minimizem) a função-objetivo f, ou seja, métodos para encontrar valores ótimos de x1, , xn. Em diversos problemas, a escolha dos valores de x1, , xn não é inteiramente livre, mas se sujeita a algumas restrições, ou seja, restrições adicionais surgidas da natureza do problema e das variáveis. Por exemplo, se x1 é o custo de produção, entãox1  0, e existem muitas outras variáveis (tempo, peso, distância viajada por um vendedor etc.) que somente podem assumir valores não-negativos. As restrições podem também tomar a forma de equações (ao invés de desigualdades). •

















Primeiramente consideraremos a otimização sem restrição no caso de uma função f(x1, , xn). Também escreveremos x = (x1, , xn) e f(x) por conveniência. Por definição, f possui um mínimo em um ponto x = X0 em uma região R (onde f é definida) se •







f(x)

para todo x em R. Similarmente, f possui um



f(X0)

máximo em X0 em R se f(x)



f(X0)

para todo x em R. Juntos, os mínimos e os máximos são chamados de

extremos.





Capítulo 22: Otimização sem Restrições. Programação Linear

Além disso, dizemos que f possui um mínimo local em f(x)

para todo

129

X0 se f(X0)



x numa vizinhança de X0, digamos, para todo x que satisfaça x  X0  [( x1  X1)2











( xn



Xn)2]1/2



r,

onde X0 = (X1, , Xn) e r > 0 seja suficientemente pequeno. Similarmente, dizemos que f possui um máximo local em X0 se f(x)  f(X0) para todo x satisfazendo a x – X0 < r. Se f for derivável e possuir um extremo em um ponto X0 no interior de uma região R (ou seja, não sobre seu contorno), então as derivadas parciais äf/äx1, , äf/äxn devem ser nulas em X0. Estas são as componentes de um vetor chamado de gradiente de f e representado por grad f ou f. (Para n = 3, isto concorda com a Seção •











9.7.) Portanto,

(1)

ƒ(X0) 

0.

Um ponto X 0 no qual (1) se verifica é chamado de ponto estacionário de f. A condição (1) é necessária, porém não suficiente, à ocorrência de um extremo de f em X0 no interior de R. De fato, se n = 1, então para y = f(x) a condição (1) é y = f(X0) = 0; e, por exemplo, y = x3 satisfaz a y = 3 x2 = 0 em x = X0 = 0 onde f não possui um extremo, mas sim um ponto de inflexão. Similarmente, para f(x) = x1x2, temos que f(0) = 0 e f não possui um extremo, mas sim um ponto de sela em 0. Logo, após resolvermos (1), devemos ainda descobrir se o que obtivemos é ou não um extremo. No caso n = 1, as condições y(X0) = 0, y(X0) > 0 garantem a ocorrência de um mínimo local em X0, e as condições y(X0) = 0, y(X0) < 0 garantem a ocorrência de um máximo local, como sabemos do cálculo. Para n > 1, há critérios similares. Entretanto, na prática, até mesmo a resolução de (1) é muitas vezes difícil. Por esta razão, preferem-se, geralmente, as soluções obtidas por iteração, ou seja, por um processo de procura iniciando-se em algum ponto e movendo-se passo a passo na direção de pontos nos quaisf vai se tornando progressivamente menor (caso se deseje obter um mínimo de f) ou maior (caso se deseje obter um máximo). O método do máximo declive ou método do gradiente é desse tipo. Apresenta-lo-emos aqui na forma-padrão. (Sobre seus refinamentos, veja a Ref. [E25] no Apêndice. 1). A idéia deste método é encontrar um mínimo def(x) calculando-se repetidamente os mínimos de uma função g(t) de uma única variável t, como se segue. Suponha que f tenha um mínimo em X0 e que comecemos em um ponto x. Então, procuramos por um mínimo def que se situe o mais próximo de x ao longo da reta na direção de –f(x), que é a direção do máximo declive (= direção de maior decréscimo) de f em x. Ou seja, determinamos o valor de t e o ponto correspondente

z(t)  x  t ƒ(x)

(2) no qual a função

g(t) = f(z(t))

(3)

possui um mínimo. Tomamos essez(t) como nossa próxima aproximação de

EXEMPLO 1

X0.

Método do Máximo Declive Determine um mínimo de ƒ(x)

(4) começando de x0



(6, 3)



6i





x12



3 x22,

3 j e aplicando o método do máximo declive.

Claramente, por inspeção vemos que f(x) possui um mínimo em 0. O fato de conhecer a solução nos dá uma melhor compreensão de como o método funciona. Obtemos ƒ(x)  2 x1i  6 x2 j e a partir daí

Solução.

z(t)  x  t ƒ(x)  (1  2 t) x1i  (1  6 t) x2 j  ƒ( z(t))  (1  2 t)2x12  3(1  6 t)2x22.

g(t)

Calculamos agora a derivada g(t)

seja g(t)





2(1



2 t) x12(2)



6(1



0, e resolvemos para t, achando t



x 9x .  2x 54 x 2 1  2 1 

2

2

2

2

6 t) x22(6),

130

Parte F • Otimização, Grafos Partindo de x0 = 6i + 3j, calculamos os valores da Tabela 22.1, que estão mostrados na Fig. 472. A Fig. 472 sugere que, no caso de elipses mais delgadas (“vales estreitos e alongados”), a convergência será ruim. Podemos confirmar isto substituindo o coeficiente 3 em (4) por um coeficiente grande. Para métodos de declive mais sofisticados e outros, alguns dos quais são também aplicáveis a funções vetoriais de variáveis vetoriais, devem-se consultar as referências mencionadas na Parte F do Apêndice. 1; veja também [E25].  x2

x

0

x

2

x1

x

1

Fig. 472. Método do Máximo Declive do Exemplo 1

Tabela 22.1 Método do Máximo Declive, Cálculos do Exemplo 1

x

n

0 1 2 3 4 5 6

t

6,000 3,484 1,327 0,771 0,294 0,170 0,065

3,000

1

0,210 0,310 0,210 0,310 0,210 0,310

0,774

0,664 0,171

0,147 0,038



2t

0,581 0,381 0,581 0,381 0,581 0,381

1



6t

0,258 0,857 0,258 0,857 0,258 0,857

0,032

PROBLEMAS PROPOSTOS 22.1 1. O que acontece se aplicarmos o método do máximo declive à 9. ƒ( x ) função f(x) = x12 + x22?

2. Verifique que, no Exemplo 1, os gradientes sucessivos são ortogonais. Qual é a razão disto?

3–11 MÁXIMO DECLIVE

10. 11.

Faça três iterações de máximo declive para os casos:

3. 4. 5. 6. 7. 8.



3 x 12



x 12

ƒ( x )



0,5 x 1 2



ƒ( x )



x 12

0,1 x 22



8x1

ƒ( x )



0,2 x 1 2

x 22



0,08 x 1, x 0







2 x 22

x 0 [1 1] x 0 [0 0]

ƒ( x ) ƒ( x )

2 x 22







12 x 1

x1

0,7 x 2 2

16 x 2,





6 x 2,



x1 

T



x2

T

4,2 x 2 



1, x 0

22,5, x 0

[4

4]





[1

[2

1] T

 1] T

T

 x 12  cx 22 , x 0  [ c 1] T. Mostre que duas iterações dão [c 1] T vezes um fator, –4c2/(c2 – 1)2. O que se pode concluir disto em termos da velocidade de convergência? ƒ( x )  x 1 2  x 2 , x 0 [1 1] T. Esboce o caminho feito. Preveja qual será o resultado de iterações adicionais. ƒ( x )  ax 1  bx 2 , x0 qualquer. Primeiro por palpite; depois, calcule.

12. EXPERIMENTO DEÁLGEBRA COMPUTACIONAL. Máximo Declive. (a) Escreva um programa para este método. (b) Aplique o seu programa a xƒ()  x12  4x22, fazendo experiências x0. com a velocidade de convergência dependente da escolha de (c) Aplique o seu programa a ƒ(x )  x 12 + x 24 e para ƒ(x )  x 14 + x 24 , x 0  [2 1] . Represente graficamente as curvas de nível T

ƒ( x )  x 12  x 2 2, x 0 [2 1] T , cinco iterações. Primeiro por palpite; depois, calcule. Esboce o caminho feito.

e o caminho de declive. (Tente incluir as representações gráficas diretamente em seu programa.)

22.2 Programação Linear

A programação linear ou otimização linear consiste em métodos de resolução de problemas com restrições, ou seja, métodos para se encontrar um máximo (ou um mínimo) x = [x1, , xn] de uma função-objetivo linear •

z



ƒ( x)



a1x1



a2x2















anxn

que satisfaça às restrições. Estas últimas são desigualdades lineares, como, por exemplo, 3x1 + 4x2  36, ou x1  0 etc. (outros exemplos se seguirão). Problemas desse tipo surgem com freqüência, quase que diariamente,

Capítulo 22: Otimização sem Restrições. Programação Linear

131

por exemplo, em situações de produção, administração de estoques, mercado de ações, operação de usinas elétricas, determinação de rotas de transporte de carga, programação de vôos, e assim por diante. O progresso alcançado pela tecnologia de computadores tornou possível a resolução de problemas de programação envolvendo a inclusão de centenas ou milhares de variáveis. Explicaremos a determinação de um problema de programação linear e a idéia de uma solução “geométrica”, que nos permitirá enxergar o que se passa.

EXEMPLO 1

Plano de Produção Uma empresa chamada Energy Savers, Inc. produz aquecedores dos tipos S e L. Os preços de venda no atacado são de $40 por aquecedor do tipo S e de $88 para o tipoL. Há duas restrições de tempo resultantes da utilização de duas máquinas M1 e M2. Em M1, gastam-se 2 minutos para cada aquecedor S produzido, e gastam-se 8 minutos para cada aquecedor L. Em M2, gastam-se 5 minutos para cada aquecedor S, e 2 minutos para cada aquecedor L. Determine os números de produção x1 e x2 de aquecedores S e L , respectivamente (número de aquecedores produzidos por hora), de tal modo que a receita horária auferida com a produção z



ƒ( x)



40 x1



88 x2

seja máxima.

Solução.

Os números de itens produzidos x1 e x2 devem ser não-negativos. Logo, a função-objetivo (a ser maximizada) e as quatro res-

trições são (0)

40x1

88x2

(1)

2x1

8x2

60 min. de tempo de máquina M1

(2)

5x1

2x2

60 min. de tempo de máquina M2

(3)

x1

z

(4)

0 x2

0.

A Fig. 473 mostra (0)–(4) como se segue. As linhas de valores constantes z = const.

estão assinaladas por (0). Estas são as linhas de receita constante. Sua inclinação é –40/88 = –5/11. Para aumentarmos z, devemos mover a linha para cima (paralelamente a si mesma), como mostra a seta. A Equação (1), com o sinal de igualdade, está assinalada por (1). Ela intercepta os eixos coordenados em x1 = 60/2 = 30 (fazendo x2 = 0) e em x2 = 60/8 = 7,5 (fazendo x1 = 0). As setas indicam os lados onde os pontos (x1, x2) satisfazem a desigualdade em (1). Algo similar ocorre com as Equações (2)–(4). O quadrilátero cinza assim obtido é a chamada região de factibilidade. Trata-se do conjunto de todas as soluções factíveis, ou seja, as soluções que satisfazem a todas as quatro restrições. O, A,de B,factibilidade. C. A soluçãoObviamente, A figura possível também mostra a receita correspondente aos pontos ótima é obtida movendo-se a retaé de receita constante máximo para cima, sem se sair completamente da região esta situação ótima obtida quando a retao passa por B, a interseção de coordenadas (10,5) de (1) e (2). Vemos então que a receita ótima zmáx = 40 10 + 88 5 = R$ 840 





é obtida produzindo-se duas vezes mais aquecedores S do que L. x2

O: A: B: C:

20

z=0 z = 40 12 = 480 z = 40 10 + 88 5 = 840 z = 88 7,5 = 660 .

.

.

.

(3) (2) 10

C

(0) ( 1)

B

z

=c

on

st.

(4) O

10

A

(0)

20

z

=0

x1

30

(0)

z má x

=8 40

Fig. 473. Programação Linear do Exemplo 1 Note bem que o problema no Exemplo 1 ou problemas similares de otimização não podem ser resolvidos igualando-se a zero algumas derivadas parciais, devido ao papel crucial desempenhado nesses problemas pela região onde as variáveis de controle podem variar.

132

Parte F • Otimização, Grafos

Além disso, nosso método gráfico ou “geométrico” ilustrado no Exemplo 1 restringiu-se a um caso envolvendo duas variáveis x1 e x2. Não obstante, a maioria dos problemas práticos envolve um número muito maior do que duas variáveis, de forma que necessitamos de outros métodos de solução.

Forma Normal de um Problema de Programação Linear A fim de nos prepararmos para usar os métodos gerais de solução, mostremos que é possível expressar as restrições de modo mais uniforme. Expliquemos essa idéia em termos de (1), 2x1 Essa desigualdade implica que 60



2 x1

8 x2



8 x2



60.



0 (e vice-versa), ou seja, implica que a quantidade

 





x3 60 2 x1 8 x2 é não-negativa. Logo, nossa desigualdade srcinal pode agora ser escrita como uma equação

2x1

8 x2



x3



60,



onde x3

0.



x3 é uma variável auxiliar não-negativa, que introduzimos com o objetivo de converter uma desigualdade numa equação. Uma variável desse tipo é chamada de variável de folga, porque ela “representa a folga” ou a diferença entre os dois lados da desigualdade.

EXEMPLO 2

Conversão de Desigualdades pelo Uso de Variáveis de Folga Com a ajuda de duas variáveis de folga x3 e x4, podemos expressar o problema de programação linear do Exemplo 1 da seguinte forma. Maximizar ƒ

40x1

88x2

sujeito às restrições 2x1

8x2

5x1

2x2

60

x4

0

x1

60

x3

(i

1,







, 4).

x1 e x 2, Temos agora n = 4 variáveis e m = 2 equações (linearmente independentes), de modo que duas dessas quatro variáveis, por exemplo, xi = 0: determinam as outras. Notemos também que cada um dos quatro lados do quadrilátero da Fig. 473 tem agora uma equação da forma OA: x2

0,



AB: x4



0,

BC: x3



0,

CO: x1



0.

Um vértice desse quadrilátero é a interseção de dois de seus lados. Portanto, em um vértice, n – m = 4 – 2 = 2 das variáveis são nulas, e as outras são não-negativas. Logo, em A temos

x2 = 0, x4 = 0, e assim por diante.



Nosso exemplo sugere que se pode passar um problema geral de otimização linear para a seguinte forma normal. Maximizar

(5)

ƒ



c1x1

c2x2













cnxn



b1

sujeito às restrições

(6) •

a11x1



a21x1











am1x1 xi



0































a1nxn



a2nxn















amnxn

(i

1,





b2

 •





 •







bm

, n)

Capítulo 22: Otimização sem Restrições. Programação Linear

133

com todos os bj não-negativos. (Se houver um bj < 0, multiplique a equação por –1.) Aqui, x1, , xn incluem as variáveis de folga (para as quais os cj’s em f são nulos). Suponhamos que as equações em (6) sejam linearmente independentes. Então, se escolhermos valores para n – m das variávies, o sistema determina as outras de forma única. Naturalmente, visto que precisamos ter •

x1  0,









, xn  0,



esta escolha não é completamente livre. Nosso problema também inclui a minimização de uma função-objetivo f, uma vez que isto corresponde a maximizar –f e, portanto, não necessita de nenhuma consideração em separado. Uma n-upla (x1, , xn) que satisfaça a todas as restrições em (6) é chamada de um ponto factível ou de uma solução factível. Uma solução factível é chamada de solução ótima se, para ela, a função-objetivo f se torna um máximo, comparada com os valores de f em todas as soluções factíveis. •





Finalmente, quando falamos de uma solução básica factível, queremos com isso dizer uma solução factível para a qual pelo menos n – m das variáveis x1, , xn são nulas. Citamos o caso do Exemplo 2, onde temos n = 4 e m = 2, sendo as soluções básicas factíveis os quatro vértices O, A, B, C da Fig. 473. Aqui, B é uma solução ótima (a única neste exemplo). O seguinte teorema é fundamental. •

TEOREMA 1





Solução Ótima Uma solução ótima de um problema de programação linear(5), (6) é também uma solução básica factível de (5), (6).

Uma prova desse teorema pode ser encontrada na Ref. [F5], Capítulo 3 (listada no Apêndice. 1). Um problema pode ter muitas soluções ótimas e nem todas elas serem soluções factiveis básicas; mas o teorema garante que podemos encontrar uma solução ótima procurando apenas entre as soluções básicas factíveis. Trata-se, portanto, de uma grande simplificação; porém, visto que existem



   modos diferentes de se igualar a zero n

n n

m

m

n – m das n variáveis, considerar todas essas possibilidades, descartar aquelas que não são factíveis e então procurar n e m são relativamente entre as restantes, assim envolveria bastante trabalho,de mesmo quando pequenos. Isso faztudo com isso que ainda necessitemos de um método sistemático procura. Explicaremos um importante método desse tipo na próxima seção.

PROBLEMAS PROPOSTOS 22.2 1. No Exemplo 2, qual é o significado das variáveis de folgax3, x4

9.

x1



x2



3

x1



x2



9

x1 

x2

 3

x1 

x2



em termos do problema do Exemplo 1?

2. Podemos sempre esperar a ocorrência de uma solução única (como no caso do Exemplo 1)?

3. Poderíamos encontrar um lucrof(x1, x2) = a1x1 + a2x2 cujo máximo esteja em um ponto interior ao quadrilátero da Fig. 473? (Justifique sua resposta.)

4. Por que as variáveis de folga são sempre não-negativas? Quantas

REGIÕES E RESTRIÇÕES

plano x1x2 definida pelas desigualdades: 5. x 1  2 x 2  10 6.  x 1





x1 



0

0

x1



x2



5

x2



2

2x1 

x2



16

8. 2 x1  x 2



6 40



6,0 x 2



18,0

5,0 x 1



2,5 x 2



20,0

x1

4x1



5x2



x1



2x2

 3

 1,

 

x1



2x 1 x2





x2



6,



ƒ 3 x1 6 x 2, x 1  2 x 2  6,

13. ƒ



x2



12. x2

x2

7. 2,0 x 1



x2



2



5x2



15

2x 1



x2

x1 

2x2

 2 

10

11–15 MAXIMIZAÇÃO E MINIMIZAÇÃO

Descreva e represente graficamente a região do primeiro quadrante do

x1

3

x1

3x 1

Maximize a função-objetivof dada, sujeita às seguintes restrições. 11. ƒ   10 x 1  2 x 2 , x 1  0, x 2  0,

delas são necessárias?

5–10

10.

4 x1

x1

3 x 2,

  3,

x2

x2



5



x2



2x 2



4, 14

4x 1



3x2



12 ,

2x1



3x2



6,



0

14. Minimize f no Problema 13. 15. Minimize f no Problema 11. 16. (Saída máxima) A empresa Giant Ladders, Inc. deseja maximizar sua produção diária total de escadas de grande porte, produzindo x1 dessas escadas por um processoP1 e x2 por um processo P2, onde

134

Parte F • Otimização, Grafos P1 requer duas horas de mão-de-obra e quatro horas-máquina por escada, enquanto P2 requer três horas de mão-de-obra e 2 horasmáquina. Para esse tipo de trabalho, estão disponíveis por dia, no máximo, 1200 horas de mão-de-obra e 1600 horas-máquinas. Encontre os valores ótimos dex1 e x2.

17. (Lucro máximo) A Universal Electric, Inc. fabrica e vende dois

números correspondentes são: 2000, 5000 e 1500. Os custos operacionais diários das fornalhas I e II são, respectivamente, $400 e $600. Encontre o número de dias de operação de cada fornalha de tal modo que seja mínimo o custo operacional para atender a um pedido de 1800 tijolos cinza, 34000 tijolos vermelhos e 9000 tijolos esmaltados. (Lucro máximo) A United Metal, Inc. produz ligasB1 (latão especial) eB2 (tombac amarelo).B1 contém 50% de cobre e 50% de zinco. (O latão comum contém cerca de 65% de cobre e 35% de zinco.) B2 contém 75% de cobre e 25% de zinco. Os lucros líquidos são de $120 por tonelada deB1 e $100 por tonelada deB2. O suprimento diário de cobre é de 45 toneladas. O suprimento diário de zinco é de 30 toneladas. Maximize o lucro líquido da produção diária.

modelos de lâmpadas, L1 e L2, que lhe proporciona os lucros de $150 e $100, respectivamente. O processo envolve dois trabalhadores T1 e T2, que têm para esse trabalho uma disponibilidade de 100 e 80 horas por mês, respectivamente.T1 monta L1 em 20 minutos e L2 em 30 minutos. T2 pinta L1 em 20 minutos e L2 em 10 minutos. Supondo que se possam vender sem problemas todas as lâmpadas produzidas, determine as quantidades de produtos

19.

fabricados capazes de maximizar o lucro.

20. (Nutrição) Os alimentos A e B têm 600 e 500 calorias, contêm

18. (Custo mínimo) A Hardbrick, Inc., possui duas fornalhas. A for-

15 g e 30 g de proteínas, e custam $1,80 e $2,10 por unidade, respectivamente. Encontre a dieta de custo mínimo que inclua pelo menos 3900 calorias e pelo menos 150 g de proteínas.

nalha I pode produzir diariamente 3000 tijolos cinza, 2000 tijolos vermelhos e 300 tijolos esmaltados. Em relação à fornalha II, os

22.3 Método Simplex Da última seção, recordemos o seguinte. Um problema linear de otimização (problema de programação linear) pode ser expresso numa forma normal, ou seja:

(1)

Maximize z

c1x1

ƒ(x)





cn xn



sujeita às restrições a11x1 a21x1

(2)













a1nxn

b1

a2nxn

b2

••••••••••••••••••

am1x1 xi





(i

0

••••

amn xn



1,





bm •

, n).

Para encontrarmos uma solução ótima para esse problema, precisamos somente considerar as soluções básicas factíveis (definidas na Seção 22.2), mas ainda assim existem tantas delas que devemos adotar um método sistemático de solução. Em 1948, G. B. Dantzig publicou com esse propósito um método iterativo, chamado de método simplex. Neste método, procede-se passo a passo de uma solução básica factível para outra, de uma maneira tal que a função-objetivo f sempre aumente o seu valor. Expliquemos este método em termos do exemplo dado na última seção. Em sua forma srcinal, o problema tratava da maximização da função-objetivo z

sujeito a

40x1

88x2

2x1

8x2

60

5x1

2x2

60 0

x1 x2

0.

Convertendo as duas primeiras desigualdades em equações por meio da introdução de duas variáveis de folga x3 e x4, obtemos a forma normal para o problema do Exemplo 2. Juntamente com a função-objetivo (expressa como uma equação z – 40x1 – 88x2 = 0), essa forma normal é

Capítulo 22: Otimização sem Restrições. Programação Linear

z

40x1

88x2

2x1

8 x2

5x1

2 x2

(3)

135

0 x3

60 x4

60

onde x1  0, , x4  0. Trata-se de sistema de equações lineares. Para encontrarmos uma solução ótima para ele, podemos considerar sua matriz aumentada (veja a Seção 7.3) •





z

x1 | | | | | | | |

x2

x3 | | | | | | | |

x4

b | | | | | | | |

40– – – – 88 – –1 – – – – – – – – –0– – – –0– – – – –0– –

(4)

T0

0 0



2

8

5

2

1

0

0

1

60 60



Esta matriz é chamada de quadro simplex ou tabela simplex (a tabela simplex inicial). Estes são nomes-padrão. As linhas tracejadas e as letras z, x1,







, b

visam a facilitar posteriores operações. Toda tabela simplex contém dois tipos de variáveisxj. Chamamos de variáveis básicas aquelas cujas colunas têm somente um elemento não-nulo. Portanto, em (4), x3 e x4 são variáveis básicas e x1 e x2 são variáveis nãobásicas. Toda tabela simplex fornece uma solução básica factível, que é obtida igualando-se a zero as variáveis nãobásicas. Portanto, (4) fornece a solução básica factível x1 = 0,

x2 = 0,

x3 = 60/1 = 60,

x4 = 60/1 = 60,

z= 0

com x3 sendo obtida da segunda linha e x4 da terceira. A solução ótima (sua localização e valor) é agora obtida passo a passo por pivotação, concebida de tal modo que consideramos soluções básicas factíveis com valores cada vez maiores para z, até que o máximo de z seja alcançado. Aqui, a escolha da equação de pivotação e do pivô é bem diferente da que se usa na eliminação de Gauss. A razão disso é quex1, x 2, x 3, x4 se restringem a valores não-negativos.

Passo 1. Operação O 1: Seleção da Coluna do Pivô Selecione como coluna do pivô a primeira coluna com um elemento negativo na Linha 1. Em (4), esta é a Coluna 2 (devido ao valor –40). Operação O2: Seleção da Linha do Pivô. Divida os lados direitos [60 e 60 em (4)] pelos elementos correspondentes da coluna recém-relacionada (60/2 = 30, 60/5 = 12). Considere como pivô a equação que forneça o menor quociente. Portanto, o pivô é 5, visto que o menor quociente é 60/5. Operação O3: Eliminação por Operações de Linha. Essa eliminação resulta em zeros acima e abaixo do pivô (como no método de Gauss-Jordan, Seção 7.8). Usando-se a notação para as operações de linha introduzida na Seção 7.3, os cálculos no Passo 1 fornecem, a partir da tabela simplex T0 em (4), a seguinte tabela simplex (matriz aumentada), onde as letras em cinza se referem à tabela anterior. z

x1

x2

x3

x4

b

| | | – –1 – – –| – – 0 – – – – 72 – – – – –| – 0 – – – – –8– – – –| – –480 –– –

(5)

T1

0

| | | | |

0

7,2

| | | | |

1

0,4

| | | | |

36

Linha 1

8 Linha 3

Linha 2

0,4 Linha 3

| | | 0 5 2 0 1 60 Vemos que as variáveis básicas são agorax1 e x3 e que as não-básicas são x2 e x4. Fazendo estas últimas serem iguais a zero, obtemos a solução básica factível dada por T1,



x1 = 60/5 = 12,

x2 = 0,

x3 = 36/1 = 36,



x4 = 0,

z = 480.

Isto corresponde a A na Fig. 473 (Seção 22.2). Portanto, passamos de O: (0, 0) com z = 0 para A:(12, 0) com um maior valor de z = 480. A razão desse acréscimo foi que eliminamos um termo (–40 x1) com um coeficiente negativo. Portanto, aeliminação se aplica somente aos elementos negativos da Linha 1, mas não a nenhum outro. Este é um motivo de se selecionar a coluna do pivô.

136

Parte F • Otimização, Grafos

Vejamos agora um motivo de selecionarmos alinha do pivô. Se tivéssemos tomado a segunda linha de T0 (portanto, a linha 2 como pivô), teríamos então obtido z = 1200 (verifique!), porém essa linha de receita constante z = 1200 situa-se completamente fora da região de factibilidade da Fig. 473. Isto é um motivo para termos feito a escolha cautelosa do elemento 5 como nosso pivô, visto que assim obtivemos o quociente mínimo (60/5 = 12).

Passo 2. A solução básica factível dada por (5) não é ainda ótima, devido à existência do elemento negativo –72 na Linha 1. Dessa forma, fazemos as operações de O1 a O3 outra vez, escolhendo um pivô na coluna de –72. Operação O1: Selecione a Coluna 3 de T1 em (5) como a coluna do pivô (visto que –72 < 0). Operação O2: Temos que 36/7,2 = 5 e 60/2 = 30. Selecione 7,2 como pivô (pois 5 < 30). Operação O3: A eliminação por operações de linha fornece z

(6)

T2



x1 | | | | | | | | |

x2

x3 | | | | | | | | |

x4

b | | | | | | | | |

–1 – – – – –0– – – 0 – – – – – – –10 – – – – – –4 – – – – – –840 –––

0 0

0

7,2

5

0

1 1

0,4 1

3,6

0,9

36 50



Linha 1

Linha 3

10 Linha 2

2 7,2

Linha 2

Vemos agora que x1 e x2 são as variáveis básicas e x3 e x4 são as não-básicas. Fazendo as últimas iguais a zero, obtemos de T2 a solução básica factível x1 = 50/5 = 10,

x2 = 36/7,2 = 5,

x3 = 0,

x4 = 0,

z = 840.

Isto corresponde a B na Fig. 473 (Seção 22.2). Neste passo, z subiu de 480 para 840, devido à eliminação de –72 em T1. Como T2 não contém mais elementos negativos na Linha 1, concluímos que z = f(10,5) = 40  10 + 88  5 = 840 é a máxima receita possível, que será obtida se produzirmos duas vezes mais aquecedores S do que L. Esta é a solução de nosso problema obtida através do método simplex de programação linear. 

Minimização. Se quisermos minimizar z = f(x) (ao invés de maximizar), tomamos como colunas dos pivôs aquelas que tenham um valor positivo (ao invés de negativo) como elemento na Linha 1. Em uma Coluna k desse tipo, consideramos somente os elementos positivos tjk e tomamos como pivô um tjk para o qual bj/tjk seja o menor (como antes). Exemplos disso podem ser encontrados entre os problemas propostos.

PROBLEMAS PROPOSTOS 22.3 MÉTODO SIMPLEX

1–9

Escreva na forma normal e resolva pelo método simplex, supondo que todos os x j sejam não-negativos.

1. Maximize f = 3 x1 + 2 x2 sujeita a 3x1 + 4x2  60, 4x1 + 3 x2  60, 10x1 + 2x2



120.

7. Minimize f = 5x1 – 20 x2 sujeita a –2 x1 + 10x2 



5, 2x1 + 5x2

1 0.

8. Problema 20 da série de Problemas Propostos 22.2. 9. Maximize f = 34x1 + 29x2 + 32x3 sujeita a 8x1 + 2x2 + x3 3x1 + 8x2 + 2x3



59, x1 + x2 + 5x3





54,

39.

2. Problema 16 da série de Problemas Propostos 22.2. 10. PROJETO DE ÁLGEBRA COMPUTACIONAL. Método Sim3. Maximize o lucro na produção diária dex1 esquadrias metálicas plex. (a) Escreva um programa para representar graficamente, no E1 ($90 de lucro/esquadria) e dex2 esquadrias E2 ($50 de lucro/ esquadria) sob as restriçõesx1 + 3 x2  1800 (material), x1 + x2  1000 (horas-máquina), 3x1 + x2  2400 (mão-de-obra).

4. Maximize f = 2 x1 + 3 x2 + x3 sujeita a x1 + x2 + x3  4,8, 10x1 + x3 

9,9, x2 – x3



0,2.



20, 2x1 + 3x3

(b) Escreva um programa para maximizarz = a1x1 + a2x2 em R. (c) Escreva um programa para maximizarz = a1x1 + + anxn •

5. O problema dado no texto com a ordem das restrições invertida. 6. Minimize f = 4x1 – 10x2 – 20x3 sujeita a 3x1 + 4x2 + 5x3  60, 2x1 + x2

primeiro quadrante do planox1x2, uma região R determinada por restrições lineares.



30.





sujeita a restrições lineares.

(d) Aplique seus programas a problemas apresentados nesta série de problemas propostos e na série da seção anterior.

22.4 Método Simplex: Dificuldades Recordemo-nos da última seção que, no método simplex, avançamos passo a passo de uma solução factível básico para outra, pelo que aumentamos o valor da função-objetivo f até atingirmos uma solução ótima. Oca-

Capítulo 22: Otimização sem Restrições. Programação Linear

137

sionalmente (embora com uma freqüência um tanto baixa na prática), podem, entretanto, surgir dois tipos de problemas. O primeiro deles é a degeneração. Uma solução factível degenerada é uma solução factível na qual um número maior que o número usual n – m de variáveis são nulas. Aqui, n é o número de variáveis (as de folga e as outras) e m é o número de restrições (sem contar as condições xj  0). Na última seção, n = 4 e m = 2, e as soluções básicas factíveis que ocorreram não eram degeneradas; n – m = 2 variáveis foram nulas em cada solução. No caso de uma solução factível degenerada, executamos um passo extra de eliminação no qual uma variável básica que seja nula para essa solução torna-se não-básica (e, inversamente, uma variável não-básica torna-se básica). Expliquemos tudo isto por meio de um caso típico. Para técnicas e casos mais complicados (raramente necessários na prática), veja a Ref. [F5] no Apêndice. 1.

EXEMPLO 1

Método Simplex, Solução Factível Degenerada A AB Steel, Inc. produz dois tipos de ferroF1 e F2, utilizando três tipos de matéria-prima M1, M2, M3 (ferro de sucata e dois tipos de minério) conforme o mostrado. Maximize o lucro diário.

Matéria-prima Necessária por Tonelada Matéria-prima

Ferro F1

Ferro F2

Matéria-prima Disponível por Dia (t)

M1

2

1

16

M2

1

1

8

M3

0

1

3,5

Lucrolíquidoportonelada

$150

$300

Solução.

Usemos x 1 e x2 para representar o volume (em toneladas) produzido por dia dos tipos de ferro F1 e F 2, respectivamente. Então, nosso problema é como se segue. Maximizar z

ƒ(x)

2 x1

x2

16.

(matéria-prima M1)

x1

x2

8.

(matéria-prima M2)

x2

3,5

(matéria-prima M3)

(1) sujeita às restrições x1



0, x2



150 x1

300 x2

0e

Introduzindo as variáveis de folga x3, x4, x5, obtemos a forma normal das restrições

(2)

2 x1

x2

x1

x2

16.0

x3

8.0

x4

x2 xi

3,5

x5

0

(i

1,







, 5).

Como na última seção, obtemos de (1) e (2) a tabela simplex inicial z

T0

(3)



x1 | | | | | | | | |

x2

x3 | | | | | | | | |

x4

x5

b | | | | | | | | |

– 1– – – –150 – – – – –300 – – – – 0– – – – 0– – – – –0 – – – 0– – 0 0 0

2

1

1

1

0

1

1

0

0

0

1

0

0

0

1

16 8 3,5



.

Vemos que x1 e x2 são variáveis não-básicas e que x3, x4, x5 são básicas. Com x1 = x 2 = 0 temos, vindo de (3) a solução básica factível x1 = 0,

x2 = 0,

x3 = 16/1 = 16,

x4 = 8/1 = 8,

x5 = 3,5/1 = 3,5,

z = 0.

Isto corresponde a O:(0, 0) da Fig. 474. Temosn = 5 variáveis xj, m = 3 restrições e n – m = 2 variáveis iguais a zero em nossa solução, a qual, por conseguinte, é não-degenerada.

Passo 1 da Pivotação Operação O1: Seleção da Coluna do Pivô. Coluna 2 (visto que –150 < 0). Operação O2: Seleção da Linha do Pivô. 16/2 = 8, 8/1 = 8; 3,5/0 não é possível. Portanto, poderíamos escolher ou a Linha 2 ou a Linha 3. Escolhamos a Linha 2. O pivô é 2. Operação O3: Eliminação por Operações de Linhas. Isto fornece a tabela simplex

138

Parte F • Otimização, Grafos

z

(4)

T1



x1

x2

x3

x4

x5

b

| | | – –1 – –| – –0– – – 225 – – – –| – – 75 ––– ––0 – – – – 0– – |– –1200 –– – | | | | | | |

0 0 0

2

1

0

1 2

0

1

| | | | | | |

_

1

0

0

2

1

0

0

0

1

_1

| |

16

| | | |

0 3,5



Linha 1

75 Linha 2

Linha 3

_1 Linha 2 2

Linha 4

Vemos que as variáveis básicas sãox1, x4, x5 e que as não-básicas são x2, x3. Fazendo as variáveis não-básicas serem nulas, obtemos de a solução básica factível x1 = 16/2 = 8,

x2 = 0,

x3 = 0,

x4 = 0/1 = 0,

x5 = 3,5/1 = 3,5,

T1

z = 1200.

x2 f = 1725

x4 = 0

x3 = 0 x5 = 0

C

3,5

B

f=0 A O

x1

8

Fig. 474. Exemplo 1, onde A é degenerada Isto corresponde a A: (8, 0) da Fig. 474. Esta solução é degenerada, pois x4 = 0 (além de x2 = 0, x3 = 0); geometricamente, a reta x4 = 0 também passa por A. Isto exige o próximo passo, no qual x 4 se tornará não-básica.

Passo 2 da Pivotação Operação O1: Seleção da Coluna do Pivô. Coluna 3 (visto que –225 < 0). Operação O2: Seleção da Linha do Pivô. 16/1 = 16, 0/ 12 = 0. Portanto,

1 2

tem que ser o pivô.

Operação O3: Eliminação por Operações de Linhas. Isto fornece a seguinte tabela simplex. z



x1

x2

x3

x4

x5

b

– 1– – – –0 – – – –0– – –150 – – – – –450 – – – – – 0– – – –1200 –– –

(5)

T2

| | | | | | | | |

0 0 0

2

0

_1

0

2

0

0

| | | | | | | | |

2

2

0

1 2

1

0

1

2

1

_

| | | | | | | | |

16 0 3,5



Linha 1

450 Linha 3

Linha 2

2 Linha 3

Linha 4

2 Linha 3

Vemos que as variáveis básicas sãox1, x2, x5 e que as não-básicas são x3, x4. Logo, x4 torna-se não-básica, como pretendíamos. Igualando as variáveis não-básicas a zero, obtemos de T2 a solução básica factível x2 = 0/ 12 = 0,

x1 = 16/2 = 8,

x3 = 0,

x4 = 0,

x5 = 3,5/1 = 3,5

z = 1200.

Isto ainda corresponde a A: (8, 0) na Fig. 474 e z não aumentou. Entretanto, isto abre o caminho para a obtenção do máximo, que será atingido no próximo passo.

Passo 3 da Pivotação Operação O1: Seleção da Coluna do Pivô. Coluna 4 (visto que –150 < 0). Operação O2: Seleção da Linha do Pivô. 16/2 = 8, 0/(– 12 ) = 0, 3,5/1 = 3,5. Podemos tomar 1 como o pivô. (Com – 12 como pivô, não sairíamos de A. Experimente.) Operação O3: Eliminação por Operações de Linhas. Isto fornece a seguinte tabela simplex. z

(6)

T3



x1

x2

x3

x4

x5

b

| | 0 | 0 –1– –| – 0 –– –– – – |– – – – –150 – – – –150 – – – |– –1725 –– ––

0 0 0

| | | | | | |

2 0 0

0

_1 2

0

| | | | | | |

0

2

2

0

0

1 2

1

2

1

_

| | | | | | |

9



1,75 3,5

Linha 1

150 Linha 4

Linha 2

2 Linha 4

Linha 3

_1 Linha 2 2

Vemos que as variáveis básicas sãox1, x2, x3 e que as não-básicas são x4, x5. Igualando as últimas a zero, obtemos de factível

T3 a solução básica

Capítulo 22: Otimização sem Restrições. Programação Linear

x1 = 9/2 = 4,5,

x2 = 1,75/ 12 = 3,5,

x3 = 3,5/1 = 3,5,

x4 = 0,

x5 = 0,

139

z = 1725.

Isto corresponde a B: (4,5, 3,5) na Fig. 474. Como a Linha 1 de T3 não possui elementos negativos, atingimos o lucro diário máximo zmáx = f(4,5, 3,5) = 150  4,5 + 300  3,5 = $1725, que é obtido usando-se 4,5 toneladas de ferro F1 e 3,5 toneladas de ferro F2. 

Dificuldades no Início Um segundo tipo de dificuldade surge quando, às vezes, é difícil encontrar uma solução básica factível que sirva de ponto de partida. Em casos assim, a idéia de se criar uma variável artificial (ou várias delas) mostra-se útil. Expliquemos este método por meio de um exemplo típico.

EXEMPLO 2

Método Simplex: Início Difícil, Variável Artificial Maximizar

(7)

ƒ(x)

z

sujeita às restrições x1



0, x2



x2

_1 x

2

1

x1

x2

2

x1

x2

4.

x1

Solução.

2 x1

0 e (Fig. 475) 2

Usando variáveis de folga, obtemos a forma normal das restrições 2 x1

z

(8)

0

x2

_x 1 2

x1 x1

x2

x1

x2

2

x4

4

x5

0

xi

1

x3

2

(i

1,







, 5).

Note que a primeira variável de folga é negativa (ou nula), o que faz x3 ser não-negativa dentro da região de factibilidade (e negativa fora dela). De (7) e (8), obtemos a tabela simplex z



x1

x2

x3

x4

x5

b

– –1 – – – –2– – – –1– – – – –0 – – –0– – – 0 – – – – 0– – 0 0 0

| | | | | | | | |

| | | | | | | | |

_1

1

2

1

1

1

1

1

0

0

0

1

0

0

0

1

| | | | | | | | |

1 2 4



.

x1 e x2 são não-básicas, e gostaríamos de considerar x3, x4 e x5 como variáveis básicas. Pelo nosso processo usual de igualar as variáveis nãobásicas a zero, obtemos desta tabela x1 = 0,

x2 = 0,

x3 = 1/(–1) = –1,

x4 = 2/1= 2,

x5 = 4/1 = 4,

z = 0.

x3 < 0 indica que (0,0) situa-se fora da região de factibilidade. Como x3 < 0, não podemos operar imediatamente. Ora, ao invés de procurarmos por outras variáveis básicas, utilizemos a seguinte idéia. Resolvendo para x3 a segunda equação em (8), temos 1

x3

_1 x

x1

2

2

.

A isto somamos agora uma variávelx6 à direita, (9) x6 é chamada de

1

x3

_x 1 2

x1

2

x6.

variável artificial e está sujeita à restrição x6  0. x2 f=7

B

2

C

1

0 0

A 1

2

3

x1

Fig. 475. Região de factibilidade do Exemplo 2

140

Parte F • Otimização, Grafos Precisamos levar em conta que x6 (que não faz parte do problema dado!) terminará por desaparecer. Veremos que é possível conseguir somando-se à função-objetivo um termo – Mx6 com um M muito grande. Devido a (7) e (9) (resolvidas para x6), isto fornece a função-objetivo modificada para este “problema estendido” (10)

z

z

ˆ

2 x1

Mx 6

x2

(2

Mx 6

M ) x1

_1 M) x

(1

2

M.

Mx3

2

Vemos que a tabela simplex correspondente a (10) e (8) é z

x1

ˆ

x2

x3

_1M

x4

x5

x6

b

1 2 0 0 0 M M M 1 2 –– –– –– –– –– –– –– –– –– –– –– –– –– –– –– –– –– –– –– –– 1 _ 0 | 1 0 0 0 | 1 1 | 2 | | |

0

T0

0



0

| |

1

| | | | |

1

1

1 2

| | |

| |

1

1

| | |

| | | |

_

|

0

1

0

0

0

0

1

0

1

0

0

1

| |

2

| | |

.

4

|



1

|

_x 1 2

1. Vemos que agora podemos começar, tomandox4, x5, x6 x1 x3 x6 A última linha desta tabela é resultante de (9) escrita como 2 como as variáveis básicas e x1, x2, x3 como as não-básicas. O primeiro elemento da Coluna 2 é negativo. Podemos tomar o segundo elemento (1 na Linha 2) como pivô. Isto fornece

T1

z

x1

ˆ



x2

x3

x4

x5

x6

b

1 | 0 2 | 2 0 0 0 | 2 – – – –| – – – – – – – – | – – – – – – – – – – – – – – – – – – –| – – – | | |

0 0 0

2

_1

0

2

_3

0

| | |

0

_1

1

| | |

2

0

0

| | | | | | | | |

1

0

0

0

1

1

0

0

1

0

1

0

0

0

0

1

| | |

1 1

| | |

3

| | |

0



.

Isso corresponde a x1 = 1, x2 = 0 (ponto A na Fig. 475), x 3 = 0, x4 = 1, x5 = 3, x6 = 0. Podemos agora descartar a Linha 5 e a Coluna 7. Deste modo, eliminamos x6, como queríamos, e obtemos z

T2



x1

x2

x3

x4

x5

b

1 | 0 2 | 2 0 0 | 2 –– –– –– –– –– –– –– –– –– –– –– –– –– –– 0 0 0

|| | | | | | |

|| | | | | | |

_

1

1 2

0

1 2

0

3 2

_ _

1

0

0

1

1

0

1

0

1

|| | | | | | |

1 1 3

Na Coluna 3, escolhemos 3/2 como o próximo pivô. Obtemos z

T3



x1

x2

x3

x4

_2

x5

b

_4

| 1 | 0 0 | 0 6 3 3 – – – –| – – – – – – – –| – – – – – – – – – – – –| – – – | | 1 _2 _ | 2 0 | 1 0 | 0 | 3 3

0 0

| | | | |

0

0

0

3 2

_

| | | | |

_

_

4 3

1

1 3

1

0

1



.

| | | | |

2 3



.

Isto corresponde a x1 = 2, x2 = 2 (correspondente ao B na Fig. 475), x3 = 0, x4 = 2, x5 = 0. Na Coluna 4, escolhemos 4/3 como pivô pelo princípio usual, o que dá z

x1

x2

x3

x4

_

T4



x5

b

_

1 2

3 2

4 3

1

1 3

0

3 4

| | 1 0 0 | 0 7 – – – –| – – – – – – – – –| – – – – – – – – – – – –| – – – | | 1 1 _ _ | 3 0 1 0 | 0 | | 2 2

0 0

| | | | |

0 0

0

_3 2

| | | | |

_

_

_ _

3 4

| | | | |

2

_3 2



.

Isto corresponde a x1 = 3, x2 = 1 (ponto C na Fig. 475), x 3 = 32 , x4 = 0, x5 = 0, que é o máximo fmáx = f(3,1) = 7.



141

Capítulo 22: Otimização sem Restrições. Programação Linear

PROBLEMAS PROPOSTOS 22.4 Se, num passo da resolução, você puder escolher o pivô, escolha o primeiro que aparecer na coluna considerada.

1. Maximize z = f1(x) = 6x1 + 12x2 sujeita a 0  x1  4, 0 4, 6x1 + 12x2





x2

6. Maximize a produção totalf = x1 + x2 + x3 (números de produção de três diferentes processos) sujeita às seguintes restrições de entrada



4x1 + 5x2 + 8x3  12,

72.

2. Faça o Problema 1 trocando as duas últimas restrições. 3. Maximize o volume diário de produção no fabrico dex1 pratos de vidro por um processo P1 e x2 desses mesmos pratos por um processo P2 sujeito às restrições (horas de mão-de-obra, horasmáquina e suprimento de matéria-prima)

8x1 + 5x2 + 4x3



12.

7. Maximize f = 6x1 + 6x2 + 9x3 sujeita a xj  0 (j = 1,

3x2

130, 4x1 2 x2

3x1 8x2 140.

300,

4. Maximize z = 300x1 + 500x2 sujeita a 2x1 + 8 x2  60, 2x1 + x2  30, 4x1 + 4x2



0, x2



te sobre a simplificação resultante.



0, x1 + x2

QUESTÕES E PROBLEMAS DE REVISÃO DO



5, – x1 + x2



1, 5x1 + 4x2





40. 

CAPÍTULO 22 15–20

Faça um gráfico ou esboço da região no primeiro quadrante do plano x1x2 determinado pelas seguintes desigualdades. 15.

3. Escreva um algoritmo para o método domáximo declive. 4. Elabore um “método da máxima ascensão” para a determinação de máximos.

, 5) e x1

solução, essa não-existência tornar-se-á evidente pelo fato de não ser possível eliminar a variável artificial. Ilustre tal fato tentando maximizar f = 2x1 + x2 sujeita a x1  0, x2  0, 2x1 + x2  2, x1 + 2x2  6, x1 + x2  4.

5. Faça o Problema4 com as duas últimas restrições trocadas. Comen-

declive.



f = 4 x1 + x2 + 2 x3 sujeita a x1 0, x2 0, x3 0, x1 + 9. xMaximize 2 + x3  1, x1 + x2 – x3  0. 10. Se se usa o método das variáveis artificiais num problema sem

60.

1. Qual é a diferença entre a otimização com esem restrição? 2. Enuncie a idéia e as fórmulas básicas do método do máximo



8. Usando uma variável artificial, minimize f = 2x1 – x2 sujeita a x1 

2 x1



+ x 3 + x 4 = 1, x2 + x 3 + x 5 = 1.

17.

5. O que é programação linear? Qual é a sua idéia básica? O que é uma função-objetivo?

x1

3x2

6

2 x1

x2

4

x1

x2

0

x1

x2

4

16 .

18.

6. Por que não podemos usar osmétodos do cálculo para os extremos

x1

2 x2

2

0, 8 x 1

x2

6

x1

2 x2

4

2 x1

x2

12

x1

x2

8

em programação linear?

7. O que são variáveis de folga? Variáveis artificiais? Por que as

19.

x1

usamos?

8. Aplique o método do máximo declive a f(x) = x12 + 1,5x22, começando de (6,3). Faça três iterações. Por que a convergência é mais rápida que a do Exemplo 1 da Seção 22.1?

x1

20.

x2

5

x1

x2

2

x2

3

2 x1

3x2

12

x2

2

x1

15

9. Ao que o método do máximodeclive praticamente se equivale no 21–25 Maximize ou minimize como indicado. caso de uma variável única? 21. Maximize f = 10x1 + 20x2 sujeita a x1  5, x1 + x2  6, x2  4. 10. No Problema 8, comece dex0 = [1,5 1]T. Mostre que as próximas 22. Maximizef = x1 + x2 sujeita ax1 + 2x2  10, 2x1 + x2  10, x2  4. aproximações pares sãox2 = kx0, x4 = k2x0 etc., onde k = 0,04. 23. Minimize f = 2x1 – 10x2 sujeita a x1 – x2  4, 2 x1 + x2  14, x1 11. No Exemplo 1 da Seção 22.1, oque acontece se se substituiu a + x2  9, –x1 + 3x2  15. função f(x) = x12 + 3x22 por f(x) = x12 + 5x22? Faça cinco iterações, 24. Uma fábricaproduz dois tiposde juntasG1, G2, com um lucro líquido começando de x0 = [6 3]T. A convergência é mais rápida ou mais de $60 e $30, respectivamente. Maximize o lucro diário total sujeito lenta?

12. Aplique o método do máximo declive af(x) = 9x12 + x22 + 18x1 – 4 x2, cinco iterações, começando dex0 = [2 4]T. T 13. No Problema 12, você poderia começar de [0 0] e fazer cinco iterações?

14. Mostre que os gradientes do Problema 13são ortogonais. Justifique.

às restrições x(j = número de juntasGj produzidas por dia) 40x1 + 40x2



200x1 + 20x2

1800 (horas-máquinas), 

6300 (mão-de-obra).

25. Maximize a produção diária nofabrico dex1 cadeiras por um processo P 1 e de x2 cadeiras por um processoP 2, sujeita a 3x1 + 4x2  550 (horas-máquinas), 5x1 + 4x2  650 (mão-de-obra).

142

Parte F • Otimização, Grafos

22

RESUMO DO CAPÍTULO

Otimização sem Restrições. Programação Linear Em problemas de otimização, maximizamos ou minimizamos uma função-objetivo z = f(x) dependente de variáveis de controle x1, , xm cujo domínio é ou irrestrito (“otimização sem restrições”, Seção 22.1), ou restrito, ou seja, submetido a restrições que assumem a forma de desigualdades, ou de equações, ou de ambas (“ otimização com restrições”, Seção 22.2). Se a função-objetivo é linear e as restrições são desigualdades lineares em x1, , xm, então, pela introdução de variáveis de folga xm+1, , xn podemos expressar o problema de otimização na forma normal com a função-objetivo dada por •

















c1x1





cn xn



= cn = 0) e as restrições dadas por a11x1

(2)





ƒ1

(1) (onde cm+1 =



a12 x2



••••••

••••••

••••••

••••••

••••••

••••••

am1x1

am2 x2 x1

0,















a1nxn

•••••••

••

•••••••

••



, xn

amnxn

b1

bm

0.

Neste caso, podemos então aplicar o método simplex (Seção 22.3), amplamente empregado, que consiste em uma pesquisa sistemática e passo a passo sobre um subconjunto extremamente reduzido de todas as soluções factíveis. A Seção 22.4 mostra como contornar dificuldades surgidas com este método.

23

CAPÍTULO

Grafos. Otimização Combinatória Os grafos e os digrafos (grafos orientados) vêm se desenvolvendo como poderosas ferramentas em áreas como engenharia elétrica e civil, redes de comunicação, pesquisa operacional, ciência da computação, economia, gerência industrialdee marketing. essencial desse crescimento uso de computadores em problemas de otimização larga escala,Um quefator podem ser modelados por grafosé eoresolvidos por algoritmos fornecidos pela teoria dos grafos. Essa abordagem produz modelos de aplicabilidade geral e de importância econômica, consistindo no centro da otimização combinatória, um termo que se refere aos problemas de otimização com uma destacada estrutura discreta ou combinatória. Este capítulo serve de introdução a essa vasta área, que muda a ênfase anteriormente dada às equações diferenciais, aos autovalores etc., e está repleta de novas idéias e de problemas abertos — em conexão, por exemplo, com os algoritmos computacionais eficientes. As classes de problemas que consideraremos aqui incluem os transportes com um mínimo de custo ou de tempo, a melhor atribuição de tarefas a funcionários, a utilização mais eficiente das redes de comunicação e muitas outras. Problemas desse tipo freqüentemente constituem o centro de problemas práticos maiores e mais complexos. Pré-requisito: Nenhum. Referências e Respostas dos Problemas: Parte

F do Apêndice 1, Apêndice 2.

23.1 Grafos e Digrafos Grosso modo, um grafo consiste em pontos, chamados de vértices, e de linhas que os conectam, chamadas de arestas. Um exemplo disso pode ser quatro cidades conectadas por cinco auto-estradas, como ilustra a Fig. 476. Ou os pontos podem representar um certo número de pessoas, e unimos por uma aresta as pessoas que trabalham umas com as outras. Ou então os vértices podem representar os computadores de uma rede, e as arestas, as conexões entre esses computadores. Façamos agora uma definição formal. Laço

Vértice isolado 1 e5

e1 e2

2 3

e4

4 e3

Fig. 476. Grafo consistindo em 4 vértices e 5 arestas

DEFINIÇÃO

Aresta dupla

Fig. 477. Vértice isolado, laço, aresta dupla. (Excluídos por definição.)

Grafo

Um grafo G consiste em dois conjuntos finitos (conjuntos possuindo um número finito de elementos), um conjunto V de pontos, chamados de vértices, e um conjunto E de linhas de conexão, chamadas de arestas, de tal modo que cada aresta conecta dois vértices, chamados de extremidades da aresta. Escrevemos G  ( V, E).

Excluem-se disso os casos de vértices isolados (vértices que não são extremidades de nenhuma aresta), os laços (arestas cujas extremidades são coincidentes) e as arestas múltiplas (arestas que têm em comum as duas extremidades). Veja a Fig. 477.

144

Parte F • Otimização, Grafos

CUIDADO! As três exclusões que fizemos são de ordem prática e de aceitação geral, embora não-uniforme. Por exemplo, alguns autores permitem a ocorrência de arestas múltiplas, chamando os grafos destituídos destas de  grafos simples. Representemos os vértices por letras, u, v, ou v1, v2, ou simplesmente por números 1, 2, (como na Fig. 476). Representemos as arestas por e1, e2, ou por seus pares de extremidades; por exemplo, na Fig. 476, e1 = (1, 4), e2 = (1, 2). Uma aresta (vi, vj) é chamada de incidente ao vértice vi (e vice-versa); similarmente, (vi, vj) também é incidente a vj. O número de arestas incidentes a um vértice v é chamado de grau de v. Dizemos que dois vértices são adjacentes em G se eles são conectados por uma aresta em G (ou seja, se eles são as duas extremidades de alguma aresta em G). Os grafos recebem nomes diferentes em diferentes campos de aplicação: “circuitos” em engenharia elétrica, “estruturas” em engenharia civil, “estruturas moleculares” em química, “estruturas organizacionais” em economia, “sociogramas”, “mapas viários”, “redes de telecomunicação”, e assim por diante. •























Digrafos (Grafos Direcionados) Redes viárias com ruas de mão única, redes de água e esgoto, seqüências de tarefas em um trabalho de construção, fluxos de computação em um computador, relações produtor–consumidor e muitas outras aplicações sugerem a idéia de “digrafos” (= grafos orientados), onde cada aresta tem uma direção (indicada por uma seta, como na Fig. 478). e1

1 e5 e4

3

e6

2

e7

e2

4

e3

Fig. 478. Digrafo

DEFINIÇÃO

Digrafo (Grafo Orientado)

Um digrafo G = (V, E) é um grafo no qual cada aresta e = (i, j) tem uma direção partindo de seu “ ponto inicial” i e indo até seu “ponto final” j. Agora, permite-se a ocorrência de duas arestas conectando os mesmos pontos i, j, desde que elas tenham direções opostas, isto é, sejam (i, j) e (j, i). Exemplo. (1, 4) e (4, 1) na Fig. 478. Um subgrafo ou subdigrafo de um dado grafo ou digrafo G = (V, E) é, respectivamente, um grafo ou um digrafo obtido pela exclusão de algumas das arestas e vértices de G, mantendo-se as demais arestas de G (juntamente com seus pares de extremidades). Por exemplo, e1, e3 (juntamente com os vértices 1, 2, 4) formam um subgrafo na Fig. 476, e e3, e4, e5 (juntamente com os vértices 1, 3, 4) formam um subdigrafo na Fig. 478.

Representação Computacional de Grafos e Digrafos Os desenhos de grafos são úteis quando desejamos explicar ou ilustrar situações específicas. Aqui, devemos estar cientes de que um grafo pode ser esboçado de diversas maneiras; veja a Fig. 479. Para manipular grafos e digrafos em computadores, usamos matrizes ou listas na forma de estruturas apropriadas de dados, como se segue. 5

8 1

4

2

3

6

4

5

3 5

7 (a)

1 2

8

6

7 (b)

8 4

1

2

3

6

7 (c)

Fig. 479. Diferentes esboços de um mesmo grafo

Capítulo 23: Grafos. Otimização Combinatória

145

Matriz de Adjacência de um Grafo G: Matriz A = [aij] com os elementos



ai j

1

se G tem uma aresta (i, j ),

0

então.

Portanto, aij = 1 se e somente se os dois vértices i e j são adjacentes em G. Aqui, por definição, nenhum vértice é considerado adjacente a si mesmo; portanto, aii = 0. A é simétrica, aij = a ji. (Por quê?) A matriz de adjacência de um grafo é geralmente muito menor do que a chamada matriz de incidência (veja os Problemas 21, 22), sendo preferível sobre esta última quando decidimos armazenar um grafo em forma matricial em um computador. EXEMPLO 1

Matriz de Adjacência de um Grafo 1

Vértice

2

Vértice 1 2 3 3

4

4

1



2

3

4



0101 1011 0101 1110



Matriz de Adjacência de um Digrafo G: Matriz A = [aij] com os elementos



ai j

1

se G tem uma aresta (i, j ),

0

então.

Essa matriz A não é simétrica. (Por quê?) EXEMPLO 2

Matriz de Adjacência de um Digrafo 1

Paraovértice

2

1

2 3 3

4

4

2

3

4

0100

Do vértice 1





1001 0100 0000



Listas. A lista de incidência dos vértices de um grafo mostra para cada vértice as arestas incidentes. A lista de incidência das arestas mostra para cada aresta suas duas extremidades. Algo similar se passa com um digrafo; na lista dos vértices, as arestas que saem recebem um sinal negativo e, na lista das arestas, temos agora os pares ordenados dos vértices. EXEMPLO 3

Lista de Incidência dos Vértices e Lista de Incidência das Arestas de um Grafo Este grafo é o mesmo do Exemplo 1, exceto pela notação. e1

v1 e5

v2 e2

v3

e3

v4 e4

Vértice

v1 v2 v3 v4

Arestas incidentes

e1, e 5 e1, e 2, e 3 e2, e 4 e3, e 4, e 5

Aresta Extremidades

e1 e2 e3 e4 e5

v1, v2, v2, v3, v1,

v2 v3 v4 v4 v4



146

Parte F • Otimização, Grafos

“Grafos esparsos” são os que apresentam poucas arestas (muito menos do que o número máximo possível – 1)/2, onde n é o número de vértices). Para esses grafos, as matrizes não são eficientes. As listas têm então a vantagem de requerer muito menos espaço de armazenamento e de ser mais fáceis de manipular; elas podem ser ordenadas, classificadas ou manipuladas de várias outras maneiras diretamente pelo computador. Por exemplo, quando traçamos um “caminho” (uma seqüência de arestas conectadas aos pares pelas extremidades comuns), podemos facilmente ir para trás e para a frente entre as duas listas recém-discutidas, em vez de examinarmos uma grande coluna de uma matriz em busca de um simples 1. Graças à ciência da computação, vêm-se produzindo listas mais refinadas, que, além dos conteúdos reais, contêm “ponteiros” indicando ou o item anterior, ou o item seguinte a ser examinado, ou ambos (no caso de um “caminho”, eles indicam a aresta anterior ou a seguinte). Para detalhes, veja as Refs. [E16] e [F7]. Esta seção tratou dos conceitos e notações básicas de que precisaremos ao longo deste capítulo, onde discutiremos algumas das mais importantes classes de problemas de otimização combinatória. Ao mesmo tempo, isso n(n

ajudará a nos familiarizarmos cada vez mais com os grafos e os digrafos.

PROBLEMAS PROPOSTOS 23.1 1. Esboce o grafo constituído dos vértices earestas de um quadrado. Esboce o grafo cuja matriz de adjacência é: Idem para um tetraedro. 0111 2. O operário O1 pode fazer as tarefas T1 e T3, o operário O2 pode fazer a tarefa T4, e o operário O3, as tarefas T2 e T3. Represente 1011 14. isso por um grafo. 1101 3. Explique como é possível usar grafos ou digrafos para modelar a seguinte situação: conexões de vôo entre determinadas cidades; 1110 participação de algumas pessoas em certos comitês; relações 0100 entre os capítulos de um livro; um torneio de tênis; uma árvore genealógica. 1000 4. Como você representaria uma rede constituída de ruas de mão 15. 0001 única e de mão dupla por um digrafo? 5. Dê outros exemplos de situações que poderiam ser representadas 0010

por grafosa ou digrafos. 6. Encontre matriz de adjacência do grafo da Fig. 476. 7. Quando a matriz de adjacência de um grafo será simétrica? E de 16. um digrafo? 8–12 MATRIZ DE ADJACÊNCIA Encontre a matriz de adjacência do grafo ou digrafo. e1 e2 8. 9. 1 1

2

e4

e3

5

e6

10.

2

3

e1

e5

4

1

3

6

e7

2

3

11.

4

e1

1

e4

5

12.

1 e7

e3

e4

e5

4

3

13.

2

e2

3

e3

6

e1

1

2

e2

e5

4

e3

e2

e4

4 e2

e1 e3

e6

5

2

3

  

  

0111 1001 1001 1110

Esboce o digrafo cuja matriz de adjacência é: 17. A matriz do Problema 14. 18. A matriz do Problema 16. 19. (Grafo completo) Mostre que um grafo G com n vértices pode ter no máximo n(n – 1)/2 arestas, e que G possuirá exatamente n(n – 1)/2 arestas seG for completo, isto é, se todo par de vértices de G for unido por uma aresta. (Lembre que os laços e as arestas múltiplas estão excluídos.) 20. Em que caso todos os elementos de fora dadiagonal da matriz de adjacência de um grafoG são iguais a 1? Matriz de Incidência de um Grafo: Matriz B = [bjk] com os elementos bjk



1

se o vértice j for o ponto final da aresta ek

0

caso contrário.

Encontre a matriz de incidência do: 21. Grafo do Problema 9. 22. Grafo do Problema 8. Matriz de Incidência de um Digrafo: Matriz B  [ b jk] com os elementos 



147

Capítulo 23: Grafos. Otimização Combinatória

b jk



1

se a aresta ek sair do vértice j

1

se a aresta ek entrar no vértice j

0

caso contrário.

Encontre a matriz de incidência do: 23. Digrafo do Problema 11. 24. Digrafo do Problema 13. 25. Faça uma lista de incidência dos vértices do digrafo doProblema 13.

23.2 Problemas de Trajetória Mínima. Complexidade Iniciaremos esta seção discutindo algumas das mais importantes classes de problemas de otimização que tratam dos pequenos grafos e digrafos das aplicações. As idéias e osproblemas algoritmos serão explicados e ilustrados por grafos, oriundos porém devemos ter em mente que os dafundamentais vida real podem freqüentemente envolver milhares ou mesmo milhões de vértices e de arestas (pense, p. ex., nas redes telefônicas, no transporte aéreo intercontinental, ou nas companhias que possuem escritórios e lojas em todas as grandes cidades). Então, faz-se absolutamente necessário dispor de métodos sistemáticos, eficientes e confiáveis — as soluções por inspeção ou por tentativa e erro não mais funcionariam, ainda que fossem aceitáveis soluções “razoavelmente ótimas”. Começaremos com os problemas de trajetória mínima surgidos, por exemplo, quando tentamos determinar quais serão as rotas mais curtas (ou menos caras, ou mais rápidas) para vendedores, navios cargueiros etc. Expliquemos primeiro o que entendemos por uma trajetória. Em um grafo G = (V, E) podemos caminhar de um vértice v1 ao longo de algumas arestas até chegarmos a um outro vértice vk. Aqui, podemos:

(A) não impor qualquer restrição, ou (B) requerer que cada aresta de G seja percorrida no máximo uma vez, ou (C) requerer que cada vértice seja visitado no máximo uma vez. No caso (A), chamamos isso de caminho. Portanto, um caminho de (1)

(v1, v2), ( v2, v3),







v1

a

vk

tem a forma

, (vk 1, vk), 

onde algumas dessas arestas ou vértices podem ser os mesmos. No caso (B), onde cada aresta pode ocorrer no máximo uma vez, chamamos o caminho de trilha. Finalmente, no caso (C), onde cada vértice pode ocorrer no máximo uma vez (e, portanto, cada aresta automaticamente ocorre no máximo uma vez), chamamos a trilha de trajetória. Admitamos que um caminho, trilha ou trajetória possam terminar no mesmo vértice onde começaram, sendo assim chamados de fechados; então, em (1), vk = v1. Dizemos que uma trajetória fechada é um ciclo. Um ciclo possui pelo menos três arestas (visto não haver arestas duplas; veja a Seção 23.1). A Fig. 480 ilustra todos esses conceitos.

5

1

2

4

3

Fig. 480. Caminho, trilha, trajetória, ciclo 1 – 2 – 3 – 2 é um caminho (não uma trilha). 4 – 1 – 2 – 3 – 4 – 5 é uma trilha (não uma trajetória). 1 – 2 – 3 – 4 – 5 é uma trajetória (não um ciclo). 1 – 2 – 3 – 4 – 1 é um ciclo.

Trajetória Mínima

Para definirmos o conceito de trajetória mínima, suponhamos que G = (V, E) seja um grafo ponderado, isto é, cada aresta (vi, vj) em G possui um dado peso ou comprimento lij > 0. Então, uma trajetória mínima v1 vk (com v1 e vk fixos) é uma trajetória (1) tal que a soma dos comprimentos de suas arestas →

l12  l23  l34 







 lk1,k

(l12 = comprimento de ( v1, v2) etc.) é mínima (tão pequena quanto possível entre todos os caminhos de Similarmente, uma trajetória máxima v1 vk é aquela para a qual a soma é máxima. →

v1

a

vk

).

148

Parte F • Otimização, Grafos

Os problemas de trajetória mínima (ou máxima) estão entre os mais importantes problemas de otimização. Aqui, o “comprimento” lij (com freqüência também chamado de “custo” ou “peso”) pode ser um comprimento real medido em quilômetros, ou o tempo de viagem, ou o custo da gasolina, mas também pode ser algo completamente diferente. Por exemplo, o “problema do vendedor viajante” requer a determinação de um ciclo hamiltoniano1 mínimo em um grafo, ou seja, um ciclo que contenha todos os vértices do grafo. Como outro exemplo, escolhendo o percurso “mais lucrativo” v1 vk, um vendedor pode desejar maximizar lij, onde lij é sua comissão esperada menos seus custos de viagem para ir da cidade i à cidade j. Em um problema de investimento, i pode ser o dia em que um investimento é feito, j o dia em que ele começa a dar retorno/matures e lij o lucro resultante, e obtemos um grafo considerando as diversas possibilidades de investimento e reinvestimento durante um dado período de tempo. →

l=1 Trajetória Mínima Quando Todas as Arestas Têm o Comprimento Obviamente, se todas as arestas têm o comprimento 1, então uma trajetória mínima v1 vk é aquela que possui o menor número de arestas entre todos os caminhos v1 vk em um dado grafo G. Para tratar deste problema, utilizamos um algoritmo BFS, que é a abreviatura de Breadth First Search ( Primeira Busca em Largura). Isto significa que, em cada passo, o algoritmo visita todos os vértices vizinhos (ou seja, todos os vértices adjacentes) a um vértice alcançado, opondo-se assim aos algoritmos DFS ( Depth First Search ou Primeira Busca em Profundidade), que percorrem longas trilhas (como em um labirinto). Este algoritmo BFS, de grande utilização, é mostrado na Tabela 23.1. Desejamos encontrar em G um caminho mínimo partindo de um vértice s (início) até um vértice t (final)*. Para garantirmos a existência de uma trajetória de s a t, temos que nos certificar de que G não consiste em porções separadas. Portanto, supomos que G seja conectado, isto é, para quaisquer dois vértices v e w, há um caminho v w em G. (Lembre que um vértice v é chamado de adjacente a um vértice u se existe uma aresta ( u, v) em G.) →





Tabela 23.1 Algoritmo BFS de Moore para a Trajetória Mínima (Todos os Comprimentos Unitários) Proceedings of the International Symposium for Switching Theory , Parte II, pp. 285–292. Cambridge: Harvard University Press, 1959.

ALGORITMO MOORE [G = (V, E), s, t] Este = (algoritmo G V, E).

determina uma trajetória mínima de um vértice s a um vértice t em um grafo conectado

ENTRADA: Grafo conectado G = (V, E), no qual um vértice é denotado por s e o outro por t, e cada aresta (i, j) tem o comprimento lij = 1. Inicialmente, todos os vértices são não-rotulados. SAÍDA: Uma trajetória mínima s t em G = (V, E) 1. Rotular s com 0. 2. Atribuir i = 0. 3. Encontrar todos os vértices não-rotulados adjacentes a um vértice rotulado i. 4. Rotular de i + 1 os vértices recém-encontrados. 5. Se o vértice t está rotulado, então o “ backtracking” fornece a trajetória mínima ,0 K (= rótulo de t), k – 1, k – 2, SAÍDA k, k – 1, k – 2, , 0. Pare Se não, incremente i de 1. Vá ao Passo 3. Fim de MOORE →





EXEMPLO 1









Aplicação do Algoritmo BFS de Moore Encontre uma trajetória mínima s t no grafo G mostrado na Fig. 481. Solução. A Fig. 481 mostra os rótulos. As arestas em negrito formam uma trajetória mínima s t (de comprimento 4). Há ainda uma outra trajetória mínimas t. (Você é capaz de encontrá-la?) Logo, precisamos introduzir no programa uma regra que garanta um retorno único; caso contrário, o computador não saberia o que fazer a seguir se, em um certo passo, existir uma escolha (por exemplo, na Fig. 481, quando se volta ao vértice de rótulo 2). Eis uma regra que parece natural. →





Regra do Retorno. Usando a numeração dos vértices de 1 até n (não a rotulação!) em cada passo, se um vértice rotulado como i for alcançado, escolha para o próximo vértice aquele que tiver o menor número (não o rótulo!) entre todos os vértices rotulados de i – 1.  1

WILLIAM ROWAN HAMILTON (1805–1865), matemático irlandês, conhecido por seus trabalhos em dinâmica. (início e final), respectivamente. (N. T.)

s e t: abreviaturas (de uso já consagrado em português) dos termos ingleses start e terminal

*

Capítulo 23: Grafos. Otimização Combinatória

149

2 1 3

3

1 3

s

0 1

2

2

4

t

3 4

2

Fig. 481. Exemplo 1, o grafo dado e o resultado da rotulação

Complexidade de um Algoritmo Complexidade do algoritmo de Moore. Para encontrarmos os vértices a serem rotulados de 1, temos que examinar todas as arestas incidentes as. A seguir, quando i = 1, temos que examinar todas as arestas incidentes aos vértices rotulados de 1 etc. Logo, cada aresta é examinada duas vezes. Trata-se dem2 operações (m = número de arestas de G). Esta é uma função c(m). Se ela vale 2m ou 5 m + 3 ou 12m, isso não é tão importante; o importanteé que c(m) seja proporcional a m (e não a m2, por exemplo); ou seja, o importante é que a função seja de “ordem”m. Para qualquer função am + b, escrevemos simplesmenteO(m); para qualquer funçãoam2 + bm + d, simplesmente O(m2), e assim por diante; aqui,O sugere a palavra ordem. A idéia subjacente e o aspecto prático disso são os seguintes. Ao avaliarmos um algoritmo, estamos principalmente interessados em seu comportamento relacionado a problemas muito grandes (no presente caso, grandes valores de m), visto que esses problemas maiores é que determinarão os limites da aplicabilidade do algoritmo. Portanto, o item essencial é o termo de crescimento mais rápido (am2 em am2 + bm + d etc.), já que ele se sobrepujará aos demais quando m for suficientemente grande. Além disso, um fator constante neste termo não é algo muito importante; por exemplo, a diferença entre dois algoritmos de ordens, digamos, 5m2 e 8m2 em geral não é algo muito importante, podendo chegar a ser irrelevante com um modesto aumento na velocidade dos computadores. Por outro lado, existe, de fato, uma grande diferença prática entre um algoritmo de ordem m e um de ordem m2, ou um outro de uma potência mp ainda maior. E entre essas “ordens polinomiais” e as “ordens exponenciais”, como 2 m, a diferença é maior ainda. Por exemplo, em um computador que executa 109 operações por segundo, um problema de tamanho m = 50 demandará 0,3 segundo com um algoritmo que requer m5 operações, mas demandará 13 dias com um algoritmo m

que requer 2 operações. Mas Uma esta não a única para a ordemr mais polinomial boa e a ordem exponencial como ruim. outraé razão é orazão Por exemplo, ganho no considerarmos uso de um computado rápido.como consideremos dois algoritmos O(m) e O(m2). Então, como 1000 = 31,6 2, se aumentarmos a velocidade por um fator de 1000, o efeito disso é que, por hora, seremos capazes de resolver com esses algoritmos problemas 1000 e 31,6 vezes maiores, respectivamente. Mas, como 1000 = 29,97, com um algoritmo do tipo O(2 m), teremos um ganho relativamente modesto de 10 no tamanho dos problemas, visto que 29,97  2 m = 2m+9,97. O símbolo O é bastante prático e usado comumente sempre que a ordem de crescimento for essencial, embora ele não represente a forma específica da função. Portanto, se uma função g(m) possui a forma g(m) = kh(m)

+ termos de crescimento mais vagaroso

(k  0, constante),

dizemos que g(m) é da ordem h(m) e escrevemos g(m)  O(h(m)).

Por exemplo, am  b  O(m),

am2  bm  d  O(m2),

5 2 m  3 m2  O(2m). 

Desejamos que um algoritmo  seja “eficiente”, ou seja, “bom” com relação ao

(i) Tempo (número c (m) de operações computacionais), ou (ii) Espaço (armazenamento necessário na memória interna) ou a ambos. Aqui, c sugere o termo “complexidade” de . Duas escolhas comuns para c são 





(Pior caso) c (m) = maior tempo possível que  gasta com um problema de tamanho m, (Caso médio) c (m) = tempo médio que  gasta com um problema de tamanho m. 



Em problemas com grafos, o “tamanho” freqüentemente será m (o número de arestas) ou n (o número de vértices). Para o algoritmo simples que temos agora, c (m) = 2m em ambos os casos. Para que o algoritmo  seja “bom”, queremos que c (m) não cresça demasiadamente rápido. Dessa forma, dizemos que  é eficiente se c (m) = O(mk) para algum inteiro k  0; ou seja, c pode conter somente potências 







150

Parte F • Otimização, Grafos

de m (ou funções que cresçam ainda mais lentamente, como ln m), porém não funções exponenciais). Além disso, dizemos que  é polinomialmente limitado se  for eficiente quando escolhermos o “pior caso” c (m). Esses conceitos convencionais têm apelo intuitivo, como mostra nossa discussão. Deve-se investigar a complexidade para todos os algoritmos, de modo que também se possam comparar diferentes algoritmos para uma mesma tarefa. Freqüentemente, isto é algo que excede o nível deste capítulo, razão pela qual nos limitaremos a fazer alguns poucos comentários ocasionais sobre esse assunto. 

PROBLEMAS PROPOSTOS 23.2 1–6 TRAJETÓRIA MÍNIMA Encontre uma trajetória mínima P: s t e seu comprimento, usando o algoritmo BFS de Moore; esboce o grafo com os rótulos e indique P por linhas mais grossas (como na Fig. 481). 2. →

1.

s

t

s

13. Encontre e esboce um ciclo hamiltoniano na Fig. 479 na Seção 23.1. 14. (Grafo de Euler) Um grafo de Euler G é aquele que possui uma trilha de Euler fechada. Umatrilha de Euler é aquela que contém todas as arestas de G exatamente uma vez. Do grafo no Exemplo 1 da Seção 23.1, qual subgrafo com quatro arestas é um grafo de Euler? 15. O grafo da Fig. 483 é um grafo de Euler? (Justifique.)

t

2

3.

t

4.

s 1

s

s

5

3 4

3

4

4

2

5

6

Fig. 483. Problemas 15 e 17

t

5.

1

2

s

6.t

t

16. Encontre 4 diferentes trilhas fechadas de Euler na Fig. 484.

s

2

7. (Não-unicidade) Uma trajetória mínima s t para s e t dados não é necessariamente única. Ilustre este fato encontrando outra trajetória mínima s t no Exemplo 1 do texto. 8. (Comprimento máximo) Se P é uma trajetória mínima entre dois vértices quaisquer em um grafo comn vértices, quantas arestas P pode ter no máximo? E em um grafo completo (com todas as arestas de comprimento 1)? Justifique. 9. (Algoritmo de Moore) Mostre que, se um vérticev tem o rótulo l(v) = k, então existe uma trajetórias v de comprimento k. 10. Chamemos o comprimento de uma trajetória mínimas v de distância de v a s. Mostre que, se v tem a distância l, ele tem também o rótulo l(v) = l. 11. (Ciclo hamiltoniano) Encontre e esboce um ciclo hamiltoniano no grafo do Problema 3. 12. Encontre e esboce um ciclo hamiltoniano no grafo de um dodecaedro, que possui 12 faces pentagonais e 20 vértices (Fig. 482). Este foi um problema considerado pelo próprio Hamilton.

4



1







Fig. 482. Problema 12

3

5

Fig. 484. Problema 16

17. O problema do carteiro trata da obtenção de um passeio fechado W: s s (s é o correio) em um grafoG com arestas (i, j) de comprimento lij > 0 de tal forma que cada aresta deG é atravessada pelo menos uma vez e o comprimento deW é mínimo. Encontre por inspeção uma solução para o grafo da Fig. 483. (Este problema também é conhecido pelo nome deproblema do carteiro chinês devido ao fato de ele ter sido publicado no jornalChinese Mathematics 1 (1962), 273–277.) 18. Mostre que o comprimento da trajetória mínima do carteiro é o mesmo para todos os vértices iniciais. 19. (Ordem) Mostre que O(m3) + O(m3) = O(m3) e kO(mp) = O(mp). 20. Mostre que 1  m2  O(m), 0,02e m  100 m2  O(e m). 21. Se passarmos de um computador para um outro que é 100 vezes mais rápido, qual será nosso ganho horário nos tamanhos dos problemas se usarmos algoritmos que sejamO(m), O(m2), O(m5), O(em)? 22. PROBLEMA DEÁLGEBRA COMPUTACIONAL. Algoritmo de Moore. Escreva um programa de computador para o algoritmo da Tabela 23.1. Teste o programa com o grafo do Exemplo 1. Aplique-o aos Problemas 1–3 e a alguns grafos de sua escolha. →



151

Capítulo 23: Grafos. Otimização Combinatória

23.3 Princípio de Bellman. Algoritmo de Dijkstra Continuemos nossa discussão sobre os problemas de trajetória mínima em um grafo G. A última seção tratou do caso especial em que todas as arestas têm o comprimento 1. Entretanto, na maioria das aplicações, as arestas (i, j) terão quaisquer comprimentos lij > 0, de modo que agora passamos a esse caso geral, que é de maior importância prática. Escrevamos lij =  para toda aresta (i, j) que não existe em G (considerando  + a =  para qualquer número a, como usual). Consideremos o problema de encontrar trajetórias mínimas a partir de um dado vértice, representado por 1 e chamado de srcem , até todos os outros vértices 2, 3, , n de G. Consideremos que Lj represente o comprimento de uma trajetória mínima Pj: 1 j em G. •







TEOREMA 1

Princípio da Minimalidade de Bellman ou Princípio da Otimalidade2 Se P j: 1 j é uma trajetória mínima de 1 a j em G e (i, j) é a última aresta de Pj (Fig. 1 i [obtido excluindo-se (i, j) de P j] é uma trajetória mínima 1 i. →



485), então Pi:



Pi i

1

j

Fig. 485. Trajetórias P e Pi no princípio da minimalidade de Bellman

PROVA

Suponha que a conclusãoseja falsa. Então, existe um caminho Pi*: 1 i que é menor do que Pi. Logo, se agora adicionarmos (i, j) a Pi*, obteremos um caminho 1 j que é menor do que Pj. Isso contradiz nossa suposição de que Pj é a trajetória mínima.  →



Do princípio de Bellman, podemos obter equações básicas como se segue. Para um j fixo, podemos obter diversas trajetórias 1 j tomando trajetórias mínimas Pi para vários is para os quais há em G uma aresta (i, j), e adicio→

Pi correspondente. Li + olijmínimo. namos (i, j) aoagora Essas obviamente ( Li = comprimento de tomar o mínimo em itrajetórias , isto é, escolher um i têm para comprimentos o qual Li + lij seja Pelo princípio Pi). Podemos de Bellman, isso fornece uma trajetória mínima 1 j, e tem o comprimento →

L1  0

(1)

j  2,

L j  m ín ( L i  l ij ),







, n.

ij

Estas são as equações de Bellman. Como lii = 0 por definição, em vez de mín ij podemos simplesmente escrever míni. Essas equações sugerem a idéia de um dos mais conhecidos algoritmos para problemas de trajetória mínima, como se segue.

Algoritmo de Dijkstra para Trajetórias Mínimas O algoritmo de Dijkstra3 é mostrado na Tabela 23.2, onde um grafo conectado G é um grafo no qual, para dois vértices quaisquer v e w em G, há um caminho v w. O algoritmo é um procedimento de rotulação. A cada estágio da computação, cada vértice v recebe um rótulo, ou →

(RP) um

rótulo permanente

= comprimento L de uma trajetória mínima 1 v



v

ou (RT) um

rótulo temporário =

limite superior L para o comprimento de uma trajetória mínima 1 

v



.

v

Representemos por  e  os conjuntos de vértices com um rótulo permanente e com um rótulo temporário, respectivamente. O algoritmo tem um passo inicial no qual o vértice 1 recebe o rótulo permanente L1 = 0 e os outros vértices recebem rótulos temporários, e então o algoritmo se alterna entre os Passos 2 e 3. No Passo 2, RICHARD BELLMAN (1920–1984), matemático norte-americano, conhecido por seus trabalhos em programação dinâmica. EDSGER WYBE DIJKSTRA (1930–2002), cientista de computação holandês, recebeu em 1972 o prêmio da ACM Turing. Seu algoritmo foi publicado em Numerische Mathematik 1 (1959), 269–271. 2 3

152

Parte F • Otimização, Grafos

a idéia é escolher um k “minimamente”. No Passo 3, a idéia é que os limites superiores em geral aumentarão (diminuirão) e devem ser atualizados apropriadamente. Ou seja, o novo rótulo temporário Lj do vértice j será o antigo se não houver melhoria ou será Lk + lkj se houver. 

Tabela 23.2 Algoritmo de Dijkstra para Trajetórias Mínimas

ALGORITMO DIJKSTRA [G = (V, E), V = {1, , n}, lij para todo (i, j) em E] Dado um grafo conectado G = (V, E) com vértices 1, , n e arestas (i, j) de comprimentos lij > 0, este algoritmo determina os comprimentos das trajetórias mínimas do vértice 1 aos vértices 2, , n. ENTRADA: Número de vértices n, arestas (i, j) e comprimentos lij SAÍDA: Comprimentos Lj de trajetórias mínimas 1 j, j = 2, ,n •















1.











Passo inicial

Vértice 1 recebe RP: L1 = 0. Vértice j (= 2, , n) recebe RT: Lj = l1j (= Faça  = {1},  = {2, 3, , n}. 













se não há aresta (1, j) em G).



2. Fixação de um rótulo permanente Encontre um k no  para o qual Lk é mínimo e faça Lk  Lk. Tome o k mínimo se houver vários deles. Delete k de  e inclua-o em . Se  =  (ou seja,  é um conjunto vazio), então SAÍDA L2, , Ln. Pare Senão, continue (ou seja, vá ao Passo 3). 3. Atualização dos rótulos temporários Para todo j em , faça Lj = mínk {Lj, Lk + lkj} (ou seja, tome o menor dos Lj e Lk + lkj como seu novo Lj). Vá ao Passo 2. Fim DIJKSTRA 

















EXEMPLO 1

Aplicação do Algoritmo de Dijkstra Aplicando o algoritmo de Dijkstra ao grafo da Fig. 486a, encontre as trajetórias mínimas do vértice 1 aos vértices 2, 3, 4.

Solução. Listemos os passos e as computações. 1. L1  0, L2  8, L3  5, L4  7,   {1}, 2. L3  mín {L2, L3, L4}  5, k  3,   {1, 3}, 3. L2  mín {8, L3  l32}  mín {8, 5  1}  6 L4  mín {7, L3  l34}  mín {7, }  7 2. L2  mín {L2, L4}  mín {6, 7}  6, k  2,   {1, 2, 3}, 3. L4  mín {7, L2  l24}  mín {7, 6  2}  7 2. L4  7, k  4   {1, 2, 3, 4}, A Fig. 486b mostra as trajetórias mínimas resultantes, de comprimentos L2 = 6, L3 = 5, L4 = 7. 













 

{2, 3, 4} {2, 4}

 

{4}

 









8

1

2

5 3

7

(a) Grafo dado G



1 2

1

  .

2

5 4

1

3

7

4

(b) Trajetórias mínimas em G

Fig. 486. Exemplo 1

Complexidade. O algoritmo de Dijkstra é O(n2). PROVA O Passo 2 requer uma comparação entre elementos, primeiramente n – 2, depois n – 3 etc., em um total de

(n – 2)(n – 1)/2. O Passo 3 requer o mesmo número de comparações, em um total de ( n – 2)(n – 1)/2, bem como adições, primeiramente n – 2, depois n – 3 etc., novamente totalizando (n – 2)(n – 1)/2. Logo, o número total de operações é 3(n – 2)(n – 1)/2 = O(n2). 

Capítulo 23: Grafos. Otimização Combinatória

153

PROBLEMAS PROPOSTOS 23.3 1. A rede de estradas na Fig. 487conectando quatro pequenas 4. cidades deve ser reduzida ao comprimento mínimo, porém de tal forma que seja possível ir a qualquer cidade a partir de todas as outras. Quais das estradas devem ser mantidas? Encontre a solução (a) por inspeção e (b) pelo algoritmo de Dijkstra.

5

6

1

2

3

8

8

2

5

4

6.

2

2

7.

15

1

10 9

5 4

6

2 4

3

10

4

5

3 3

40 5

6

3

3 5

4

10 2

3 3

2

8

4

4

2

6

1

5

12 6

15

6 5

13

2–7 ALGORITMO DE DIJKSTRA Encontre as trajetórias mínimas para os seguintes grafos. 3. 4 2

14

7

8

4

1

16

4

1 5

6 1

Fig. 487. Problema 1

1

2

4

18

2.

2 3

4

2

5 6

14

2 1

2 2

8

1

10

5

3

20

5.

3 6

1

3

8. Mostre que, no algoritmo de Dijkstra, paraLk há uma trajetóriaP: 1 k de comprimento Lk. 9. Mostre que, no algoritmo de Dijkstra, a cada instante a demanda de armazenamento é reduzida (há dados para menos do que n arestas). 10. PROBLEMA DEÁLGEBRA COMPUTACIONAL. Algoritmo de Dijkstra. Escreva um programa e aplique-o aos Problemas 2–4. →

4

23.4 Arborescências Mínimas: Algoritmo Guloso Até agora viemos discutindo os problemas de trajetória mínima. Passemos agora para um tipo particularmente importante de grafo, chamado de árvore, juntamente com os problemas de otimização a ele relacionados, que surgem freqüentemente na prática. Por definição, uma árvore T é um grafo conectado e que não possui ciclos. “Conectado” foi definido na Seção 23.3; significa que existe uma trajetória saindo de um vértice qualquer em T e indo até outro vértice qualquer em T. Um ciclo é uma trajetória s t fechada (t = s) constituída de pelo menos três arestas; veja também a Seção 23.2. A Fig. 488a mostra um exemplo disso. →

CUIDADO! A terminologia varia; os ciclos são algumas vezes também chamados de circuitos. Uma arborescência T em um dado grafo conectado G = (V, E) é uma árvore contendo todos os n vértices de Veja a Fig. 488b. Uma árvore assim tem n – 1 arestas. (Prova?) Uma arborescência mínima T em um grafo conectado G (cujas arestas (i, j) têm comprimentos lij > 0) é uma arborescência para a qual  lij (somatório de todas as arestas de T) é mínimo comparado a  lij para qualquer outra arborescência em G. G.

um dos tipos importantesAsdeárvores grafos podem e ocorrem diversas aplicações. organizar Exemplosou familiares sãoAs as árvores árvores são genealógicas e osmais organogramas. ser em usadas para apresentar, analisar redes elétricas, relações produtor–consumidor e outras relações comerciais, informações em sistemas de dados, estrutura sintática de programas computacionais etc. Mencionamos aqui umas poucas aplicações específicas, que dispensam explicações adicionais demoradas. O conjunto de trajetórias mínimas partindo do vértice 1 e indo aos vértices 2, , n na última seção formam uma arborescência. Podemos utilizar arborescências para planejar estradas de ferro conectando diversas cidades (vértices), caso em que o “comprimento” de uma estrada (aresta) é o custo de sua construção, e desejamos minimizar o custo total de construção. Algo similar pode ser feito para linhas de ônibus, onde o “comprimento” pode ser o custo •





154

Parte F • Otimização, Grafos

operacional médio anual. Ou para linhas de navegação (linhas de frete), onde o “comprimento” pode ser o lucro e o objetivo é maximizar o lucro total. Ou ainda uma rede de linhas telefônicas entre algumas cidades, onde uma arborescência mínima pode simplesmente representar uma seleção de linhas que conectam todas as cidades a um custo mínimo. Além desses exemplos, poderíamos também mencionar outros envolvendo redes de distribuição, e assim por diante. Discutiremos agora um algoritmo simples para o problema de se encontrar uma arborescência mínima. Este algoritmo (Tabela 23.3) é particularmente adequado aos grafos esparsos (grafos com muito poucas arestas; veja a Seção 23.1). Tabela 23.3 Algoritmo Guloso de Kruskal para Arborescências Mínimas Proceedings of the American Mathematical Society 7 (1956), 48–50.

ALGORITMO KRUSKAL [G = (V, E), lij para todo (i, j) em E] Dado um grafo conectado G = (V, E) com arestas (i, j) de comprimentos lij > 0, este algoritmo determina uma arborescência mínima T em G. ENTRADA: Arestas (i, j) de G e seus comprimentos lij SAÍDA: Arborescência mínima T em G 1. Disponha as arestas de G em ordem crescente de comprimento. 2. Nesta ordem, escolha-as como arestas de T, rejeitando uma aresta somente se ele formar um ciclo com as arestas já escolhidas. Se n – 1 arestas tiverem sido escolhidas, então, SAÍDA T (= o conjunto de arestas escolhidas). Pare Fim KRUSKAL

(a) Um ciclo

(b) Uma arborescência em um grafo

Fig. 488. Exemplo de (a) um ciclo e (b) uma arborescência em um grafo

EXEMPLO 1

Aplicação do Algoritmo de Kruskal Usando o algoritmo de Kruskal, determinaremos uma arborescência mínima no grafo da Fig. 489. 2

1 4

2

7

11 8

3 1 6

9

4 6 5

Fig. 489. Grafo do Exemplo 1 Solução. Veja a Tabela 23.4. Em alguns dos estágios intermediários, as arestas escolhidas formam um grafo desconectado (veja a Fig. 490); isto usualmente acontece. Paramos após n – 1 = 5 escolhas, visto que a arborescência possui n – 1 arestas. Em nosso problema, as arestasabaixo escolhidas partechance superior lista.escolhidas. Isto usualmente ocorre em problemas de qualquer tamanho; em geral, as arestas situadas mais na listaestão têm na menor deda serem 

A eficiência do método de Kruskal fica bastante aumentada pela

Dupla Rotulação dos Vértices. A cada vértice i se atribui um rótulo duplo (ri, pi), onde ri = Raiz da subárvore à qual i pertence, pi = Predecessor de i em sua subárvore, pi = 0 para as raízes .

Capítulo 23: Grafos. Otimização Combinatória

155

Tabela 23.4 Solução do Exemplo 1

Aresta 6)(3, 2)(1, 3)(1, 5)(4, (2,3) 4)(3, (5, 6) (2,4)

Comprimento 1 2 4 6

Escolha 1 2 3 4

7 8

a a a a

Rejeitar 5

a

9 11

Isto simplifica a:

Rejeição. Se (i, j) é o próximo na lista a ser considerado, rejeitamos(i, j) se ri = rj (ou seja, se i e j estão na mesma subárvore, de modo que eles já se encontram conectados por arestas e ( i, j) criaria, desse modo, um ciclo). Se ri  rj, incluímos ( i, j) em T. Se há várias escolhas para ri, ficamos com a mínima. Se as subárvores se fundem (tornam-se uma única árvore), ficamos com a raiz mínima para ser a raiz da nova subárvore. Para o Exemplo 1, a lista de rotulação dupla está mostrada na Tabela 23.5. Ao armazená-la, a cada instante podemos reter somente o último rótulo duplo. Apresentamos aqui todos os rótulos duplos com o propósito de mostrar o processo em todos os seus estágios. Os rótulos que permanecem inalterados não são listados novamente. Estão sublinhados os dois 1’s que são a raiz comum dos vértices 2 e 3, o que é a razão para se rejeitar a aresta (2, 3). Lendo o último rótulo para cada vértice, podemos ler dessa lista que 1 é o vértice por nós escolhido como raiz, e a árvore é a que aparece na última parte da Fig. 490. 1

2

1

33

4 6

3

4

5

Primeira

Segunda

Terceira

Quarta

Quinta

Fig. 490. Processo de escolha do Exemplo 1

Isso foi possível devido ao rótulo predecessor que cada vértice carrega. Além disso, para aceitar ou rejeitar uma aresta, temos que fazer somente uma comparação (entre as raízes das duas extremidades da aresta). A ordenação é a parte mais exigente do algoritmo. Trata-se de um processo-padrão em um processamento de dados para o qual diversos métodos foram sugeridos (veja a classificação na Ref. [E25] listada no Apêndice 1). Para uma lista completa de m arestas, um algoritmo seria O(m log2 m); porém, visto que n – 1 arestas da árvore têm uma maior probabilidade de serem encontradas antes, inspecionando as q(< m) arestas superiores em meio a essa lista de q arestas, obteríamos O(q log 2 m). Tabela 23.5 Lista de Rótulos Duplos do Exemplo 1

Vértice 1 32 4 5 6

Escolha1 (3,6)

(3, 0)

Escolha2 (1,2) (1, 0) (1, 1)

Escolha3 (1,3)

Escolha4 (4,5)

(1, 1) (4,0) (4,4)

(3, 3)

Escolha5 (3,4)

(1, 3)

(1,3) (1,4)

156

Parte F • Otimização, Grafos

PROBLEMAS PROPOSTOS 23.4 1–6 ALGORITMO DE KRUSKAL Encontre uma arborescência mínima usando o algoritmo de Kruskal.

1.

2.

2 20

30

6

1

5 8

10 2

4 2

8

5

2 6

3

3

20

1

6

7

6

12

4

4 4

3.

8

1

4.

7

2

8

2 3

4

10

2

12

4

1 5

Chicago Dallas Denver Los Angeles Nova York

1 13

5 3

3

2

5

2

3

7 5

3 5

6 9

12

8

7

Los Nova Dallas Denver Angeles York 800 900 1800 700 650 1300 1350 850 1650 2500

Washington, DC 650 1200 1500 2350 200

4

13. (Floresta) Um grafo (não necessariamente conectado) sem ciclos é chamado de floresta. Dê exemplos usuais de aplicações onde os grafos que ocorrem são florestas ou árvores.

11 3 2

5.

9. Aplique o algoritmo do Problema 8 ao grafo do Exemplo 1. Compare com o resultado do Exemplo 1. 10. Para obter uma arborescência mínima, em vez de somarmos as arestas mínimas, poderíamos pensar em excluir as arestas máximas. Para quais grafos isso seria viável? Descreva um algoritmo para isso. 11. Aplique o método sugeridono Problema 10 ao grafo do Exemplo 1. Você obtém a mesma árvore? 12. Encontre uma arborescência mínima nografo completo com todas as 15 conexões possíveis entre as seis cidades dadas (distâncias aéreas em milhas, arredondadas). Você poderia imaginar qual é a aplicação prática desse resultado?

14–20 PROPRIEDADES GERAIS DAS ÁRVORES Prove que: 6 7 7 14. (Unicidade) A trajetória conectando dois vértices quaisqueru e v 1 3 em uma árvore é única. 7 5 7 2 2 5 15. Se, em um grafo, dois vértices quaisquer são conectados poruma única trajetória, o grafo é uma árvore. 8 4 10 6 3 16. Se um grafo não tem ciclos, ele deve ter pelo menos 2 vértices de 2 2 grau 1 (definição na Seção 23.1). 6 3 6 3 4 17. Uma árvore com exatamente dois vértices degrau 1 é necessaria6 3 mente uma trajetória. 5 1 18. Uma árvore com n vértices tem n – 1 arestas. (Prove por indu4 5 ção.) 7. PROBLEMA DE ÁLGEBRA COMPUTACIONAL. Algoritmo 19. Se dois vértices em uma árvore são conectados por uma nova aresta, forma-se um ciclo. de Kruskal. Escreva um programa correspondente. (A classificação é discutida na Ref. [E25] do Apêndice 1.) 20. Um grafo com n vértices é uma árvore se e somente se ele possuir 8. Elabore um algoritmo para obterarborescências máximas. n – 1 arestas e não tiver ciclos. 8

8

6.

1

1

8

4

23.5 Arborescências Mínimas: Algoritmo de Prim

O algoritmo de Prim mostrado na Tabela 23.6 é outro algoritmo bastante conhecido e utilizado na resolução de problemas de arborescências mínimas (veja a Seção 23.4). Este algoritmo evita a ordenação das arestas e fornece uma árvore T a cada estágio, uma propriedade que o algoritmo de Kruskal visto na última seção não tinha (veja novamente a Fig. 490, caso não tenha percebido isso). No algoritmo de Prim, partindo de um vértice único qualquer, que chamaremos de 1, fazemos a árvore T “crescer” adicionando-lhe arestas, uma de cada vez, de acordo com alguma regra (na Tabela 23.6) até que T finalmente se torne uma arborescência, que é mínima.

Capítulo 23: Grafos. Otimização Combinatória

157

Chamemos de U o conjunto de vértices da árvore T em crescimento e de S o conjunto de suas arestas. Portanto, inicialmente, U = {1} e S = ; no final, U = V, o conjunto de vértices do grafo dado G = (V, E), cujas arestas (i, j) têm um comprimento lij > 0, como antes. Portanto, no início (Passo 1), os rótulos l2,







, ln dos vértices

2,







,n

são os comprimentos das arestas conectando-os ao vértice 1 (ou  se não existir essa aresta em G). E escolhemos (Passo 2) a mínima dessas arestas para ser a primeira aresta da árvore em crescimento T, e incluímos sua outra extremidade j em U (escolhendo o menor j se houver vários deles, a fim de tornar o processo único). A atualização dos rótulos no Passo 3 (neste estágio e em qualquer outro posterior) refere-se a cada vértice k que ainda não está em U. O vértice k tem o rótulo lk = li(k),k de antes. Se ljk < lk, isto significa que k está mais próximo do novo número j recém-incluído em U do que k está do seu antigo “vizinho mais próximo” i(k) em U. Então, atualizamos o rótulo de k, substituindo lk = li(k),k por lk = ljk e fazendo i(k) = j. Entretanto, se ljk  lk (o rótulo antigo de k), não mexemos no rótulo antigo. Portanto, o rótulo lk sempre identifica o vizinho mais próximo de k em U, e isto é atualizado no Passo 3, à medida que U e a árvore T crescem. Partindo dos rótulos finais, podemos retornar à árvore final e, com seus valores numéricos, calculamos o comprimento total (a soma dos comprimentos das arestas) dessa árvore. Tabela 23.6 Algoritmo de Prim para Arborescências Mínimas (1957), 1389–1401. Uma versão atualizada do algoritmo pode ser vista em Cheriton e Tarjan, SIAM Journal on Computation 5 (1976), 724–742. Bell System Technical J ournal 36

ALGORITMO PRIM [G = (V, E), V = {1, , n}, lij para todo (i, j) em E] Dado um grafo conectado G = ( V, E) com vértices 1, 2, , n e arestas (i, j) de comprimentos lij > 0, este algoritmo determina uma arborescência mínima T em G e seu comprimento L(T). ENTRADA: n, arestas (i, j) de G e seus comprimentos lij SAÍDA: Conjunto de arestas S de uma arborescência mínima T em G; L(T) [Inicialmente, todos os vértices estão não-rotulados.] 1. Passo inicial Faça i(k) = 1, U = {1}, S = . Rotule os vértices k (= 2, , n) de lk = lik [=  se G não possui a aresta (1, k)]. 2. Adição de uma aresta à árvore T Faça lj ser o menor lk para um vértice k fora de U. Inclua o vértice j em U e a aresta (i(j), j) em S. Se U = V então calcule L(T) = lij (somatório de todas as arestas em S) SAÍDA S, L(T). Pare [S é o conjunto de arestas de uma arborescência mínima T em G. ] Senão, continue (ou seja, vá ao Passo 3). 3. Atualização dos rótulos Para todo k fora de U, se ljk < lk, então faça lk = ljk e i(k) = j. Vá ao Passo 2. Fim PRIM •

















2

1 4

2

7

11 8

3 1 6

9

4 6 5

Fig. 491. Grafo do Exemplo 1

EXEMPLO 1

Aplicação do Algoritmo de Prim Encontre uma arborescência mínima no grafo da Fig. 491 (que é o mesmo do Exemplo 1 na Seção 23.4, o que nos permite fazer uma comparação).

158

Parte F • Otimização, Grafos

Solução. Os passos são os seguintes. 1. i(k) = 1, U = {1}, S = , rótulos iniciais, veja a Tabela 23.7. 2. l2 = l12 = 2 é o menor, U = {1, 2}, S = {(1, 2)} 3. Atualizar os rótulos como mostra a Tabela 23.7, coluna (I). 2. l3 = l13 = 4 é o menor, U = {1, 2, 3}, S = {(1, 2), (1, 3)} 3. Atualizar os rótulos como mostra a Tabela 23.7, coluna (II). 2. l6 = l36 = 1 é o menor, U = {1, 2, 3, 6}, S = {(1, 2), (1, 3), (3, 6)} 3. Atualizar os rótulos como mostra a Tabela 23.7, coluna (III). 2. l4 = l34 = 8 é o menor, U = {1, 2, 3, 4, 6}, S = {(1, 2), (1, 3), (3, 4), (3, 6)} 3. Atualizar os rótulos como mostra a Tabela 23.7, coluna (IV). 2. l5 = l45 = 6 é o menor, U = V, S = (1, 2), (1, 3), (3, 4), (3, 6), (4, 5). Pare. A árvore é a mesma do Exemplo 1 na Seção 23.4. Seu comprimento é 21. Pode ser interessante comparar o processo de crescimento dessa árvore com a da Seção 23.4. 

Tabela 23.7 Rotulação dos Vértices do Exemplo 1

Vértice

Rótulo Inicial

2 3 4 5 6

Nova Rotulação (I)

(II)

(III)



— —

(IV)

l 13  4

l 13  4

— —



l 24  11

l 34  8

l 34  8

— —







l 65  9

l 45  6





l 36  1





l 12  2



PROBLEMAS PROPOSTOS 23.5 1–7 ALGORITMO DE PRIM Encontre uma arborescência mínima usando o algoritmo de Prim. Esboce-a. 1. Para o grafo do Problema 1 da Seção 23.4 2. Para o grafo do Problema 2 da Seção 23.4 3. Para o grafo do Problema 4 da Seção 23.4 4. 3 4 3 1

2

3

4

6 7

8 8

5.

7

10

5

8 6

6

5

4

2

6

14 4

1

10

8

2

3

3 1

14

2

6

2

12 12

6 4

20

5

5



2

4

9

7.

1 16

1 15

6

4

2 4

6.

5

6

8

3

14

2

10 7

20

1

8. (Complexidade) Mostre que o algoritmo de Prim tem a complexidade O(n2). 9. De que modo o algoritmo de Prim impede a formação de ciclos à medida que T vai crescendo? 10. Para um grafo completo (ou para um que seja quase completo), se nossos dados estão em uma tabelan  n (como no Problema 12 da Seção 23.4), mostre que o presente algoritmo [que O é (n2)] não pode facilmente ser substituído por um algoritmo de ordem menor que O(n2). 11. Em que caso o algoritmo de Prim forneceráS = E como resultado final? 12. PROJETO DE EQUIPE. Centro de um Grafo e Conceitos Relacionados. (a) Distância, excentricidade.Chamemos o comprimento de uma trajetória mínimau v num grafoG = (V, E) de distância d(u, v) entre u e v. Para u fixo, chamemos a maiord(u, v), com v variando ao longo deV, de excentricidade e(u) de u. Encontre a excentricidade dos vértices 1, 2, 3 no grafo do Problema 7. (b) Diâmetro, raio, centro. O diâmetro d(G) de um grafo G = (V, E) é o valor máximo de d(u, v) enquanto u e v variam ao longo de V, e o raio r(G) é a menor excentricidadee(v) do vértice v. Um vértice v com e(v) = r(G) é chamado de vértice central. O conjunto de todos os vértices centrais é chamado decentro de G.

3

Encontre d(G), r(G) e o centro do grafo do Problema 7. (c) Quais são o diâmetro, o raio e o centro da arborescência no Exemplo 1? (d) Explique como a idéia de um centro pode ser usada no planejamento de instalações de serviços de emergência em uma rede de transporte. No planejamento de um posto de bombeiros, de um shopping center. Como você generalizaria os conceitos no caso de haver duas ou mais dessas instalações?

Capítulo 23: Grafos. Otimização Combinatória

159

(e) Mostre que uma árvoreT cujas arestas têm todas o comprimento 13. Que resultado você obteria se aplicasse o algoritmo de Prim um a 1 possuem um centro consistindo em qualquer um dos vértices ou grafo que não fosse conectado? de dois vértices adjacentes. 14. PROBLEMA DEÁLGEBRA COMPUTACIONAL. Algoritmo (f) Elabore um algoritmo de complexidadeO(n) para encontrar o de Prim. Escreva um programa e aplique-o aos Problemas 4–6. centro de uma árvore T.

23.6 Fluxos em Rede Após termos discutido problemas de trajetória mínima e problemas envolvendo árvores, abordaremos uma terceira grande área de otimização combinatória, que são os problemas de fluxo em rede (elétricas, de água, comunicações, tráfego, conexões de negócios etc.), passando assim dos grafos para os digrafos (ou grafos orientados; veja a Seção 23.1). Por definição, uma rede é um digrafo G = ( V, E) no qual cada aresta (i, j) tem associada a si uma capacidade cij > 0 [= máximo fluxo possível ao longo de ( i, j)], e em um vértice, s, chamado de fonte, produz-se um fluxo que escoa ao longo das arestas do digrafo G até um outro vértice, t, chamado de alvo ou sorvedouro, onde o fluxo desaparece. Nas aplicações, isto pode se referir ao fluxo da eletricidade em fios, da água em tubulações, de carros em estradas, de pessoas em um sistema de transporte público, de bens transportados dos produtores aos consumidores, de e-mails sendo enviados dos remetentes aos destinatários na Internet, e assim por diante. Chamaremos o fluxo ao longo de uma aresta (orientada!) ( i, j) de fij e imporemos duas condições:

1. Para cada aresta (i, j) em G, o fluxo não excede a capacidade cij, (1)

(“Condição das Arestas”).

0  ƒ ij  cij

2. Para cada vértice i, e não s ou t, (“Condição dos Vértices”, “Lei de Kirchhoff”);

Fluxo de entrada = Fluxo de saída em uma fórmula,

0 se o vértice i

(2)

ƒki

ƒij

Fluxo para dentro

Fluxo para fora



k

j





s, i

t,

ƒ na fonte s, ƒ no alvo (sorvedouro)t,

onde f é o fluxo total (e, em s, o fluxo para dentro é nulo, ao passo que, em t, o fluxo para fora é nulo). A Fig. 492 ilustra a notação (para algumas figuras hipotéticas). f

1i

1

f i3 =

=7

1

3

i

2

f 2i

=2

f

i5

=

f

i8 = 5

3

8

5

Fig. 492. Notação em (2); fluxo para dentro e fluxo para fora em um vértice i (que não é s nem t)

Trajetórias Em um digrafo G, por uma trajetória v1 uma seqüência de arestas



vk

partindo de um vértice

(v1, v2), ( v2, v3),







v1

e indo até um vértice

vk

, entendemos

, (vk 1, vk), 

independentemente de suas direções em G, que forma uma trajetória como em um grafo (veja a Seção 23.2). Logo, quando percorremos essa trajetória de v1 a vk, podemos atravessar alguma aresta em sua dada direção — quando então a chamamos de aresta progressiva de nosso caminho — ou opostamente à sua direção dada

— quando então a chamamos de aresta regressiva da nossa trajetória. Em outras palavras, nosso caminho consiste em ruas de mão única, e as arestas progressivas (arestas regressivas) são aquelas que percorremos na direção correta (na direção errada). A Fig. 493 mostra uma aresta progressiva ( u, v) e uma aresta regressiva ( w, v) de uma trajetória v1 vk. →

160

Parte F • Otimização, Grafos

CUIDADO! Cada aresta em uma rede tem uma dada direção, que não pode ser alterada. Dessa forma, se (u, v) é uma aresta progressiva em uma trajetória v1 vk, então (u, v) pode se tornar uma aresta regressiva somente em uma outra trajetória x1 xj, na qual ela é uma aresta e é atravessada na direção oposta quando se vai de x1 para xj; veja a Fig. 494. Tenha isso em mente, para evitar mal-entendidos. →



u

v1

w

xj

u

.. .

...

. . .

v1

v

x1

vk

Fig. 493. Aresta progressiva (u, v) e aresta regressiva (w, v) de uma trajetória v1 vk

...

... v

vk

Fig. 494. Aresta (u, v) como progressiva em uma trajetória v1 vk e como regressiva em uma trajetória x1 xj







Trajetórias de Aumento de Fluxo Nosso objetivo será o de maximizar o fluxo de uma fonte s até um alvo t de uma dada rede. Faremos isso desen-

volvendo métodos para aumentar um fluxo existente (incluindo o caso especial onde este é zero). A idéia então é encontrar uma trajetória P: s t onde nem todas de suas arestas estejam sendo completamente usadas, de modo a introduzir um fluxo adicional passando por P. Isto sugere o seguinte conceito. →

DEFINIÇÃO

Trajetória de aumento de fluxo

Uma trajetória de aumento de fluxo em uma rede com um dado fluxo fij em cada aresta (i, j) é uma trajetória P: s t tal que (i) nenhuma aresta progressiva é usada até o limite de sua capacidade; portanto, para elas, f ij < cij; (ii) nenhuma aresta regressiva tem fluxo 0; portanto, para elas, fij > 0. →

EXEMPLO 1

Trajetórias de Aumento de Fluxo Encontre as trajetórias de aumento de fluxo no circuito elétrico da Fig. 495, onde o primeiro número é a capacidade e o segundo número é um fluxo dado. 2

5 20,

11, 8

3

4, 3

s 1 10, 4

4

7, 4

13, 6

5, 2 5

6 t 3, 3

Fig. 495. Rede do Exemplo 1 Primeiro número = Capacidade, Segundo número = Fluxo dado Solução. Nos problemas práticos, as redes são extensas e necessitamos de um método sistemático para aumentar o fluxo, que discutiremos na próxima seção.Na pequena rede considerada agora, que deve ajudar a ilustrar e esclarecer os conceitos e idéias aqui tratadas, podemos encontrar por inspeção as trajetórias de aumento de fluxo, e aumentar o fluxo existente f = 9 na Fig. 495. (O fluxo para fora de s é 5 + 4 = 9, que se iguala ao fluxo para dentro de t, que é 6 + 3.) Usamos a notação ij = cij

– f ij

para arestas progressivas

ij = fij 

para arestas regressivas

= mín ij

tomado sobre todas as arestas de uma trajetória.

Da Fig. 495, vemos que uma trajetória de aumento de fluxo P1: s t é P1: 1 – 2 – 3 – 6 (Fig. 496), com 12 = 20 – 5 = 15 etc., e = 3. Logo, podemos usar P1 para aumentar o fluxo 9 dado para f = 9 + 3 = 12. Todas as três arestas de P1 são progressivas. Então, aumentamos de 3 o fluxo. Logo, em cada uma das arestas de P1, o fluxo é aumentado de 3, de modo que temos agora f12 = 8 (em vez de 5), f23 = 11 (em vez de 8) e f36 = 9 (em vez de 6). A aresta (2, 3) está agora sendo usada em sua capacidade máxima. O fluxo nas outras arestas permanece como antes. Tentaremos agora aumentar para mais def = 12 o fluxo nesta rede da Fig. 495. Existe uma outra trajetória de aumento de fluxo P2: s t, a saber, P2: 1 – 4 – 5 – 3 – 6 (Fig. 496), mostrando como uma aresta regressiva aparece e como ela é manipulada. A aresta (3, 5) é regressiva e possui o fluxo 2, de modo que 35 = 2. Calculamos 14 = 10 – 4 = 6 etc. (Fig. 496) e  = 2. Logo, podemos usar P2 para termos um outro aumento e obter f = 12 + 2 = 14. O novo fluxo está mostrado na Fig. 497. Nenhum outro aumento é possível. Confirmaremos posteriormente que f = 14 é máximo.  →



Capítulo 23: Grafos. Otimização Combinatória



∆ 12

= 15

2

23

=3 3



36

=7

161

Caminho P1

s 1

6 t

3 ∆

s 1 ∆

14

=6

4



45



36

=4

Caminho P2

=2 35

6 t 5

=3

Fig. 496. Trajetórias de aumento de fluxo no Exemplo 1

Conjuntos de Corte Um “conjunto de corte” é um conjunto de arestas em uma rede. A idéia subjacente a isso é simples e natural. Se desejamos encontrar qual é o fluxo de s para t em uma rede, podemos cortar a rede em algum lugar entre s e t (a Fig. 497 exemplifica isso) e vemos qual é o valor do fluxo nas arestas atingidas pelo corte, uma vez que qualquer fluxo de s para t tem que às vezes passar por algumas dessas arestas. Estas formam o que chamamos de um conjunto de corte. [Na Fig. 497, o conjunto de corte consiste nas arestas (2, 3), (5, 2), (4, 5).] Representamos esse conjunto de corte por (S, T). Aqui, S é o conjunto de vértices no lado do corte onde s está situado (S = {s, 2, 4} para o corte na Fig. 497) e T é o conjunto dos outros vértices (T = {3, 5, t} na Fig. 497). Dizemos que um corte “divide” o conjunto de vértices V em duas partes S e T. Obviamente, o conjunto de corte ( S, T) correspondente consiste em todas as arestas da rede com uma extremidade em S e a outra extremidade em T. Corte 8 20,

2

4,

s 1 10, 6

11, 11

4

7, 6

13, 11

3 5, 0

3

5

6 t 3, 3

Fig. 497. Fluxo máximo do Exemplo 1

Por definição, a capacidade cap (S, T) de um conjunto de corte ( S, T) é a soma das capacidades de todas as arestas progressivas em (S, T) (somente das arestas progressivas!), ou seja, das arestas que estão direcionadas de S para T,

(3)

cap (S, T) =

 cij

[somatório das arestas progressivas de ( S, T)].

Portanto, cap (S, T) = 11 + 7 = 18 na Fig. 497. As outras arestas (direcionadas de T para S) são chamadas de arestas regressivas do conjunto de corte (S, T) e, por fluxo líquido através de um conjunto de corte, entendemos o somatório dos fluxos nas arestas progressivas menos o somatório dos fluxos nas arestas regressivas do conjunto de corte.

CUIDADO! Diferencie bem as arestas progressivas das regressivas num conjunto de corte e numa trajetória: na Fig. 497, (5, 2) é uma aresta regressiva para o corte mostrado, porém é uma aresta progressiva na trajetória 1 – 4 – 5 – 2 – 3 – 6. Para o corte da Fig. 497, o fluxo líquido é 11 + 6 – 3 = 14. Para o mesmo corte na Fig. 495 (não indicado aqui), o fluxo por líquido é 8porém + 4 – que 3 = 9. ambos os casos, istoaoé igual ao fluxo não ocorreu apenas acaso, os Em cortes de fato atendem propósito para fo. Podemos qual foramdizer por que nós isso introduzidos: TEOREMA 1

Fluxo Líquido em Conjuntos de Corte

(S, T) Qualquer fluxo dado em uma rede G é o fluxo líquido passando através de um conjunto de corte de G. PROVA

Pela lei de Kirchhoff (2), multiplicando por –1 em um vértice i, temos

162

Parte F • Otimização, Grafos

(4)

ƒij j



ƒli





l

Fluxo para fora

0

se i

s, t,

ƒ

se i

s.

Fluxo para dentro

Aqui, podemos fazer o somatório em j e l de 1 a n (= número de vértices) fazendo fij = 0 para j = i e também para as arestas sem fluxo ou para as arestas inexistentes; logo, podemos escrever os dois somatórios como um só, (ƒij

ƒji )

j



0

se i

s, t,

ƒ

se i

s.

Agora, somamos para todo i em S. Como s está em S, essa soma é igual a f: (5)

  (ƒ ij

 ƒ ji )  ƒ.

iS jV

Podemos dizer que contribuem para essa soma apenas as arestas pertencentes ao conjunto de corte. De fato, as arestas com ambas as extremidades em T não podem contribuir, visto que somamos apenas sobre i em S; mas as arestas (i, j) com ambas as extremidades em S contribuem com +fij em uma extremidade e com –fij na outra, de modo que sua contribuição total é nula. Logo, o lado esquerdo de (5) é igual ao fluxo líquido através do conjunto de corte. Por (5), isto é igual ao fluxo f e prova o teorema.  Esse teorema tem a seguinte conseqüência, de que também precisaremos mais tarde nesta seção. TEOREMA 2

Limite Superior para Fluxos Em uma rede G, um fluxo f não pode exceder a capacidade de qualquer conjunto de corte (S, T) em G.

PROVA

Pelo Teorema 1, o fluxo f é igual ao fluxo líquido através do conjunto de corte, f = f1 – f2, onde f1 é o somatório dos fluxos através das arestas progressivas e f2 ( 0) é o somatório dos fluxos através das arestas regressivas do conjunto de corte. Portanto, f  f1. Ora, f1 não pode exceder o somatório das capacidades das arestas progressivas, mas esse somatório é, por definição, igual à capacidade do conjunto de corte. Juntando isso, f  cap (S,  T), conforme se afirmou. Os conjuntos de corte evidenciarão agora a grande importância das trajetórias que aumentam fluxos:

TEOREMA 3

Teorema Principal. Teorema da Trajetória de Aumento para Fluxos Em uma rede G, um fluxo de s para t é máximo se e somente se não existir uma trajetória de aumento de fluxo s t em G. →

PROVA

(a) Se há uma trajetória de aumento de fluxo P: s t, podemos utilizá-la para introduzir-lhe um fluxo adicional. Logo, o fluxo dado não pode ser máximo. (b) Por outro lado, suponha que não haja uma trajetória que aumente o fluxo s t em G. Chamemos de S0 o conjunto de todos os vértices i (incluindo s), tal que exista uma trajetória que aumente o fluxo s i, e chamemos de T0 o conjunto dos outros vértices em G. Consideremos qualquer aresta (i, j) com i em S0 e j em T0. Então, temos uma trajetória de aumento de fluxo s i, visto que i está em S0, mas s i j não está aumentando o fluxo, pois j não está em S0. Logo, necessariamente temos que: →







(6)

ƒij



cij 0

se ( i, j ) é uma aresta







progressiva de uma trajetória s → i



j.

regressiva

De outro modo, poderíamos usar (i, j) para obter uma trajetória que aumente o fluxo s i j. Ora, (S0, T0) define um conjunto de corte (visto que t está em T0; por quê?). Como, por (6), as arestas progressivas estão sendo usadas no limite de sua capacidade e as arestas regressivas não carregam nenhum fluxo, então o fluxo líquido através do conjunto de corte (S0, T0) é igual ao somatório das capacidades das arestas progressivas, que é cap (S0, T0), por definição. Esse fluxo líquido é igual ao fluxo f dado do Teorema 1. Portanto, f = cap (S0, T0). Também temos que  f  cap (S0, T0) pelo Teorema 2. Logo, f deve ser máximo, visto que alcançamos a igualdade procurada. →



163

Capítulo 23: Grafos. Otimização Combinatória

O final desta prova fornece um outro resultado fundamental (segundo Ford e Fulkerson, Canadian Journal of 8 (1956), 399–404), a saber, o chamado

Mathematics

TEOREMA 4

Teorema do Fluxo Máximo e do Corte Mínimo Em qualquer rede G, o fluxo máximo é igual à capacidade de um

“mínimo conjunto de corte” (= um

conjunto de corte de capacidade mínima) em G. Acabamos de ver que f = cap (S0, T0) para um fluxo máximo f e um conjunto de corte apropriado (S0, T0). Ora, pelo Teorema 2, também temos f  cap (S, T) para esse f e um conjunto de corte qualquer ( S, T) em G. Juntando as expressões, cap (S0, T0)  cap (S, T). Logo, (S0, T0) é um mínimo conjunto de corte. A existência de um fluxo máximo nesse teorema decorre para as capacidades racionais pelo algoritmo da próxima seção, decorrendo também para as capacidades arbitrárias do método BFS de Edmonds–Karp, também a ser visto na próxima seção. 

PROVA

Essas duas ferramentas básicas, em conexão com as redes, são trajetórias de aumento de fluxo e conjuntos de corte. Na próxima seção, mostraremos de que modo se podem usar, em um algoritmo, as trajetórias de aumento de fluxo com o objetivo de maximizá-lo.

PROBLEMAS PROPOSTOS 23.6 1–4 TRAJETÓRIAS DE AUMENTO DE FLUXO Encontre as trajetórias de aumento de fluxo: 1. 2 8, 5 4, 2

1 s

4

5 t

6, 0 3, 1

2.

1, 1

3 1, 0

2

1 2,

4 1 8,

2, 1

1 s 1 2,

7, 1

6 t

4, 2 3

3.

1, 0

2, 1

1 s 2 3,

3

8, 5

9, 4

3, 1

{1, 2, 3} {1, 2, 4, 5} {1, 3, 5} Encontre um mínimo conjunto de corte mínimo na Fig. 495 e verifique que sua capacidade é igual ao fluxo máximof = 14. 13. Encontre exemplos de trajetórias de aumento de fluxoe de fluxo máximo na rede da Fig. 498. 14–16 CAPACIDADE Na Fig. 498, encontre T e cap (S, T) se S é igual a 14. {1, 2, 4} 15. {1, 2, 4, 6} 16. {1, 2, 3, 4, 5} 17. Na Fig. 498, encontre um conjunto de corte mínimo e sua capacidade.

6 t

2

8, 4

0 1, 5 s 1

5, 2

2

3

4 4 10,

3, 2

6, 3

7, 1

1 s

1 8, 5

5, 3

2

2 4,

4.

5, 3

10, 3

9. 10. 11. 12.

10, 1

4

4, 2

3, 1

16, 6

1 6, 7,

5 t

5–8 FLUXO MÁXIMO Encontre por inspeção o fluxo máximo: 5. No Problema 1. 6. No Problema 2. 7. No Problema 3. 8. No Problema 4. 9–11 CAPACIDADE Na Fig. 495, encontreT e cap (S, T) se S é igual a

5

4

6, 5

8, 5 4, 2 5

3

10, 8

7 t

1 2, 4, 2

6

1 6,

Fig. 498. Problemas 13–17

18. Por que arestas regressivas não são consideradas na definição de capacidade de um conjunto de corte? 19. Em que caso pode uma aresta i(, j) ser usada como progressiva bem como regressiva de uma trajetória em uma rede com um fluxo dado? 20. (Rede incremental) Esboce a rede da Fig. 498 e em cada aresta (i, j) escreva cij – fij e fij. Você percebe que, a partir dessa “rede incremental”, pode-se ver mais facilmente as trajetórias de aumento de fluxo?

164

Parte F • Otimização, Grafos

23.7 Fluxo Máximo: Algoritmo de Ford–Fulkerson As trajetórias de aumento de fluxo, conforme discutidas na última seção, são usadas como uma ferramenta básica para o algoritmo de Ford–Fulkerson 4 mostrado na Tabela 23.8, no qual um dado fluxo (por exemplo, um fluxo nulo em todas as arestas) é aumentado até seu valor máximo. Esse aumento é conseguido pelo algoritmo graças à construção de trajetórias de aumento de fluxo, um de cada vez, até que não seja possível construir mais trajetórias, algo que ocorre precisamente quando o fluxo é máximo. No Passo 1, pode-se fornecer um fluxo inicial. No Passo 3, um vértice j pode ser rotulado se houver uma aresta (i, j) com i rotulado e (“aresta progressiva”)

cij > fij

ou se houver uma aresta (j, i) com i rotulado e fji >

(“aresta regressiva”)

0

Mapear um vértice rotuladoi significa rotular todo vértice não-rotulado j adjacente ai que possa ser rotulado. Antes de mapear um vértice rotuladoi, mapeie todos os vértices que foram rotulados antes ide . Essa estratégiaPBL (Primeira Busca em Largura) foi sugerida por Edmonds e Karp em 1972Journal ( of the Association for Computing Machinery 19, 248–64). Ela tem o efeito de obter um mínimo valor possível para os caminhos de aumento de fluxo. Tabela 23.8 Algoritmo de Ford–Fulkerson para o Fluxo Máximo (1957), 210–218)

Canadian Journal of Mathematics 9

ALGORITMO FORD–FULKERSON [G = (V, E), vértices 1 (= s), , n (= t), arestas (i, j), cij] Este algoritmo calcula o fluxo máximo em uma rede G com fonte s, sorvedouro t e capacidades cij > 0 das arestas (i, j). ENTRADA: n, s = 1, t = n, arestas (i, j) de G, cij SAÍDA: Fluxo máximo f em G •





inicial fij (por exemplo, fij = 0 para todas as arestas), calcule f. 1. 2. Atribuir Rotular sum de fluxo . Marcar os outros vértices como “não-rotulado”. 3. Encontrar um vértice rotulado i que ainda não tenha sido mapeado. Mapear i como se segue. Para todo vértice adjacente não-rotulado j, se cij > fij, calcular ij

cij

ƒij

e



j

1j

mín ( i,

ij )

se i

1

se i

1

e rotular j com um “rótulo progressivo”( i , j); ou se fji > 0, calcule j = mín (i, fji) e rotular j com um “rótulo regressivo” ( i-, j) Se esse j não existir, então SAÍDA f. Pare [f é o fluxo máximo.] Senão continue (ou seja, vá ao Passo 4). 4. Repetir o Passo 3 até t ser alcançado. [Isso fornece uma trajetória de aumento de fluxo P: s t. ] Se for impossível alcançar t, então SAÍDA f. Pare [f é o fluxo máximo.] Senão continue (ou seja, vá ao Passo 5). 5. Fazer o backtracking da trajetória P, usando os rótulos. 6. Usando P, aumentar de t o fluxo existente. Fazer f = f + t. 7. Remover todos os rótulos dos vértices 2, , n. Retornar ao Passo 3. Fim FORD–FULKERSON +









LESTER RANDOLPH FORD (nascido em 1927) e DELBERT RAY FULKERSON (1924–1976), matemáticos norte-americanos conhecidos por seus trabalhos pioneiros em algoritmos de fluxo. 4

Capítulo 23: Grafos. Otimização Combinatória

EXEMPLO 1

165

Algoritmo de Ford–Fulkerson Aplicando o algoritmo de Ford–Fulkerson, determine o fluxo máximo para a rede da Fig. 499 (que é a mesma do Exemplo 1 da Seção 23.6, o que nos permite fazer uma comparação).

Solução. O algoritmo procede como se segue. 1. Um fluxo inicial f = 9 é dado. 2. Rotular s (= 1) de . Marcar 2, 3, 4, 5, 6 como “não-rotulado”. 20,

5

11, 8

2

3

4, 3

s 1 10, 4

4

7, 4

13, 6

5, 2

6 t 3, 3

5

Fig. 499. Rede do Exemplo 1 com as capacidades (primeiros números) e o fluxo dado 3. Mapear 1. Calcular 12 = 20 – 5 = 15 = 2. Rotular 2 de (1+, 15). Calcular 14 = 10 – 4 = 6 = 4. Rotular 4 de (1 +, 6). 4. Mapear 2. Calcular 23 = 11 – 8 = 3, 3 = mín ( 2, 3) = 3. Rotular 3 de (2 +, 3). Calcular 5 = mín (2, 3) = 3. Rotular 5 de (2 –, 3). Mapear 3. Calcular 36 = 13 – 6 = 7, 6 = t = mín (3, 7) = 3. Rotular 6 de (3 +, 3). 5. P: 1 – 2 – 3 – 6 (= t) é um caminho de aumento de fluxo. 6. t = 3. O aumento dá f12 = 8, f23 = 11, f36 = 9, outros fij inalterados. Fluxo aumentado f = 9 + 3 = 12. , 6. Voltar ao Passo 3. 7. Remover rótulos dos vértices 2, 3. Mapear 1. Calcular 12 = 20 – 8 = 12 = 2. Rotular 2 de (1+, 12). Calcular 14 = 10 – 4 = 6 = 4. Rotular 4 de (1 +, 6). 4. Mapear 2. Calcular 5 = mín (2, 3) = 3. Rotular 5 de (2 –, 3). Mapear 4. [ Nenhum vértice resta para ser rotulado.] Mapear 5. Calcular 3 = mín (5, 2) = 2. Rotular 3 de (5 –, 2). •





Mapear 3.  = 13 – 9 = 4,  = mín (  , 4) = 2. Rotular 6 de (3 +, 2). Calcular 36 6 3 5. P: 1 – 2 – 5 – 3 – 6 (= t) é uma trajetória de aumento de fluxo. 6. t = 2. O aumento dá f12 = 10, f52 = 1, f35 = 0, f36 = 11, outros fij inalterados. Fluxo aumentado f = 12 + 2 = 14. 7. Remover rótulos dos vértices 2, , 6. Voltar ao Passo 3. •





Pode-se agora mapear 1 e então mapear 2, como antes, mas ao se mapear 4 e depois 5, percebe-se que não há mais vértice para ser rotulado. Portanto, não se pode mais atingirt. Logo, o fluxo obtido (Fig. 500) é máximo, em concordância com o nosso resultado da última seção. 

20,

10

11, 11

2

10, 4

3

4, 1

s 1

4

7, 4

13, 11

5, 0 5

6 t 3, 3

Fig. 500. Fluxo máximo do Exemplo 1

PROBLEMAS PROPOSTOS 23.7 Faça detalhadamente os cálculos indicados próximo ao final do 1. Exemplo 1. 2. Resolva o Exemplo 1 por Ford–Fulkerson com um fluxo inicial 0. É este procedimento mais trabalhoso que o do Exemplo 1? 3. Quais são as arestas “engarrafadas”, pelas quais o fluxo no Exemplo 1 fica realmente limitado? Logo, quais capacidades poderíamos reduzir sem diminuir o fluxo máximo? 4–7 FLUXO MÁXIMO Encontre o fluxo máximo por Ford–Fulkerson:

No 2, Seção Seção 23.6. 23.6. No Problema Problema 1, No Problema 4, Seção 23.6. No Problema 3, Seção 23.6. Qual é a razão (simples) pela qual a lei de Kirchhoff é preservada quando se aumenta um fluxo pelo uso de uma trajetória de aumento de fluxo? 9. De que modo o algoritmo de Ford–Fulkerson impede a formação de ciclos? 4. 5. 6. 7. 8.

166

Parte F • Otimização, Grafos

10. De que modo podemos perceber que o algoritmo de Ford–Fulkerson segue uma técnica BFS? 11. Serão únicos os caminhos de fluxo máximo consecutivos produzidos por Ford–Fulkerson? 12. (Teorema do fluxo inteiro) Prove que, se as capacidades em uma rede G são números inteiros, então o fluxo máximo existe e é um inteiro. 13. PROBLEMA DE ÁLGEBRA COMPUTACIONAL. Ford– Fulkerson. Escreva um programa e aplique-o aos Problemas 4–7. 14. Se o algoritmo de Ford–Fulkerson pára sem quet seja atingido, mostre que as arestas com uma extremidade rotulada e a outra extremidade não-rotulada formam um conjunto de corteS(, T) cuja

17. Encontre um mínimo conjunto de corte na Fig. 499 e sua capacidade. 18. Mostre que, em uma redeG com todos oscij = 1, o fluxo máximo é igual ao número de trajetórias de arestas disjuntas s t. 19. No Problema 17, o conjunto de corte contém precisamente todas as arestas progressivas usadas até a capacidade máxima, por meio do fluxo máximo (Fig. 500). Isso ocorre por acaso? 20. Mostre que, em uma rede G com capacidades todas iguais a 1, a capacidade de um conjunto de corte mínimo S(, T) é igual ao número mínimo q de arestas cuja deleção destrói todos as trajetórias orientadas s t. (Uma trajetória orientada v w é um caminho no qual cada aresta tem a direção em que ela é atravessada de v para w.) →



é igual ao fluxo máximo. 15. (capacidade Várias fontes e sorvedouros ) Se uma rede tem diversas fontes s1, , sk, mostre que ela pode ser reduzida ao caso de uma rede de uma única fonte introduzindo-se um novo vértices e conectando s a s1, , sk p or k arestas de capacidade . Algo similar ocorre quando há vários sorvedouros. Ilustre essa idéia por uma rede com duas fontes e dois sorvedouros. 16. Encontre o fluxo máximo na rede da Fig. 501 com duas fontes (fabricantes) e dois sorvedouros (consumidores). •







5

s1 1



4



3 3



s2 2

4

5

6

7 t1

3

6

4

7

3

5 6

8

4

8 t2

Fig. 501. Problema 16

23.8 Grafos Bipartidos. Problemas de Atribuição Dos digrafos, retornemos aos grafos e discutamos outra importante classe de problemas de otimização combinatória, que surge nos problemas de atribuição de funcionários a profissões, de tarefas a máquinas, de bens a armazenagem, de navios a píeres, de alunos a classes, de exames a períodos de tempo, e assim por diante. Para explicar esse problema, necessitamos dos seguintes conceitos. Um grafo bipartido G = (V, E) é um grafo no qual o conjunto de vértices V é particionado em dois conjuntos S e T (sem elementos em comum, pela definição de uma partição) de tal forma que cada aresta de G tem uma extremidade em S e a outra em T. Portanto, em G não há arestas que possuam ambas as extremidades em S ou ambas em T. Esse grafo G = (V, E) é também escrito como G = (S, T; E). A Fig. 502 ilustra um caso. V consiste em sete elementos, três funcionários a, b, c compondo o conjunto S, e quatro tarefas 1, 2, 3, 4 compondo o conjunto T. As arestas indicam que o funcionário a pode fazer as tarefas 1 e 2, o funcionário b as tarefas 1, 2, 3 e o funcionário c a tarefa 4. O problema consiste em atribuir uma tarefa a cada funcionário de forma que todo funcionário tenha que cumprir uma tarefa. Isso sugere o próximo conceito, como se segue. DEFINIÇÃO

Emparelhamento de Máxima Cardinalidade

Um emparelhamento em G = (S, T; E) é um conjunto M de arestas de G tal que nenhum par dessas arestas tenha um vértice em comum. Se M consiste no maior número possível de arestas, chamamo-lo de emparelhamento de máxima cardinalidade em G. Por exemplo, na Fig. 502, um emparelhamento é M1 = {(a, 2), (b, 1)}. Outro é M2 = {(a, 1), (b, 3), (c, 4)}; obviamente, isto é um caso de cardinalidade máxima. S

T

1 a

2 b c

3 4

Fig. 502. Grafo bipartido na atribuição de um conjunto T = (1, 2, 3, 4) de tarefas a um conjunto S = (a, b, c) de funcionários

Capítulo 23: Grafos. Otimização Combinatória

167

Um vértice v é exposto (ou não-coberto) por um emparelhamento M se v não é uma extremidade de uma aresta de M. Esse conceito, que sempre se refere a algum emparelhamento, será de interesse quando começarmos a aumentar os emparelhamentos dados (a seguir). Se um emparelhamento não deixa nenhum vértice exposto, ele é chamado de um emparelhamento completo. Obviamente, um emparelhamento completo pode existir somente se S e T consistirem em um mesmo número de vértices. Desejamos agora mostrar como se pode aumentar passo a passo a cardinalidade de um emparelhamento M, até ele se tornar máximo. Essencial nessa tarefa é o conceito de trajetória de aumento. Uma trajetória alternante é aquela que consiste alternadamente em arestas de M e de arestas que não são de M (Fig. 503A). Uma trajetória de aumento é uma trajetória alternante onde ambas as extremidades ( a e b na Fig. 503B) são expostas. Eliminando-se do emparelhamento M as arestas que estejam em uma trajetória de aumento P (duas arestas na Fig. 503B) e acrescentando a M as outras arestas de P (três na figura), obtemos um novo emparelhamento, com uma aresta a mais do que M. Essa é a forma como usamos uma trajetória de aumento para aumentar um dado emparelhamentopor uma aresta. Afirmamos que isso sempre conduzirá, após um número de etapas, ao emparelhamento de máxima cardinalidade. Com efeito, o papel básico desempenhado pelas trajetórias de aumento é expresso no seguinte teorema.

(A) Trajetória alternante

b a

(B) Trajetória de aumento P

Fig. 503. Trajetórias alternante e de aumento. As arestas grossas são as pertencentes a um emparelhamento M

TEOREMA 1

Teorema da Trajetória de Aumento para Emparelhamentos Bipartidos Um emparelhamento M em um grafo bipartido G = (S, T; E) é de máxima cardinalidade se e somente se não existe uma trajetória de aumento P com respeito a M.

PROVA

(a) Mostremos que, se tal trajetória P existe, então M não é de máxima cardinalidade. Consideremos que P possua q arestas pertencentes a M. Então, P tem q + 1 arestas não pertencentes a M. (Na Fig. 503B, temos q = 2.) As extremidades a e b de P são expostas e todos os outros vértices de P são extremidades das arestas em M, pela definição de trajetória alternante. Logo, se uma aresta de M não é uma aresta de P, ela não pode possuir uma extremidade em P, visto que, se assim fosse, M não seria um emparelhamento. Conseqüentemente, as arestas de M que não são de P, juntamente com as q + 1 arestas de P não pertencentes a M, formam um emparelhamento de cardinalidade uma unidade maior que a cardinalidade de M, pois omitimos q arestas de M e, por outro lado, acrescentamos q + 1. Logo, M não pode ser de máxima cardinalidade. (b) Mostremos agora que, se não há uma trajetória de aumento para M, então M é de máxima cardinalidade. Chamemos de M* um emparelhamento de máxima cardinalidade e consideremos o grafo H consistindo em todas as arestas pertencentes ou a M ou a M*, porém não a ambos. Então, é possível que duas arestas de H tenham um vértice em comum, embora não seja possível que três arestas tenham um vértice em comum, visto que, se assim fosse, duas das três arestas teriam que pertencer a M (ou a M*), violando o fato de que M e M* são emparelhamentos. Dessa forma, todo v em V pode estar em comum com duas arestas de H, ou com uma, ou com nenhuma. Logo, podemos caracterizar cada “componente” (= máximo subconjunto conectado) de H como a seguir. Uma componente de pode ser uma trajetória fechada com um número de arestas (no caso de um H M ou duas de M* se encontrariam, violando a propriedade par (A) ímpar, duas arestas de número de emparelhamento). Veja (A) na Fig. 504. (B) Uma componente de H pode ser um caminho aberto P com o mesmo número de arestas de M e de arestas de M*, pela seguinte razão. P tem que ser alternante, ou seja, uma aresta de M é seguida por uma aresta de M* etc. (visto que M e M* são emparelhamentos). Ora, se P tivesse uma aresta a mais vinda de M*, então P seria de aumento para M [veja (B2) na Fig. 504], contradizendo assim nossa suposição de que não há caminho de aumento para M. Se P tivesse uma aresta a mais vinda de M, então P seria de aumento para M* [veja (B3) na Fig. 504], violando a máxima cardinalidade de M*, segundo a parte (a) desta prova. Logo, em cada componente de H, os

168

Parte F • Otimização, Grafos

dois emparelhamentos têm o mesmo número de arestas. Acrescentando a isso o número de arestas pertencentes tanto a M quanto a M* (que deixamos de lado quando constituímos H), concluímos que M e M* devem ter o mesmo número de arestas. E como M* é de máxima cardinalidade, isso mostra que o mesmo vale para M, como desejávamos provar.  Aresta de M

(A)

Aresta de M*

(B1)

(Possível)

(B2)

(Aumento para M)

(B3)

(Aumento para M*)

Fig. 504. Demonstração do teorema da trajetória de aumento para emparelhamentos bipartidos

Esse teorema sugere o algoritmo da Tabela 23.9 para se obterem trajetórias de aumento, no qual os vértices são rotulados com o propósito de se obter trajetórias de retorno ( backtracking). Um rótulo assim está em adição ao número do vértice, que é também mantido. Obviamente, para obtermos uma trajetória de aumento, devemos partir de um vértice exposto e então traçar uma trajetória alternante até chegarmos a um outro vértice exposto. Após o Passo 3, todos os vértices em S estão rotulados. No Passo 4, o conjunto T contém pelo menos um vértice exposto, visto que, de outro modo, teríamos parado no Passo 1. Tabela 23.9 Emparelhamento Bipartido de Máxima Cardinalidade

ALGORITMO DE EMPARELAMENTO [G = (S, T; E), M, n] Este algoritmo determina um emparelhamento de máxima cardinalidade M em um grafo bipartido G pelo aumento de um dado emparelhamento em G. ENTRADA: Grafo bipartido G = (S, T; E) com vértices 1, , n, emparelhamento M em G (por exemplo, M = ) SAÍDA: Emparelhamento de máxima cardinalidade M em G 1. Se não há vértice exposto em S então SAÍDA M. Pare [M é de máxima cardinalidade em G.] Senão rotule de  todos os vértices expostos em S . 2. Para cada i em S e cada aresta (i, j) fora de M, rotule j de i, a menos que já esteja rotulado. 3. Para cada j não-exposto em T, rotule i de j, onde i é a outra extremidade da única arestai, (j) em M. 4. Faça o backtracking das trajetórias alternantes P terminando em um vértice exposto em T, usando os rótulos nos vértices. 5. Se, no Passo 4, nenhum P é de aumento, então SAÍDA M. Pare [M é de máxima cardinalidade em G.] Senão aumente M usando um caminho de aumento P. Remova todos os rótulos. Vá ao Passo 1. Fim EMPARELHAMENTO •

EXEMPLO 1





Emparelhamento de Máxima Cardinalidade Na Fig. 505a, será que o emparelhamento M1 é de máxima cardinalidade? Em caso negativo, aumente sua cardinalidade até atingir um máximo.

Solução. Apliquemos o algoritmo. 1. Rotular 1 e 4 de . 2. Rotular 7 de 1. Rotular 5, 6, 8 de 3. 3. Rotular 2 de 6, e 3 de 7. [Todos os vértices são agora rotulados conforme mostra a Fig. 474a.]

170

Parte F • Otimização, Grafos

una os vértices se eles representam disciplinas cursadas simultaneamente por alguns estudantes. Colora os vértices de forma que os vértices adjacentes recebam cores diferentes. (Se quiser, pode também usar os números 1, 2, em vez de cores reais.) Qual o número mínimo necessário de cores? Para qualquer grafo G, esse número mínimo é chamado de (vértice) número cromático x (G). Por que esta é a resposta do problema? Faça uma possível programação de cursos. De quantas cores necessitamos para colorir os vértices do grafo no Problema 5? Mostre que todas as árvores podem ter seus vértices coloridos com duas cores. (Administração portuária) De quantos píeres o administrador de um porto precisa para acomodar seis navios de cruzeiroS1, , S6 com as datas esperadas de chegadaC e partida P em julho, (C, P) = (10, 13), (13, 15), (14, 17), (12, 15), (16, 18), (14, 17), respectivamente, se cada píer pode acomodar somente um navio, as chegadas ocorrem às 6 da manhã e as partidas às 11 da noite? Sugestão: una Si e Sj por uma aresta caso seus intervalos se sobreponham. Então, colora os vértices. Qual seria a resposta do Problema 18 se somente os cinco navios S1, , S5 tivessem que ser acomodados? (Grafos bipartidos completos) Um grafo bipartido G = ( S, T; E) é chamado de completo se todo vértice emS é unido a todo vértice em T por uma aresta, e é representado porKn ,n , onde n1 e n2 são os números de vértices emS e T, respectivamente. Quantas arestas esse grafo possui? (Grafo planar) Um grafo planar é aquele que pode ser desenhado em uma folha de papel de tal modo que não há duas arestas se cruzando. Mostre que o grafo completoK4 com quatro vértices é •





22.

v

16. 17. 18.



19.



20.



23.





1

21.



24.

2

25.

planar. O grafo completoK5 com cinco vértices não é planar. Faça isso ser visível tentando desenharK5 de tal forma que nenhuma das arestas se cruzem. Interprete o resultado em termos de uma rede de estradas entre cinco cidades. (Grafo bipartido K3,3 não-planar) Cada uma de três fábricas 1, 2, 3 recebe por via subterrânea abastecimento de água, gás e eletricidade, dos pontos A, B, C, respectivamente. Mostre que isso pode ser representado porK3,3 (o grafo bipartido completoG = (S, T; E) com S e T consistindo em três vértices cada) e que oito das nove linhas de abastecimento (arestas) podem ser traçadas sem se cruzarem. Torne visível o fato de queK3,3 não é planar, tentando desenhar a nona linha sem cruzá-la com as outras. (Teorema das quatro cores (vértices)) O famoso teorema das quatro cores afirma que podemos colorir os vértices de qualquer grafo planar (de forma que os vértices adjacentes tenham cores diferentes) com no máximo quatro cores. Tal fato vinha sendo conjecturado por um longo tempo, até ter sido provado em 1976 por Appel e Haken [Illinois J., Math21 (1977), 429–567]. Você poderia colorir o grafo completoK5 com quatro cores? Esse resultado contradiz o teorema das quatro cores? (Para mais detalhes, veja a Ref. [F8] no Apêndice 1.) (Colorindo as arestas) O número cromático da aresta xe(G) de um grafo G é o número mínimo de cores necessário para colorir as arestas de G de forma que arestas incidentes tenham cores diferentes. Obviamente, xe(G)  máx d(u), onde d(u) é o grau do vértice u. Se G = (S, T; E) é bipartido, o sinal de igualdade se aplica. Prove isso paraKn,n. O teorema de Vizing afirma que, para qualquer grafoG (sem arestas múltiplas!), máx d(u)  xe(G)  máx d(u) + 1. Dê um exemplo de um grafo para o qualxe(G) não exceda máx d(u).

QUESTÕES E PROBLEMAS DE REVISÃO DO

CAPÍTULO 23

1. O que é um grafo? Um digrafo? Uma árvore? Um ciclo? Uma 12. trajetória? 2. Diga de memória como podemos manipular grafos e digrafos em computadores. 3. Descreva situações e problemas que podem ser modelados usandose grafos ou digrafos. 4. O que é um problema de trajetória mínima? Cite aplicações dele. 5. O que é BFS? DFS? Em que esses conceitos se relacionam? 14. 6. Dê algumas aplicações nas quais as arborescências desempenham um papel. 7. O que são grafos bipartidos? Que aplicações servem de motivo para esse conceito? 8. O que é o problema do vendedor viajante? 9. O que são redes? Que problemas deotimização estão relacionados a elas? 16. 10. Pode uma aresta progressiva em uma trajetória ser uma aresta regressiva em outra trajetória? Em um conjunto de corte? Explique. 11. Existe um famoso teorema em conjuntos de corte. Você pode lembrar-se dele e explicá-lo? 12–17 MATRIZES PARA GRAFOS OU DIGRAFOS Encontre a matriz de adjacência de:

e4

1

13.

2

e5 e3

1 e3

e1

4

e2

2

15.

e5

1

3

e1

e6

3

e2

1

2

4

3

2 e4

e1

e2

e3

3

1

2

4

3

17.

1

2

3

4

5

18–20 MATRIZ DE ADJACÊNCIA DADA Esboce o grafo cuja matriz de adjacência é:

Capítulo 23: Grafos. Otimização Combinatória

18.

20.

 

 

0101 1010 0100 1000 0101 1001 0001 1110

19.



0

1

1

1

0

1

1

1

0

29. (Arborescência mínima) Encontre uma arborescência mínima para o grafo do Problema 26. 30. Encontre uma arborescência mínima noProblema 27. 31. O teorema de Cayley afirma que o número de arborescências em um grafo completo comn vértices é nn–2. Verifique isso paran = 2, 3, 4. 32. Mostre que O(m3) + O(m2) = O(m3).



33–34 FLUXO MÁXIMO Encontre o fluxo máximo, onde os números dados são capacidades: 33. 5 2

4

4

2

Faça uma lista de incidência de vértices do digrafo no Problema 21. 13. 22. Faça uma lista de incidência de vértices do digrafo no Problema 14. 23–28 TRAJETÓRIAS MÍNIMAS Encontre uma trajetória mínima e seu comprimento pelo algoritmo BFS de Moore, supondo que todas as arestas tenham o comprimento 1: 23. 24. t

7

s 1

2 3

3

10

2

t

s

Encontre as trajetórias mínimas usando o algoritmo de Dijkstra: 26. 27. 48 17 1 3 1

28 4

28.

8

10

4

1

2 3

5

3

2

6

10

3

4

6 t

3 s 1

9

2

5

10

4 2

5

7

3

35. A Companhia A possui escritórios em Chicago, Los Angeles e Nova York, a CompanhiaB possui escritórios em Boston e Nova York, e a Companhia C, em Chicago, Dallas e Los Angeles. Represente isso por um grafo bipartido. 36. (Emparelhamento de máxima cardinalidade) Aumentando o emparelhamento dado, encontre um emparelhamento de máxima cardinalidade:

2

2

4

5

t

s

5 t

6

34.

3 s

25.

171

1

2

3

4

5

6

2

3

4

2

1

5 4

2

1

4

RESUMO DO CAPÍTULO

23

GRAFOS E OTIMIZAÇÃO COMBINATÓRIA A otimização combinatória trata dos problemas de otimização de estruturas discretas ou combinatórias. Ela se vale de grafos ou digrafos (Seção 23.1) como ferramentas básicas. Um grafo G = (V, E) consiste em um conjunto V de vértices v1, v2, ,vn (com freqüência simplesmente denotados por 1, 2, , n) e de um conjunto E de arestas e1, e2, ,em, cada uma das quais conectando dois vértices. Também escrevemos (i, j) para uma aresta que tem os vértices i e j como extremidades. Um digrafo (= grafo orientado) é um grafo no qual cada aresta tem uma direção (indicada por uma seta). Para manipular grafos e digrafos em computadores, podemos usar matrizes ou listas (Seção 23.1). Este capítulo dedica-se ao estudo de importantes classes de problemas de otimização para grafos e digrafos, todos eles surgidos de aplicações práticas e dos algoritmos correspondentes, como segue. Em um problema de trajetória mínima (Seção 23.2) determinamos uma trajetória de comprimento mínimo (consistindo em arestas) a partir de um vértice s até um vértice t em um grafo cujas arestas (i, j) têm um “comprimento” •

















172

Parte F • Otimização, Grafos

> 0, que pode ser um comprimento real, um tempo de viagem, um custo, uma resistência elétrica [se ( i, j) for um condutor em um circuito], e assim por diante. O algoritmo de Dijkstra (Seção 23.3) ou, quando todos os lij = 1, o algoritmo de Moore (Seção 23.2) são apropriados para esses problemas. Uma árvore é um grafo conectado e não possui ciclos (trajetória fechadas). As árvores têm uma grande importância prática. Uma arborescência em um grafo G é uma árvore contendo todos os vértices de G. Se as arestas de G têm comprimentos, podemos determinar a arborescência mínima, para a qual o somatório dos comprimentos de todas as arestas é mínimo, usando para isso o algoritmo de Kruskal ou o algoritmo de Prim (Seções 23.4, 23.5). Uma rede (Seção 23.6) é um digrafo no qual cada aresta ( i, j) tem uma capacidade cij > 0 [= máximo fluxo possível ao longo de (i, j)], e em um vértice, chamado de fonte s , produz-se um fluxo que escoa ao longo das arestas até um vértice t, chamado de sorvedouro ou alvo, onde o fluxo desaparece. O problema consiste em maximizar o fluxo, por exemplo, aplicando-se o algoritmo de Ford–Fulkerson (Seção 23.7), que utiliza as trajetórias de aumento de fluxo (Seção 23.6). Outro conceito relacionado a isso é o de conjunto de corte, como definido na Seção 23.6. Um grafo bipartido G = ( V, E) (Seção 23.8) é um grafo cujo conjunto de vértices V consiste em duas partes S e T tal que toda aresta de G tem uma extremidade em S e a outra extremidade em T, de forma que não há arestas conectando vértices apenas em S ou vértices apenas em T. Um emparelhamento em G é um conjunto de arestas no qual nenhum par delas possui extremidades em comum. O problema então consiste em encontrar um emparelhamento de máxima cardinalidade em G, ou seja, um emparelhamento M que tenha um número máximo de arestas. Um algoritmo para isso é mostrado na Seção 23.8. lij

PARTE

G

Probabilidade, Estatística CAPÍTULO 24 Análise de Dados. Teoria da Probabilidade CAPÍTULO 25 Estatística Matemática A teoria da probabilidade (Capítulo 24) fornece os modelos de distribuições de probabilidade (modelos teóricos da realidade observável envolvendo efeitos do acaso) a serem testados pelos métodos estatísticos, e também apresenta a base matemática para o emprego desses métodos, que são vistos no Capítulo 25. A moderna estatística matemática (Capítulo 25) possui diversas aplicações em engenharia, como, por exemplo, nos testes de materiais, no controle de processos produtivos, no controle da qualidade de produtos fabricados, nos testes de desempenho de sistemas, em robótica e na automação em geral, no planejamento de produção, nas análises de mercado, e assim por diante. A isto poderíamos acrescentar uma longa lista de campos de aplicação, como, por exemplo, em agricultura, biologia, ciência da computação, demografia, economia, geografia, gerenciamento de reservas naturais, medicina, meteorologia, política, psicologia, sociologia, controle de tráfego, planejamento urbano etc. Apesar de essas aplicações serem muito heterogêneas, veremos que a maioria dos métodos estatísticos são universais, no sentido em que é possível aplicar cada um desses métodos a vários campos diferentes.

Softwares Adicionais para Probabilidade e Estatística Veja também a lista de softwares fornecida no início da Parte E, sobre Análise Numérica. DATA DESK. Data Description, Inc., Ithaca, NY. Tel.: 1-800-573-5121, (607) 257-1000; site na web: www. datadescription.com. MINITAB. Minitab, Inc., College Park, PA. Tel.: 1-800-448-3555, (814) 238-3280; site na web: www. minitab.com. SAS. SAS Institute, Inc., Cary, NC. Tel.: 1-800-727-0025, (919) 677-8000; site na web: www.sas.com. S-PLUS. Insightful Corporation, Inc., Seattle, WA. Tel.: 1-800-569-0123, (206) 283-8802; site na web: www.insightful.com. SPSS. SPSS, Inc., Chicago, IL. Tel.: 1-800-543-2185, (312) 651-3000; site na web: www.spss.com. STATISTICA. StatSoft, Inc., Tulsa, OK. Tel.: (918) 749-1119; site na web: www.statsoft.com.

CAPÍTULO

24

Análise de Dados. Teoria da Probabilidade Começaremos este capítulo mostrando como manipular dados usando números ou gráficos, e como deles extrair informações (p. ex., médias de tamanhos, dispersão de dados etc.) Se esses dados são influenciados peloações, “acaso”, cujoetc.), efeitotemos não podemos predizernacom exatidão (p. ex., dados. climáticos, de vidapor útilfatores de pneus que nos basear teoria da probabilidade Essa teoria preços surgiu vinculada aos jogos de azar, como o jogo de cara ou coroa, o de dados e o carteado. Atualmente, ela fornece modelos matemáticos para a representação de processos governados pelo acaso, chamados de experimentos aleatórios ou, sucintamente, de experimentos. Nesses experimentos, observamos uma variável aleatória X, ou seja, uma função cujos valores obtidos numa tentativa (um determinado desempenho ou experimento) ocorrem “ao acaso” (Seção 24.3) segundo uma distribuição de probabilidade que fornece as probabilidades individuais com que os possíveis valores de X podem ocorrer a longo prazo. (Exemplo: cada uma das seis faces de um dado deve ocorrer com a mesma probabilidade, 1/6.) Ou podemos observar simultaneamente mais de uma variável aleatória, como, por exemplo, a altura e o peso de pessoas, ou a dureza e a tensão de ruptura* do aço. Isso será discutido na Seção 24.9, que também fornecerá a base para a justificativa matemática dos métodos estatísticos do Capítulo 25. Pré-requisito: Cálculo. Referências e Respostas dos Problemas: Parte

G do Apêndice 1 e Apêndice 2.

24.1 Representação de Dados. Média. Dispersão.

Há várias formas de representar dados através de números ou gráficos. Por exemplo, no jornal que você lê pode haver tabelas com preços de ações e taxas de câmbio, gráficos de curvas ou de barras representando a evolução de eventos políticos ou econômicos, ou gráficos de setores** mostrando as diferentes maneiras como estão sendo gastos os reais que você paga de imposto. E há muitas outras representações de dados para propósitos especiais. Nesta seção, discutiremos o uso de representações padronizadas de dados em estatística. (Para este propósito, há disponíveis programas estatísticos de computador, como o DATA DESK e o MINITAB, além de também poderem ser úteis outros programas, como o Maple ou o Mathematica.) Explicaremos os correspondentes conceitos e métodos usando para isso exemplos típicos, começando com (1)

89 84 87 81 89 86 91 90 78 89 87 99 83 89.

Essas são n = 14 medidas da tensão (em kgf/mm2) de folhas de aço, registradas na ordem em que foram obtidas e arredondadas para valores inteiros. Para vermos o que está se passando, fazemos um arranjo desses dados, isto é, os dispomos em ordem de tamanho, (2)

78 81 83 84 86 87 87 89 89 89 89 90 91 99.

Arranjar os dados é um processo-padrão que se faz com um computador; veja a Ref. [E25] no Apêndice 1.

Representação Gráfica de Dados Discutiremos agora as representações gráficas padrão utilizadas em estatística para se obterem informações sobre as propriedades dos dados.

A tensão de ruptura (N/m 2, no S.T.) mede a força por unidade de área requerida para colocar um corpo-de-prova no ponto onde ele se rompe (por exemplo, um arame). (N. T.) ** Também chamados de gráficos de pizza. (N. T.) *

Capítulo 24: Análise de Dados. Teoria da Probabilidade

175

Ramo-e-folhas Esta é uma das formas mais simples e também mais úteis de representar dados. A Fig. 506 mostra essa representação para os valores dados em (1), que variam de 78 a 99; veja (2). Dividimos esses números em 5 grupos, 75–79, 80–84, 85–89, 90–94, 95–99. Os números inteiros nas casas das dezenas são 7, 8, 8, 9, 9. Eles formam o ramo na Fig. 506. A primeira folha é 8 (representando o número 78). A segunda folha é 134 (representando os números 81, 83, 84), e assim por diante. Dizemos que o número de vezes que um valor ocorre é sua freqüência absoluta. Portanto, 78 tem freqüência absoluta 1, o valor 89 tem freqüência absoluta 4 etc. A coluna na extremidade esquerda da Fig. 506 mostra as freqüências absolutas acumuladas, ou seja, a soma das freqüências absolutas dos valores até a linha dessa folha. Assim, o número 4 na segunda linha à esquerda mostra que (1) possui 4 valores até 84, inclusive. O número 11 na linha seguinte mostra que há 11 valores não excedendo 89 etc. Dividindo as freqüências absolutas acumuladas por n (= 14 na Fig. 506), obtemos as freqüências relativas acumuladas.

Histograma Para grandes conjuntos de dados, os histogramas representam melhor as distribuições de dados do que os ramose-folhas. O princípio subjacente a um histograma está explicado na Fig. 507. (A Seção 25.7 mostra um histograma aplicado a um grande conjunto de dados.) As bases dos retângulos na Fig. 507 são os intervalos x (conhecidos como intervalos de classe) 74,5–79,5, 79,5–84,5, 84,5–89,5, 89,5–94,5, 94,5–99,5, cujos pontos médios (conhecidos como pontos de classe) são x = 77, 82, 87, 92, 97, respectivamente. A altura de um retângulo com ponto de classe x é a freqüência de classe relativa frel(x), definida como o número de valores de dados nesse intervalo de classe dividido por n (= 14, neste caso). Conseqüentemente, as áreas dos retângulos são proporcionais a essas freqüências relativas, de forma que os histogramas fornecem uma boa impressão das distribuições de dados.

Centro e Dispersão de Dados: Mediana, Quartis Para representar o centro de valores dados, uma medida simples é a mediana, ou seja, o valor situado no meio quando os valores estão ordenados. Em (2), temos 14 valores. O sétimo deles é 87 e o oitavo é 89; dividimos ao meio a diferença entre eles, obtendo a mediana 88. (Em geral, obteríamos um valor fracionário.) A dispersão (variabilidade) dos valores num conjunto de dados pode ser medida pela amplitude R = xmáx – xmín, correspondente ao maior desses valores menos o menor; em (2), R = 99 – 78 = 21. frel(x) 0,5

Unidade da folha = 1,0 1 4 11 13 14

7 8 8 9 9

8 134 6779999 01 9

Fig. 506. Ramo-e-folhas dos dados em (1) e (2)

0,4 0,3 0,2 0,1 0

77

82

87

92

97

x

Fig. 507. Histograma dos dados em (1) e (2) (agrupados como na Fig. 506)

Uma melhor informação é fornecida pela amplitude interquartil AIQ = q3 – q1. Aqui, o terceiro quartil q3 é o valor do meio entre os valores situados acima da mediana, ao passo que o primeiro quartil q1 é o valor do meio entre os valores situados abaixo da mediana. Assim, em (2), temos que q3 = 89 (o quarto valor do fim para q1 = 84 (o quarto valor do início para o fim) e AIQ = 89 – 84 = 5. A mediana é também chamada de osegundo início), quartil , sendo representada por q2. A regra de “dividir ao meio a diferença” (que há pouco aplicamos para obter o segundo quartil) também deve ser utilizada para os outros quartis, caso necessário.

Diagrama de Caixa Na Fig. 508, o diagrama de caixa de (1) é construído com os cinco números recém-determinados xmín, q1, q2, q3, xmáx. A caixa se estende de q1 a q3. Logo, sua altura corresponde à AIQ. A posição ocupada pela mediana na caixa mostra que a distribuição dos dados não é simétrica. Há também duas linhas se estendendo para fora da caixa, uma para baixo em direção a xmín e outra para cima em direção a xmáx. Logo, elas indicam a amplitude R.

176

Parte G • Probabilidade, Estatística

Os diagramas de caixa são particularmente úteis quando fazemos comparações. Por exemplo, a Fig. 508 mostra os diagramas de caixa dos conjuntos de dados (1) e (3)

91 89 93 91 87 94 92 85 91 90 96 93 89

(consistindo em n = 13 valores). Ordenando esses números, obtemos (4)

85 87 89 89 90 91 91 91 92 93 93 94 96

(tensão de ruptura, como antes). Do gráfico, vemos de imediato que a caixa referente a (3) é mais curta do que a caixa referente a (1) (o que indica uma maior qualidade das folhas de aço!) e que q2 situa-se no meio da caixa (mostrando que esta distribuição apresenta uma forma mais simétrica). Finalmente, xmáx está mais próximo de q3 em (3) do que em (1), um fato que discutiremos mais tarde. Para traçar o diagrama de caixa referente a (3), tomamos de (4) os valores xmín = 85, q1 = 89, q2 = 91, q3 = 93, xmáx = 96.

Valores Discrepantes* Um valor discrepante é aquele que se destaca do restante do conjunto de dados. Ele pode indicar que algo errado ocorreu no processo de coleta dos dados. Em conexão com a idéia dos quartis, convencionalmente definimos um valor discrepante como aquele que se afasta de qualquer uma das extremidades da caixa por um valor maior que 1,5 AIQ. 100

95

q3 90

q2

q3 q2

q1

85

q1 80

75

Conjunto de dados (1)

Conjunto de dados (3)

Fig. 508. Diagramas de caixa dos conjuntos de dados (1) e (3)

Para os dados de (1), temos que AIQ = 5, q1 = 84, q3 = 89. Logo, consideraremos como valores discrepantes os que forem menores que 84 – 7,5 ou maiores que 89 + 7,5, de forma que 99 é um valor discrepante [veja (2)]. Já os dados de (3) não apresentam valores discrepantes, como se pode facilmente verificar.

Média. Desvio-padrão. Variância A mediana e os quartis são facilmente obtidos por ordenação e contagem, praticamente dispensando-se os cálculos. Porém, eles não fornecem informações completas sobre os dados: é possível alterar os valores dos dados sem alterar a mediana e algo similar ocorre com os quartis. O tamanho médio dos valores assumidos pelos dados pode ser medido de uma forma mais refinada pela média n

(5)

1  xj   1 ( x1  x2  x   n j1 n







 xn).

Esta é a média aritmética dos valores, que obtemos somando esses valores e dividindo o resultado pela quantidade n dos dados. Assim, em (1), x 

1 14

(89  84











89) 

*Um valor discrepante é também conhecido pelo termo srcinal inglês, outlier.

611 7

(N. T.)

 87,3.

Capítulo 24: Análise de Dados. Teoria da Probabilidade

177

Todos os valores presentes contribuem para a média, de modo que, quando alteramos um deles, alteraremos também a média. Similarmente, é possível medir de modo mais refinado a dispersão (variabilidade) dos valores usando-se o desvio-padrão s ou o seu quadrado, conhecido como variância n

(6)

s2 

1 1  ( x  x)   [(x  n1 n1 j

2

1

j1

 x)2 







 ( xn  x)2].

Assim, para obtermos a variância dos dados, calculamos a diferença xj – x de cada valor em relação à média, elevamos essas diferenças ao quadrado, somamos esses n quadrados e dividimos o resultado por n – 1 (e não por n, pelo motivo apresentado na Seção 25.2). E para obtermos o desvio-padrão s, tomamos a raiz quadrada de s2. Por exemplo, usando x = 611/7, temos para os dados (1) a variância s2 

1 13

[(89 

)

611 2 7



(84 

)

611 2 7











(89 

)]

611 2 7

176 7

 25,14.

Logo, o desvio-padrão é s   176/7  5,014. Note que o desvio-padrão tem a mesma dimensão dos valores srcinais (kgf/mm 2, veja no início), o que representa uma vantagem. Por outro lado, a variância é preferível ao desvio-padrão na elaboração de métodos estatísticos, como veremos no Capítulo 25.

CUIDADO! Seu programa de computador (Maple, por exemplo) pode utilizar 1/n ao invés de 1/(n – 1) em (6), mas esta última fórmula é melhor nos casos em que n é pequeno (veja a Seção 25.2).

PROBLEMAS PROPOSTOS 24.1 1–10 REPRESENTAÇÕES DE DADOS Represente os dados por um ramo-e-folhas, um histograma e um diagrama de caixa: 1.20 21 20 19 20 19 21 19 2.7 6 4 0 7 1 2 4 6 6

3.56 58 54 33 41 30 44 37 51 46 56 38 38 49 39 4.12,1 10 12,4 10,5 9,2 17,2 11,4 11,8 14,7 9,9 5.70,6 70,9 69,1 71,3 70,5 69,7 71,5 69,8 71,1 68,9 70,3 69,2 71,2 70,4 72,8 6. 0,52 0,11 0,48 0,94 0,24 0,19 0,55 7. Tempo de reação [s] de um interruptor automático 2,3 2,2 2,4 2,5 2,3 2,3 2,4 2,1 2,5 2,4 2,6 2,3 2,5 2,1 2,4 2,2 2,3 2,5 2,4 2,4 8. Conteúdo de carbono [%] em carvão 89 90 89 84 80 88 90 89 88 90 85 87 86 82 85 76 89 87 86 86 9. Peso de garrafas cheias [g] em um processo de enchimento automático 403 399 398 401 400 401 401

10. Consumo de gasolina [galões por milha] deseis automóveis de um mesmo modelo 14,0 14,5 13,5 14,0 14,5 14,0 11–16 MÉDIA E DISPERSÃO Encontre a média e compare-a com a mediana. Encontre o desvio-

padrão e compare-o com a amplitude interquartil. 11. Os dados do Problema 1. 12. Os dados do Problema 2. 13. Os dados do Problema 5. 14. Os dados do Problema 6. 15. Os dados do Problema 9. 16. 5 22 7 23 6. Por que x – q2 é tão grande? 17. Construa os dados mais simples possíveis para os quaisx = 100 mas q2 = 0. 18. (Média) Prove que x deve sempre se situar entre o valor mínimo e o valor máximo dos dados. 19. (Valor discrepante, dados reduzidos) Calcule s para os dados 4 1 3 10 2. Então, reduza os dados, excluindo o valor discrepante e calcule novamente s. Comente. 20. PROJETO ESCRITO. Média e Dispersão. Compare as medidas Q2, AIQ com x, s, ilustrando suas vantagens e desvantagens com exemplos de sua escolha.

24.2 Experimentos, Resultados, Eventos Passemos agora para a teoria da probabilidade, cujo propósito é fornecer modelos matemáticos de situações afetadas, ou mesmo governadas, por “efeitos do acaso”, do que são exemplos a previsão do tempo, os seguros de vida, a qualidade de produtos técnicos (computadores, baterias, chapas de aço etc.), os problemas de tráfego e, naturalmente, os jogos de azar, como os de baralho e dados. Acrescente-se que a exatidão desses modelos pode ser testada por observações e experimentos apropriados — este é um dos propósitos principais da estatística, que explicaremos no Capítulo 25.

178

Parte G • Probabilidade, Estatística

Comecemos definindo alguns termos-padrão. Um experimento é um processo de medida ou uma observação, feita num laboratório, numa fábrica, na rua, na natureza ou em qualquer outro lugar; logo, o termo “experimento” é utilizado num sentido bastante geral. Nosso interesse reside nos experimentos que envolvem aleatoriedade, ou seja, efeitos do acaso, de modo que não é possível prever exatamente como será um resultado. Uma tentativa corresponde a um desempenho único ocorrido num experimento. Dizemos que seu desfecho é um resultado ou um ponto amostral. n tentativas então fornecem uma amostra de tamanho n consistindo em n pontos amostrais. O espaço amostral S de um experimento é o conjunto de todos os resultados possíveis. EXEMPLOS 1–6Experimentos Aleatórios. Espaços Amostrais (1) Inspeção de lâmpadas. S = {Defeituosa, Não-defeituosa}. (2) Lançamento de um dado. S = {1, 2, 3, 4, 5, 6}. (3) Medida da tensão de ruptura de um arame. S é um conjunto de números em algum intervalo. (4) Medida do conteúdo de cobre no latão. S: digamos, 50% a 90%. (5) Contagem diária de acidentes de trânsito em Nova York. S é um certo intervalo de números inteiros. (6) Pesquisa de opinião sobre um novo modelo de automóvel. S = {Gosto, Não gosto, Indeciso}.



Os subconjuntos de S são chamados de eventos e os resultados, de eventos simples. EXEMPLO 7

Eventos Em (2), os eventos sãoA = {1, 3, 5} (“Número ímpar”), B = {2, 4, 6} (“Número par”), C = {5, 6} etc. Eventos simples são {1}, {2}, {6}.







,



Se em uma tentativa ocorre um resultado a, e a  A (a é um elemento de A), dizemos que A ocorre. Por exemplo, se um dado lançado mostra a face 3, o evento A: Número ímpar ocorre. Similarmente, se no Exemplo 1, C ocorre (significando que ocorre a face 5 ou 6), então D = {4, 5, 6} igualmente ocorre. Observe também que S acontece em cada tentativa, significando que algum evento de S sempre ocorre. Tudo isso é bastante natural.

Uniões, Interseções, Complementares de Eventos Em conexão com as leis básicas da probabilidade, necessitaremos dos seguintes conceitos e fatos sobre os eventos (subconjuntos) A, B, C, de um dado espaço amostral S. •





A união A  B de A e B consiste em todos os pontos em A ou B ou em ambos. A interseção A  B de A e B consiste em todos os pontos que estão tanto em A Se A e B não possuem pontos em comum, escrevemos

quanto em B.

AB

onde  é o conjunto vazio (conjunto sem nenhum elemento) e dizemos que A e B são mutuamente excludentes (ou disjuntos), pois, em uma tentativa, a ocorrência de A exclui a ocorrência de B (e vice-versa) — por exemplo, se um dado fornece um número ímpar, não podemos obter um número par na mesma tentativa. De forma similar, uma moeda não pode fornecer Cara e Coroa ao mesmo tempo. Complementar A de A. Trata-se do conjunto de todos os pontos de S que não estão em A. Assim, c

A  A  , c

A  A  S. c

No Exemplo 7, temos que A = B, logo, A  A = {1, 2, 3, 4, 5, 6} = S. Outra notação para o complementar de A é A  (ao invés de Ac), porém não a usaremos porque, na teoria dos conjuntos, A  é usado para denotar o fechamento de A (que não é necessário ao nosso trabalho). As uniões e interseções de um número maior de eventos são definidas de forma similar. A união c

c

m

 Aj  A 1  A 2 

j1







 Am

dos eventos A1, , Am consiste em todos os pontos que estão pelo menos em um Aj. Algo similar ocorre com a união A1  A2  de um número infinito de subconjuntos A1, A2, de um espaço amostral infinito S (ou seja, S consiste em um número infinito de pontos). A interseção •













m

 Aj  A 1  A 2 

j1











 Am

de A1, , Am consiste nos pontos de S que estão em cada um desses eventos. Algo similar ocorre com a interseção A1  A2  de um número infinito de subconjuntos de S. •











Capítulo 24: Análise de Dados. Teoria da Probabilidade

179

O trabalho com eventos pode ser exemplificado e melhor compreendido com o uso dos diagramas de Venn1, que representam as uniões, interseções e complementares. Tudo isso está mostrado nas Figs. 509 e 510, envolvendo exemplos típicos que explicitam essa idéia. EXEMPLO 8

Uniões e Interseções de Três Eventos No lançamento de um dado, considere os eventos A:

Número maior que

3,

B:

Número menor que

6,

C:

Número Par

Então A  B  {4, 5}, B  C  {2, 4}, C  A  {4, 6}, A  B  C  {4}. Você pode esboçar um diagrama de Venn para isso? Também, A  B = S, logo, A  B  C = S (por quê?). 

3 A

5

A B

S

A

C

B

2

6

4

S União A ∪ B

1

S Interseção A ∩ B

Fig. 510. Diagrama de Venn para o experimento de lançamento de um dado, mostrando S, A = {1, 3, 5}, C = {5, 6}, A  C = {1, 3, 5, 6}, A  C = {5}

Fig. 509. Diagramas de Venn mostrando dois eventos A e B em um espaço amostral S e sua união A  B (cinza) e interseção A  B (cinza)

PROBLEMAS PROPOSTOS 24.2 1–9 ESPAÇOS AMOSTRAIS, EVENTOS Faça um gráfico do espaço amostral para o experimento: 1. Lançamento de 2 moedas. 2. Seleção de 4 parafusos de um lote de parafusos dextrogiros e levogiros. 3. Lançamento de 2 dados. 4. Lançamento de uma moeda até a primeira Cara” “ aparecer. 5. Lançamento de um dado até o primeiro“Seis” aparecer. 6. Seleção de parafusos de porca de um lote de 20 parafusos contendo um defeituosoD, até D ser retirado, quando se retiram os parafusos um de cada vez e se supõe que se faça umaamostragem sem reposição, isto é, os parafusos selecionados não são devolvidos ao lote. 7. Registro do tempo de vida de cada uma de 3 lâmpadas. 8. Escolha de um comitê de 3 pessoas selecionadas a partir de um grupo de 5. 9. Registro da máxima temperatura diáriaX e da máxima pressão atmosférica Y em algum ponto de uma cidade. 10. No Problema 3, circule e marque os eventosA: Faces iguais, B: Soma excedendo 9, C: Soma igual a 7. 11. No lançamento de 2 dados, os eventosA: Soma divisível por 3, B: Soma divisível por 5 são mutuamente excludentes? 12. Responda à questão do Problema 11 para o lançamento de 3 dados. 13. No Problema 5, liste os resultados que constituem um eventoE: o primeiro surgimento de um“Seis” no lançamento de um dado 3 vezes no máximo. DescrevaE . 14. Liste todos os 8 subconjuntos do espaço amostralS = {a, b, c}. c

JOHN VENN (1834–1923), matemático inglês.

1

15–20 DIAGRAMAS DE VENN 15. No contexto de uma viagem à Europa feita por um grupo de estudantes, considere os eventosP de eles visitarem Paris,G de eles se divertirem e M de eles ficarem sem dinheiro, e descreva em palavras os eventos 1, , 7 no diagrama. •





G 3 4

2 7

5

1 6

M

P

Problema 15

16. Usando diagramas de Venn, represente graficamente e verifique as regras A  ( B  C)  ( A  B)  ( A  C) A  ( B  C)  ( A  B)  ( A  C). 17. (Leis de De Morgan) Usando diagramas de Venn, represente graficamente e verifique asleis de De Morgan (A  B)  A  B (A  B)  A  B . 18. Usando um diagrama de Venn, mostre queA  B se e somente se A  B = A. 19. Mostre que, pela definição de complementar, para qualquer subconjunto A de um espaço amostralS, (A )  A, S  ,   S, A  A  S, A  A  . 20. Usando um diagrama de Venn, mostre queA  B se e somente se A  B = B. c

c

c

c

c

c

c

c

c

c

c

c

180

Parte G • Probabilidade, Estatística

24.3 Probabilidade Em um experimento, a “probabilidade” de ocorrência de um evento A pretende medir quão freqüentemente A pode vir a ocorrer caso realizemos várias tentativas. Se fizermos lançamentos de uma moeda, então caras Ca e coroas Co aparecerão aproximadamente com a mesma freqüência — dizemos que Ca e Co são “igualmente prováveis”. Similarmente, para um dado de faces regulares e feito de material homogêneo ( “dado honesto”) cada um dos seis resultados 1, , 6 será igualmente provável de ocorrer. Esses são exemplos de experimentos nos quais o espaço amostral S consiste em um número finito de resultados (pontos) que, devido a uma certa simetria, podem ser considerados como possuindo igual probabilidade de ocorrência. Isso sugere a seguinte definição. •

DEFINIÇÃO 1





Primeira Definição de Probabilidade

Se o espaço amostral S de um experimento consiste em um número finito de resultados (pontos) que são igualmente prováveis, então a probabilidade P(A) de um evento A é

(1)

P(A) 

Número de pontos em A .  Número de pontos em S

Dessa definição, decorre imediatamente que, em particular,

(2) EXEMPLO 1

P(S)  1.

Dado Honesto Ao se lançar uma vez um dado honesto, qual é a probabilidade P(A) de A de obtermos um 5 ou um 6? E qual é a probabilidade deB: “Número par”?

Solução. Os seis resultados são igualmente prováveis, de modo que cada um tem a probabilidade de 1/6. Portanto, P(A) = 2/6 = 1/3 pois {5, 6} possui 2 pontos e P(B) = 3/6 = 1/2. 

A=

A Definição 1 diz respeito a diversos jogos, bem como a algumas aplicações práticas, conforme veremos, mas certamente não a todos os experimentos, simplesmente porque em muitos problemas não temos resultados finitos e igualmente prováveis. Para chegarmos a uma definição mais geral de probabilidade, consideramos a ilidade como a conprobab Lembremos da Seção 24.1 que afreqüência absolutaf(A) de um eventoA em n trapartida da freqüência relativa. tentativas é o número de vezes queA ocorre, e afreqüência relativade A nessas tentativas éf(A)/n; portanto,

(3)

ƒrel(A) 

ƒ(A)   n

Número de vezes que ocorre  . Número de tentativas A

Ora, se A não ocorreu, então f(A) = 0. Se A ocorreu sempre, então f(A) = n. Esses são os casos extremos. A divisão por n fornece (4*)

0  ƒ rel(A)  1.

Em particular, para A = S, temos f(S) = n, pois S sempre ocorre (significando que algum evento sempre ocorre; se necessário, veja a Seção 24.2, após o Exemplo 7). A divisão por n fornece (5*)

ƒrel(S)  1.

Finalmente, se Aunião e B Asão excludentes, então eles não absolutas podem ocorrer Logo, por a freqüência absoluta da sua  mutuamente à soma das freqüências de A e juntos. B deve ser igual B. A divisão n fornece a mesma relação para as freqüências relativas, (6*)

ƒrel(A  B)  ƒ rel(A)  ƒ rel(B)

(A  B  ).

Estamos agora prontos para estender a definição de probabilidade a experimentos nos quais não estão mais disponíveis resultados igualmente prováveis. Naturalmente, a definição estendida deve incluir a Definição 1. Como se supõe que as probabilidades supostas sejam uma contrapartida teórica das freqüências relativas, escolhemos as propriedades em (4*), (5*), (6*) como axiomas. (Historicamente, tal escolha é o resultado de um longo processo de ganho de experiência sobre o que poderia ser melhor e mais prático.)

Capítulo 24: Análise de Dados. Teoria da Probabilidade

DEFINIÇÃO 2

181

Definição Geral de Probabilidade

Dado um espaço amostral S, a cada evento A de S (subconjunto de S) se associa um número P(A), chamado de probabilidade de A, tal que os seguintes axiomas da probabilidade são satisfeitos.

1. Para todo A em S, (4)

0  P(A)  1.

2. O espaço amostral inteiro S tem a probabilidade (5)

P(S )  1.

3. Para eventos mutuamente excludentes A e B, ( A  B = ; veja a Seção 24.2), (6)

P(A  B)  P(A)  P(B)

(A  B  ).

Se S é infinito (possui um número infinito de pontos), o Axioma 3 tem que ser substituído por 3. Para eventos mutuamente excludentes A1, A2, , )  P(A1)  P(A2)  . (6) P(A1  A2  •

















No caso infinito, os subconjuntos de S nos quais P(A) é definida são restritos para formar uma chamada álgebra s, conforme se explica na Ref. [RG6] (e não [G6]!) no Apêndice 1. Entretanto, isso não tem qualquer conseqüência prática para nós.

Teoremas Básicos da Probabilidade Veremos que os axiomas da probabilidade nos permitirão construir a teoria da probabilidade e sua aplicação à estatística. Começaremos com três teoremas básicos. O primeiro deles é útil se pudermos obter a probabilidade do complementar A mais facilmente do que a própria P(A). c

TEOREMA 1

Regra da Complementaridade c Para um evento A e seu complementar A em um espaço amostral S,

(7) PROVA

P(A )  1  P(A). c

Pela definição de complementar (Seção 24.2),temos que S = A  A e A  A = . Logo, pelos Axiomas 2 e 3, c

1  P(S)  P(A)  P(A ),

assim

c

EXEMPLO 2

c

P(A )  1  P(A). c



Lançamento de Moeda Cinco moedas são lançadas simultaneamente. Encontre a probabilidade de ocorrência do evento A: pelo menos uma cara aparece. Suponha que as moedas sejam honestas.

Solução. Visto que cada moeda pode fornecer caras ou coroas, o espaço amostral consiste em 25 = 32 resultados. Como as moedas são honestas, podemos atribuir a mesma probabilidade (1/32) a cada resultado. Então, o evento A ( nenhuma cara é obtida) consiste em somente 1 resultado. Logo, P(A ) = 1/32, e a resposta é P(A) = 1 – P(A = 31/32.  c

c

c

O próximo teorema é uma simples extensão do Axioma 3, que você pode prontamente provar por indução. TEOREMA 2

Regra da Adição para Eventos Mutuamente Excludentes Para eventos mutuamente excludentes A1,

(8)

P(A1  A2 













, Am em um espaço amostral S,

Am)  P(A1)  P(A2) 







 P(Am).

182

Parte G • Probabilidade, Estatística

EXEMPLO 3

Eventos Mutuamente Excludentes Se a probabilidade de que, em um dia de trabalho qualquer, uma oficina receba 10–20, 21–30, 31–40, mais de 40 carros para reparos é de 0,20, 0,35, 0,25, 0,12, respectivamente, qual é a probabilidade de que, em um dado dia de trabalho, a oficina receba pelo menos 21 carros para reparos?

Solução. Como esses eventos são mutuamente excludentes, o Teorema 2 fornece a resposta: 0,35 + 0,25 + 0,12 = 0,72. Verifique isso pela regra da complementaridade. 

Em muitos casos, os eventos não serão mutuamente excludentes. Então temos o TEOREMA 3

Regra da Adição para Eventos Arbitrários Para eventos A e B em um espaço amostral,

(9)

P(A  B)  P(A)  P(B)  P(A  B).

PROVA Na Fig. 511, C, D, E perfazem A  B e são mutuamente excludentes (disjuntos). Logo, pelo Teorema 2, P(A  B)  P(C)  P(D)  P(E).

Isto fornece (9), pois à direita, P(C) + P(D) = P(A) pelo Axioma 3 e pela disjunção; e P(E)  P(B)  P(D)   P(B)  P(A  B), também pelo Axioma 3 e pela disjunção.

C

D

E

A

B

Fig. 511. Prova do Teorema 3

Note que, para eventos mutuamente excludentes A e B, temos que A  B = e (6),

(10)



por definição e, comparando (9)

P()  0.

(Você pode provar isso por (5) e (7)?) EXEMPLO 4

União de Eventos Arbitrários No lançamento de um dado honesto, qual é a probabilidade de obtermos um número ímpar ou um número inferior a 4?

Solução. Digamos que A seja o evento “Número ímpar” e

Bo

evento “Número inferior a 4”. Então, o Teorema 3 fornece a resposta

P (A  B ) 

3 6



3 6



2 6



2 3

porque A  B = “Número ímpar inferior a 4” = {1, 3}.



Probabilidade Condicional. Eventos Independentes Freqüentemente, é necessário encontrar a probabilidade de um evento B sob a condição de que um evento A ocorra. Essa probabilidade é chamada de probabilidade condicional de B dado A e é denotada por P(BA). Nesse caso, A serve como um novo espaço amostral (reduzido) e a probabilidade é a fração de P(A) que corresponde a A  B. Assim, P(A  B) (11) P(BA)   [P(A)  0]. P(A) Similarmente, a probabilidade condicional de A dado B é (12)

P(AB) 

P(A  B)  P(B)

[P(B)  0].

Capítulo 24: Análise de Dados. Teoria da Probabilidade

183

Resolvendo (11) e (12) para P(A  B), obtemos o TEOREMA 4

Regra da Multiplicação Se A e B são eventos em um espaço amostral S e P (A)  0, P(B)  0, então, P(A  B)  P(A)P(BA)  P(B)P(AB).

(13)

EXEMPLO 5

Regra da Multiplicação Na produção de parafusos, digamos queA signifique “parafuso excessivamente fino” B e “parafuso excessivamente pequeno”. Consideremos que P(A) = 0,1 e também a probabilidade condicional de que um parafuso fino, também muito pequeno, seja P(BA) = 0,2. Qual é a probabilidade de que um parafuso selecionado aleatoriamente de um lote produzido seja ao mesmo tempo excessivamente fino e excessivamente pequeno?

Solução. P(A  B)  P(A)P(BA)  0,1 0,2  0,02  2%, pelo Teorema 4.





Eventos Independentes. Se A e B são tais que (14)

P(A  B)  P(A)P(B),

eles são chamados de eventos independentes. Supondo que P(A)  0, P(B)  0, vemos de (11)–(13) que, nesse caso, P(AB)  P(A),

P(BA)  P(B).

Isso significa que a probabilidade de A não depende da ocorrência ou da não-ocorrência de B, e vice-versa. Isso justifica o termo “independente”.

Independência de m Eventos. Similarmente, m eventos A1, (15a)

P(A1 



bem como para todos os diferentes eventos (15b) P(Aj  Aj  k

1

2







Aj1, Aj2, •







 Am)  P(A1) •





,



, Am são chamados de independentes se







P(Am)

Ajk,

 Ajk)  P(Aj1)P(Aj2)







P(Ajk)

onde k = 2, 3, , m – 1. Dessa forma, três eventos A, B, C são independentes se e somente se •





P(A  B)  P(A)P(B),

(16)

P(B  C)  P(B)P(C), P(C  A)  P(C)P(A), P(A  B  C)  P(A)P(B)P(C).

Amostragem. Nosso próximo exemplo tem a ver com a seleção aleatória de objetos, um de cada vez, a partir de um dado conjunto de objetos. Esta é a chamada amostragem de uma população, e há duas maneiras de se fazer uma amostragem, como se segue. 1. Na amostragem com reposição, o objeto que foi selecionado aleatoriamente é devolvido ao conjunto dado e o conjunto é completamente misturado. Então, selecionamos aleatoriamente o próximo objeto. 2. Na amostragem sem reposição, o objeto que foi selecionado é descartado. EXEMPLO 6

Amostragem Com e Sem Reposição Uma caixa contém 10 parafusos de porca, três dos quais são defeituosos. Dois parafusos são selecionados aleatoriamente. Encontre a probabilidade de que nenhum dos dois parafusos seja defeituoso.

Solução. Consideramos os eventos A: O primeiro parafuso selecionado é não-defeituoso B: O segundo parafuso selecionado é não-defeituos o

Obviamente, P(A) = 107 , pois 7 dos 10 parafusos não têm defeitos e nossa amostra é aleatória, de modo que cada parafuso tem a mesma probabilidade (101 ) de ser selecionado. Se amostrarmos com reposição, a situação anterior à segunda seleção é a mesma inicial e P(B) = 107 . Os eventos são independentes e a resposta é

184

Parte G • Probabilidade, Estatística P(A  B)  P(A)P(B) 

0,7 0,7  0,49  49%. 

Se amostrarmos sem reposição, então P(A) = 107 , como antes. Se A ocorreu, então há 9 parafusos restantes na caixa, 3 dos quais são defeituosos. Assim, P(BA)  69  23 , e o Teorema 4 fornece a resposta P(A  B) 

7 10



2 3

 47%.

É intuitivamente claro que este valor deve ser menor que o precedente?



PROBLEMAS PROPOSTOS 24.3 1. Três parafusos são selecionados aleatoriamente de um lote de100 11. parafusos, 10 dos quais são defeituosos. Encontre a probabilidade de que os parafusos selecionados sejam não-defeituosos em uma 12. seleção feita (a) com reposição, (b) sem reposição. 13. 2. No Problema 1,encontre a probabilidadede E: pelo menos 1 defeituoso (i) diretamente, (ii) usando complementares; em ambos os casos (a) e (b). 3. Se fizermos uma inspeção de papel selecionando 5 folhas sem reposição a partir de cada lote de 500 folhas, qual é a probabilidade 14. de obtermos 5 folhas limpas apesar de 2% das folhas conterem manchas? Responda primeiro por palpite. 4. Sob quais condições praticamente não fará diferença se amostrarmos com ou sem reposição? Dê exemplos numéricos. 15. 5. Se você necessita de um parafuso dextrogiro retirado de umacaixa contendo 20 parafusos dextrogiros e 5 levogiros, qual é a probabilidade de você obter pelo menos um parafuso dextrogiro ao selecionar 2 parafusos com reposição? 16. 6. Se, no Problema 5, vocêseleciona sem reposição, a probabilidade diminui ou aumenta? Primeiro pense, depois calcule. 17. 7. Em que caso é maior a probabilidade de seacertar um alvo pelo menos uma vez: (a) dando 1 tiro onde a probabilidade de acerto é de 1/2, ou (b) dando 2 tiros onde a probabilidade de acerto é de 1/4? Responda primeiro por palpite e depois calcule. 8. Suponha que retiremos, repetidamente e comreposição, cartas de 18. um conjunto de 100 unidades, 50 das quais representam pessoas 19. do sexo masculino, e 50, pessoas do sexo feminino. Qual é a probabilidade de obtermos uma segunda carta “feminina” antes da 20. terceira carta “masculina”? 9. Qual é o evento complementar do evento considerado no Problema 8? Calcule sua probabilidade de ocorrência e utilize-a para verificar o resultado obtido no Problema 8. 10. No lançamento de dois dad os honestos, qual é a probab ilidade de obtermos uma soma que seja superior a 4, porém que não exceda 7?

No lançamento de dois dados honestos, qualé a probabilidade de obtermos números iguais ou números cujo produto seja par? Resolva o Problema 11 considerando os complementares. Um motor faz funcionar um gerador elétrico. Para um período de 30 dias, a probabilidade de o motor necessitar de reparos é de 8%, e a probabilidade de o gerador necessitar de reparos é de 4%. Qual a probabilidade de que, durante um dado período, todo o conjunto (abrangendo motor e gerador) necessite de reparos? Se um circuito contém 3 chaves automáticas e desejamos que, num dado intervalo de tempo, haja uma probabilidade de 95% de que todas estejam operando, quanto deve valer a probabilidade de falha por intervalo de tempo para uma única chave? Se há uma probabilidade de 0,95 de que a vida útil de um certo tipo de pneu exceda 25 000 milhas, qual é a probabilidade de que um jogo de 4 desses pneus colocado em um automóvel dure mais que 25 000 milhas? No Problema 15, qual é a probabilidade de que pelo menos um dos pneus não dure 25 000 milhas? Um aparelho para controlar pressão contém 4 válvulas, e ele só funciona quando todas as válvulas estão em condições de operar. Se, para cada válvula, a probabilidade de ocorrência de falha durante um certo intervalo de tempo é de 0,03, qual será a correspondente probabilidade de ocorrência de falha no aparelho? Mostre que, se B é um subconjunto de A, então P(B)  P(A). Estendendo o Teorema 4, mostre que P ( A  B  C )  P ( A ) P ( B  A ) P ( C  A  B ). Você pode se perguntar se, em (16), a última relação decorre das demais, porém a resposta é não. Para ver isso, imagine que uma ficha seja selecionada de uma caixa contendo 4 fichas numeradas 000, 011, 101, 110, e considere queA, B, C sejam os eventos em que o primeiro, o segundo e o terceiro dígitos, respectivamente, na ficha selecionada sejam 1. Mostre que, então, as três primeiras fórmulas em (16) são verdadeiras, mas a última não.

24.4 Permutações e Combinações As permutações e combinações auxiliam na obtenção das probabilidades P(A) = a/k porque promovem uma contagem sistemática do número a de pontos dos quais um evento A consiste; aqui, k é o número de pontos do espaço amostral S. A dificuldade prática é que, com freqüência, a pode ser surpreendentemente grande, de modo que fica impossível fazer a contagem ponto a ponto. Por exemplo, se na montagem de um instrumento, você necessita de 10 diferentes parafusos em uma certa ordem e você deseja selecioná-los aleatoriamente de uma caixa (que não contém mais nada), então a probabilidade de obter os parafusos na ordem necessária é de apenas 1/3 628 800, pois existem 10!  1 2 3 4 5 6 7 8 9 10 



















3 628 800

Capítulo 24: Análise de Dados. Teoria da Probabilidade

185

ordens nas quais eles podem ser selecionados. Similarmente, em muitas outras situações, as quantidades de ordens, arranjos etc. são com freqüência incrivelmente grandes. (Se isso tudo ainda não o deixou impressionado, considere 20 parafusos — quão maior será o número de ordens?)

Permutações Uma permutação de determinados objetos (elementos ou coisas) é uma disposição desses objetos numa lista obedecendo a uma certa ordenação. Por exemplo, para três letras a, b, c há 3! = 1 2 3 = 6 permutações: abc, acb, bac, bca, cab, cba. Isso ilustra (a) no seguinte teorema. 

TEOREMA 1



Permutações

(a) Objetos diferentes. O número de permutações de n objetos diferentes tomadas todas de uma vez é (1)

n!  1



2 3 







(lê-se “n fatorial”).

n

(b) Classes de objetos iguais. Se n objetos dados podem ser divididos em c classes de objetos semelhantes com as classes diferindo entre si, então o número de permutações desses objetos tomados todos de uma vez é (2)

n!  n !n ! n! 1

2







(n1  n2 







 nc  n)

c

onde nj é o número de objetos na j-ésima classe.

PROVA

(a) Há n escolhas para preencher a primeira posição da lista. Então n – 1 objetos ainda estão disponíveis p ara ocupar a segunda posição etc. (b) n1 objetos semelhantes e pertencentes a uma classe 1 fazem com que n1! permutações se colapsem a uma única permutação (correspondente àquela na qual a classe 1 ocupa as mesmas n1 posições) etc., de forma que (2) 

decorre de (1). EXEMPLO 1

Ilustração do Teorema 1(b) Se uma caixa contém 6 bolas vermelhas e 4 bolas azuis, a probabilidade de selecionarmos primeiro as bolas vermelhas e depois as azuis é P  6!4!/10!  1/210

 0,5%.



Uma permutação de n objetos tomados k de cada vez é uma permutação contendo somente k dos n objetos dados. Duas dessas permutações consistindo nos mesmos k elementos em uma ordem diferente são, por definição, diferentes. Por exemplo, há seis diferentes permutações das três letras a, b, c tomadas duas a duas de cada vez, ab, ac, bc, ba, ca, cb. Uma permutação de n objetos tomados k de cada vez com repetições é um arranjo obtido colocando-se qualquer objeto dado na primeira posição, qualquer um, incluindo uma repetição do primeiro já utilizado, na segunda posição, e continuando até que as k posições sejam preenchidas. Por exemplo, há 3 2 = 9 diferentes permutações desse tipo para a, b, c quando tomamos as letras duas a duas, a saber, as 6 permutações já mencionadas mais aa, bb, cc. Você pode provar (veja o Projeto de Equipe 18): TEOREMA 2

Permutações O número de permutações diferentes de n objetos diferentes tomados k de uma vez sem repetições é

(3a)

n(n  1)( n  2)







( n  k  1)

e com repetições é

(3b)

nk.



 (n k)! n!



186

Parte G • Probabilidade, Estatística

EXEMPLO 2

Ilustração do Teorema 2 Em um telegrama codificado, as letras são arranjadas em grupos de cinco letras, chamadas de palavras. De (3b), vemos que o número de diferentes palavras desse tipo é 265 = 11 881 376. De (3a), decorre que o número dessas diferentes palavras contendo cada letra no máximo uma vez é 26!/(26  5)!  26 25 24 23 22 









7 893 600.



Combinações Em uma permutação, a ordem dos objetos selecionados tem uma importância essencial. Por outro lado, uma de tipos objetos significacomo qualquer seleção de um ou mais objetos sem nos preocuparmos com a de dados combinações, a seguir. O número de combinações de n objetos diferentes, tomados k por vez, sem repetições é o número de conjuntos que podem ser obtidos a partir dos n objetos dados, com cada conjunto contendo k diferentes objetos e sem que dois conjuntos contenham exatamente as mesmas quantidades k de objetos. O número de combinações de n diferentes objetos, tomados k por vez, com repetições é o número de conjuntos que podem ser obtidos a partir de k objetos escolhidos entre n objetos dados, cuja freqüência de ocorrência é a que desejarmos. Por exemplo, há três combinações das três letras a, b, c tomadas duas a duas, sem repetições, a saber, ab, ac, bc, e seis dessas combinações com repetições, a saber, ab, ac, bc , aa, bb, cc.

combinação . Há dois ordem

TEOREMA 3

Combinações O número de combinações diferentes de n objetos diferentes tomadas k por vez, sem repetições, é

(4a)

n

 k

n(n

n! k!(n

1)

e o número dessas combinações com repetições é



(4b)

PROVA

EXEMPLO 3







1 2

k)!

n

k

1

k



(n







k k

1)

,

.

A afirmação envolvendo (4a) decorre da primeira parte do Teorema 2 notando-se que há k! permutações de k objetos dos n objetos dados que diferem pela ordem dos elementos (veja o Teorema 1), mas há somente uma única combinação desses k objetos do tipo caracterizado na primeira afirmação do Teorema 3. A última afirmação do Teorema 3 pode ser provada por indução (veja o Projeto de Equipe 18).  Ilustração do Teorema 3 O número de amostras de cinco lâmpadas que podem ser selecionadas de um lote de 500 lâmpadas é [veja (4a)]

  500

500!

5

5!495!

500 499 498 497 496 12345

255 244 687 600.



Função Fatorial Em (1)–(4), a função fatorial é básica. Por definição, (5) 0!  1. Pode-se calcular recursivamente os valores a partir dos valores dados por (6)

(n  1)!  ( n  1) n!.

Para um n grande, a função é muito grande (veja a Tabela A3 no Apêndice 5). Uma aproximação conveniente para um n grande é a fórmula de Stirling2 2

JAMES STIRLING (1692–1770), matemático escocês.

187

Capítulo 24: Análise de Dados. Teoria da Probabilidade

(7)

n!

 ne 

2 n

n

(e  2,718





)



onde o sinal  significa “assintoticamente igual”, querendo dizer que a razão entre os dois lados de (7) se aproxima de 1 à medida que n se aproxima do infinito. EXEMPLO 4

Fórmula de Stirling n!

4! 10!

Por(7) 23,5 598 3696

20!

2.422 79 10 18

ValorExato

ErroRelativo 24 2,1% 0,8%

628 3800 2 432 902 008 176 640 000



0,4%



Coeficientes Binomiais Os coeficientes binomiais são definidos pela fórmula

(8)

 ak 

a(a

1)(a

2)







(a

1)

k

k!

(k  0, inteiro).

O numerador possui k fatores. Além disso, definimos (9)

 a

0

1,

 0

em particular,

0

1.

Para um inteiro a = n, obtemos de (8)

   n

(10)

k

n

n

(n  0, 0  k  n).

k

Os coeficientes binomiais podem ser computados recursivamente, pois (11)

   a

k



a

1

k

a

1

k

1



(k  0, inteiro).

A fórmula (8) também fornece (12)





m

( 1)k

k



m

1

k k

(k  0, inteiro) (m > 0).

Há várias outras relações; mencionemos duas importantes, n

1

s

0

(13)

   k

s

k

n

k

k

1

(k  0, n  1, ambos inteiros).

e r

p

(14) k

PROBLEMAS PROPOSTOS 24.4

0

q

     k

r

k

p

q r

(r  0, inteiro).

1. Liste todas as permutações de quatro dígitos 1, 2, 3, 4 tomados 5. De quantas formas diferentes podemos selecionar um comitê de 3 todos de uma vez. pessoas a partir de 20 pessoas? Responda primeiro por palpite. 2. Liste (a) todas as permutações, (b) todas as combinações sem repe- 6. De quantas formas diferentes podemos selecionar um comitê contições e (c) todas as combinações com repetições, de 5 letrasa, e, sistindo em 3 engenheiros, 2 biólogos e 2 químicos a partir de um i, o, u tomadas duas a duas. conjunto de 10 engenheiros, 5 biólogos e 6 químicos? Responda primeiro por palpite. 3. De quantas maneiras podemos destinar 8 atividades a 8 trabalhadores (com um trabalhador para cada atividade e vice-versa)? 7. De um lote de 10 itens, 2 são defeituosos. (a) Encontre o número de diferentes amostras de 4 itens. Encontre o número de amostras de 4 4. Quantas amostras de 4 objetos podemos selecionar de um lote de itens contendo: (b) nenhum defeito, (c) 1 defeito, (d) 2 defeitos. 80 objetos?

188

Parte G • Probabilidade, Estatística

8. Se uma gaiola contém 100 camundongos, dois dos quais são seu automóvel e uma testemunha lembra-se de que a placa machos, qual é a probabilidade de que os dois camundongos começava com KDP5, mas não se recorda dos dois dígitos machos sejam incluídos se se selecionam aleatoriamente 12 restantes, embora tenha certeza de que os três dígitos eram camundongos? todos diferentes? 9. Uma urna contém 2 bolas azuis, 3 verdes e 4 vermelhas. Retiramos 17. PROJETO DE ÁLGEBRA COMPUTACIONAL. Fórmula de aleatoriamente 1 bola e então a descartamos. A seguir, selecionaStirling. (a) Utilizando (7), calcule valores aproximados den! para mos a próxima bola, e assim por diante. Encontre a probabilidade n = 1, , 20. de selecionarmos primeiro 2 bolas azuis, depois 3 bolas verdes e (b) Determine o erro relativo em (a). Encontre uma fórmula empífinalmente as bolas vermelhas. rica para esse erro relativo. 10. No Problema 9, de qual fator a probabilidade diminui se o número (c) Um limite superior para esse erro relativo ée1/12n – 1. Tente de bolas for duplicado (4 azuis etc.)? relacionar a fórmula empírica que você obteve a isso. 11. Determine o número de diferentes mãos no jogo de bridge. (Uma (d) Faça uma pesquisa bibliográfica para obter mais informações mão no bridge consiste em 13 cartas selecionadas de um baralho completo de 52 cartas.) sobre a fórmula de Stirling. Escreva um textoe sobre as informações que obtiver, arranjando-as em pequeno ordem lógica ilustran12. De quantas maneiras diferentes podem 5 pessoas se sentar a uma do-as com exemplos numéricos. mesa redonda? 18. PROJETO DE EQUIPE. Permutações, Combinações. 13. Se 3 suspeitos de terem cometido um roubo e 6 pessoas inocentes (a) Prove o Teorema 2. forem arroladas, qual é a probabilidade de que uma testemunha (b) Prove a última afirmação do Teorema 3. aponte ao acaso os três suspeitos, caso ela não tenha certeza sobre (c) Obtenha (11) a partir de (8). quem cometeu o crime? E qual é a probabilidade de que ela aponte (d) Pelo teorema binomial, ao acaso os três inocentes? n 14. (Problema de aniversário) Qual a probabilidade de que, em um n b)n akbn k, (a grupo de 20 pessoas (que não inclui gêmeos), pelo menos duas k k 0 façam aniversário no mesmo dia, se supusermos que a probabilidade de se fazer aniversário em um dado dia seja de 1/365 para de forma que akbn–k possui o coeficiente nk. Isso pode ser concluído do Teorema 3 ou trata-se de uma mera coincidência? todos os dias. Responda primeiro por palpite. (e) Prove (14) utilizando o teorema binomial. 15. Quantas diferentes placas de automóvel constituídas de 5 símbolos, a saber, 2 letras seguidas de 3 dígitos, poderiam ser feitas? (f) Fazendo uma pesquisa bibliográfica, obtenha fórmulas adicio16. Quantos registros de carro a polícia teria que checar em um nais para os coeficientes binomiais e exemplifique-as numericaacidente em que o motorista que provocou a batida fugiu em mente. •







24.5 Variáveis Aleatórias. Distribuições de Probabilidade

Na Seção 24.1, consideramos as distribuições de freqüência de dados. Essas distribuições mostram a freqüência absoluta ou a relativa dos valores. Similarmente, uma distribuição de probabilidades ou, simplesmente, uma distribuição, mostra as probabilidades de eventos em um experimento. A quantidade que observamos em um experimento será denotada por X e chamada de variável aleatória (ou variável estocástica), porque o valor que ela assumirá na próxima tentativa dependerá do acaso, da aleatoriedade — se você joga um dado, você obterá um dos números de 1 a 6, mas não sabe qual número aparecerá na jogada seguinte. Assim, X = Número que o dado fornece é uma variável aleatória. O mesmo ocorre com X = Elasticidade da borracha (alongação de ruptura). (“Estocástico” significa relacionado ao acaso.) Se fizermos uma contagem (p. ex., de carros em uma estrada, de parafusos defeituosos em uma produção, de lançamentos feitos até um dado mostrar pela primeira vez a face Seis), teremos uma variável e uma distribuição aleatórias discretas. Se fizermos uma medida (p. ex., de tensão elétrica, de índice pluviométrico, de dureza do aço), teremos uma variável e uma distribuição aleatórias contínuas. As definições precisas disso serão dadas a seguir. Em ambos os casos, a distribuição de X é determinada pela função de distribuição (1) F(x)  P(X  x); essa é a probabilidade de que, em uma tentativa, X assuma qualquer valor que não exceda x.

CUIDADO! A terminologia não é uniforme. F(x) é algumas vezes também chamada de função de distribuição cumulativa. Para (1) fazer sentido tanto no caso discreto quanto no contínuo, formulamos as seguintes condições.

189

Capítulo 24: Análise de Dados. Teoria da Probabilidade

DEFINIÇÃO

Variável Aleatória

Uma variável aleatória X é uma função definida no espaço amostral S de um experimento. Seus valores são números reais. Para cada número a, a probabilidade P(X  a)

com a qual X assume a fica definida. De forma similar, para qualquer intervalo I, a probabilidade P(X  I )

com a qual X assume um valor em I fica definida. Embora essa definição seja muito geral, praticamente apenas um número muito pequeno de distribuições ocorrerá repetidamente nas aplicações. De (1), obtemos a fórmula fundamental para a probabilidade correspondente a um intervalo a < x  b,

(2)

P(a  X  b)  F(b)  F(a).

Isso se verifica porque X  a ( “X assume qualquer valor não excedendo a”) e a < X  b ( “X assume qualquer valor no intervalo a< x  b”) são eventos mutuamente excludentes, de forma que, por (1) e pelo Axioma 3 da Definição 2 na Seção 24.3, F(b)  P(X  b)  P(X  a)  P(a  X  b)  F(a)  P(a  X  b)

e a subtração de F(a) em ambos os lados fornece (2).

Variáveis e Distribuições Aleatórias Discretas Por definição, uma variável aleatória X e sua distribuição são discretas se X assume somente um número finito •





x1 x2 x3 ou, no máximo, valores chamados de de X, comPprobabilidades possíveis positivas p1  P(contável X  x1), de p2  P(X  ,x2),, p3 , P(X,  x3), , aovalores passo que a probabilidade (X  I) é nula para qualquer intervalo I contendo algum valor impossível. Obviamente, a distribuição discreta de X é também determinada pela função de probabilidade f(x) de X, definida por •

(3)

ƒ(x)







pj

se x

0

caso contrário

xj

( j  1, 2,





),



Disso e efetuando somas, obtemos os valores da função de distribuição F(x),

(4)

F(x)   xjx

ƒ( xj)   pj xjx

onde, para qualquer x dado, somamos todas as probabilidades pj para as quais xj é menor ou igual à probabilidade de x. Esta é uma função degrau com saltos ascendentes de tamanho pj nos valores possíveis xj de X e com valores constantes nos espaços entre eles. EXEMPLO 1

Função de Probabilidade e Função de Distribuição A Fig. 512 mostra a função de probabilidade f(x) e a função de distribuição F(x) da variável aleatória discreta X = Número que um dado honesto fornece. X tem

os valores possíveis x = 1, 2, 3, 4, 5, 6 com uma probabilidade de ocorrência de 1/6 cada. Nesses valores x, a função de distribuição apresenta saltos ascendentes de magnitude 1/6. Logo, a partir do gráfico de f(x), podemos construir o gráfico de F(x) e vice-versa.  Na Fig. 512 (e na seguinte), a cada salto o ponto cheioindica o valor da função no salto!

190

Parte G • Probabilidade, Estatística f(x) 1

f(x) 1

6

0

5

x

6

0

5

10

12

x

5

10

12

x

F(x)

F(x)

1

1

30 36 20 36

1 2

10 36

0

5

0

x

Fig. 512. Função de probabilidade f(x) e função de distribuição F(x) da variável aleatória X = Número obtido num único

Fig. 513. Função de probabilidade f(x) e função de distribuição F(x) da variável aleatória X = Soma dos dois números obtidos num único lançamento simultâneo de dois dados honestos

lançamento de um dado honesto

EXEMPLO 2

Função de Probabilidade e Função de Distribuição A variável aleatóriaX = Soma dos dois números resultantes no lançamento de dois dados honestos é discreta e tem os valores possíveis 2 (= 1 + 1), 3, 4, , 12 (= 6 + 6). Há 6  6 = 36 resultados igualmente prováveis (1, 1)(1, 2), , (6, 6), onde o primeiro número é o da face do primeiro dado, e o segundo número é o da face do segundo dado. Cada um desses resultados tem uma probabilidade de ocorrência de 1/36. Ora, X = 2 ocorre no caso do resultado (1, 1); X = 3 ocorre no caso de dois resultados (1, 2) e (2, 1); X = 4 ocorre no caso de três resultados (1, 3), (2, 2), (3, 1); e assim por diante. Logo, f(x) = P(X = x) e F(x) = P(X  x) têm os valores •







x

2

3

4

5

ƒ(x) F(x)

1/36 1/36

2/36 3/36

3/36 6/36

4/36 10/36

6

7

8





9

10

11

12

5/36 6/36 5/36 4/36 3/36 2/36 1/36 15/36 21/36 26/36 30/36 33/36 35/36

36/36

A Fig. 513 apresenta um gráfico de barras dessa função e o gráfico da função de distribuição, que é novamente uma função degrau, com saltos (de diferentes alturas!) nos valores possíveis de X. 

Duas fórmulas úteis para as distribuições discretas são prontamente obtidas como se segue. Para a probabilidade correspondente aos intervalos, temos de (2) e (4)

(5)

P(a  X  b)  F(b)  F(a) 

 pj

(X discreto).

axjb

Esta é a soma de todas as probabilidades pj para as quais xj satisfaz a a < x  b. (Cuidado para não confundir < e !) Disso e de P(S) = 1 (Seção 24.3), obtemos a seguinte fórmula.  pj  1

(6)

(soma de todas as probabilidades).

j

EXEMPLO 3

Ilustração da Fórmula (5) No Exemplo 2, calcule a probabilidade de ocorrência de uma soma que seja pelo menos igual a 4 e no máximo igual a 8.

Solução.

EXEMPLO 4

P(3  X  8)  F(8)  F(3) 

26 36



3 36



23 36

.



Problema de Tempo de Espera. Espaço Amostral Infinito Contável No lançamento de uma moeda honesta, consideremos X = Número de tentativas até que a primeira cara apareça. Então, pela independência dos eventos (Seção 24.3), P(X  1)  P(H)



1 2

P(X  2)  P(TH)



1 2



1 2

P(X  3)  P(TTH) 

1 2



1 2

(H  Cara)



1 2



1 4



1 8

(T  Coroa) ,

etc.

Capítulo 24: Análise de Dados. Teoria da Probabilidade

e, em geral, P(X  n)  ( 12 )n, n  1, 2,





191

. Além disso, pode-se confirmar (6) pela fórmula da soma das séries geométricas,



1

1

1

2

4

8





1

1



1

2

_

1 2

1



1.

Variáveis e Distribuições Aleatórias Contínuas As variáveis aleatórias discretas surgem em experimentos nos quaisfazemos contagens (como em defeitos de produção, dias de sol em São Paulo, clientes esperando numa fila etc.). Já as variáveis aleatórias contínuas surgem em experimentos nos quais fazemos medidas (p. ex., comprimentos de parafusos, tensão em uma linha de transmissão, dureza Brinell do aço etc.). Por definição, uma variável aleatória X e sua distribuição sãodo tipo contínuo ou, sucintamente, contínuas, se sua função de distribuiçãoF(x) [definida em (1)], pode ser dada por uma integral

(7)

F(x) 



x



ƒ(v) dv

(escrevemos v porque precisamos de x para indicar o limite superior da integral), cujo integrando f(x), chamado de densidade da distribuição, é não-negativo e contínuo, excetuando-se talvez para um número finito de valores de x. Derivando esta expressão, vemos que a relação entre f e F é

(8)

ƒ(x)  F(x)

para todo x no qual f(x) é contínua. De (2) e (7), obtemos uma fórmula de grande importância, para a probabilidade correspondente a um intervalo:

 ƒ( ) b

(9)

P(a  X  b)  F(b)  F(a) 

v

a

dv.

Esta fórmula é análoga a (5). De (7) e P(S) = 1 (Seção 24.3), também temos a fórmula análoga a (6):



(10)



ƒ(v) dv  1.



As variáveis aleatórias contínuas são mais simples do que as discretas com relação aos intervalos. De fato, no caso contínuo, as quatro probabilidades correspondentes a a < X  b, a < X < b, a  X < b e a  X  b com quaisquer valores de a fixo e de b (> a) são todas iguais. Você pode ver por quê? ( Resposta. Essa probabilidade corresponde à área debaixo da curva de densidade, como na Fig. 514, e seu valor não se altera quando adicionamos ou subtraímos um único ponto no intervalo de integração.) Isso é diferente do caso discreto! (Explique.) O próximo exemplo ilustra as notações e as aplicações típicas destas fórmulas. Curva de densidade f(x) P(a < X ≤ b)

a

b

x

Fig. 514. Exemplo ilustrando a fórmula (9)

EXEMPLO 5

Distribuição Contínua Consideremos que X tenha a função de densidade f(x) = 0,75(1 – x2) se –1  x  1 e zero de outro modo. Encontre a função de distribuição. Encontre as probabilidades P( 12  X  12 ) e P( 14  X  2). Encontre x tal que P(X  x) = 0,95.

Solução. De (7), obtemos F(x) = 0 se x  –1,



x

F(x) 

0,75

(1  v2) dv  0,5  0,75 x  0,25 x3

1

e F(x) = 1 se x > 1. Disso e de (9), obtemos

se 1  x  1,

192

Parte G • Probabilidade, Estatística

P( 12  X 

1 2

)  F( 12 )  F( 12 )  0,75



1/2

(1  v2) dv  68,75%

1/2

(pois P( 12

X

1 2

)  P( 12

X

1 2

) para uma distribuição contínua) e

P(  X  2)  F(2)  F( 14 )  1 4

0,75



1

(1  v2) dv  31,64%.

1/4

(Note que o limite superior de integração é 1, e não 2. Por quê?) Finalmente, P(X  x)  F(x) 

0,5  0,75x  0,25x 3  0,95.

Uma simplificação algébrica fornece 3 x – x3 = 1,8. A solução éx = 0,73, aproximadamente. Esboce f(x) e marque x = – 12 , 12 , 14 e 0,73, de forma que você possa ver os resultados (as probabilidades) como áreas abaixo da curva. Esboce também F(x). 

Outros exemplos de distribuições contínuas são dados nos problemas propostos a seguir e em seções posteriores.

PROBLEMAS PROPOSTOS 24.5 1. Represente graficamente a funçãode probabilidade f(x) = kx2 (x = 1, 2, 3, 4, 5; com k apropriado) e a função de distribuição. 2. Represente graficamente a função dedensidade f(x) = kx2 (0  x  5; com k apropriado) e a função de distribuição. 3. (Distribuição uniforme) Represente graficamentef e F quando a densidade éf(x) = k = const. se –4  x  4 e 0 nos demais casos. 4. No Problema 3, encontre P(0  x  4) e c tais que P(–c < X < c) = 95%. 5. Represente graficamentef e F quando f(–2) = f(2) = 1/8, f(–1) = f(1) = 3/8. É possível quef possua outros valores positivos? 6. Represente graficamente a função de distribuição F(x) = 1 – e–3x se x > 0, F(x) = 0 se x  0, e a densidade f(x). Encontre x tal que F(x) = 0,9. 7. Considere que X seja o número de anos decorridos antes de um determinado tipo de máquina necessitar de substituição. Suponha que X tenha a função de probabilidadef(1) = 0,1, f(2) = 0,2, f(3) = 0,2, f(4) = 0,2, f(5) = 0,3. Represente graficamentef e F. Encontre a probabilidade de que a máquina não necessite de substituição durante os três primeiros anos. 8. Se X tem a função de probabilidadef(x) = k/2x (x = 0, 1, 2, ), quanto valem k e P(X  4)? 9. Encontre a probabilidade de que nenhuma das três luzes de um semáforo deva ser substituída durante as primeiras 1200 horas de operação se a probabilidade de uma luz ser trocada é uma variável aleatória X com densidade f(x) = 6[0,25 – (x – 1,5)2] quando 1  x  2 e f(x) = 0 nos demais casos, ondex é o tempo medido em múltiplos de 1000 horas. 10. Suponha que certos parafusos tenham o comprimento dado porL = 200 + X mm, onde X é uma variável aleatória com densidade f(x) = 34 (1 – x2) se –1  x  1 e 0 nos demais casos. Determinec de forma que haja uma probabilidade de 95% de que um parafuso •





11. Considereque X [milímetros] seja a espessura das arruelas fabricadas por uma máquina. Suponha queX tenha a densidadef(x) = kx se 1,9 < x < 2,1 e 0 nos demais casos. Encontre k. Qual é a probabilidade de que uma arruela tenha uma espessura entre 1,95 mm e 2,05 mm? 12. Suponha que, em umprocesso automático de enchimento de latas de óleo, o conteúdo de uma lata (em galões) sejaY = 50 + X, onde X é uma variável aleatória com densidadef(x) = 1 – x quando x  1 e 0 quando x > 1. Represente graficamentef(x) e F(x). Em um lote de 100 latas, aproximadamente quantas conterão 50 galões ou mais? Qual é a probabilidade de que uma lata contenha menos de 49,5 galões? E menos de 49 galões? 13. Considere que a variável aleatória X de densidade f(x) = ke–x se 0  x  2 e 0 nos demais casos x ( = tempo medido em anos), represente o tempo decorrido até que determinados rolamentos fiquem gastos. Encontre k e a probabilidade de que um rolamento dure pelo menos 1 ano. 14. Considere que X seja a razão entre as vendas e os lucros de uma empresa. Suponha queX tenha a função de distribuiçãoF(x) = 0 se x < 2, F(x) = ( x2 – 4)/5 se 2  x < 3, F(x) = 1 se x  3. Encontre e represente graficamente a densidade. Qual é a probabilidade de que X se situe entre 2,5 (40% de lucro) e 5 (20% de lucro)? 15. Mostre que b < c implica que P(X  b)  P(X  c). 16. Se o diâmetro X de eixos possui a densidadef(x) = k quando 119,9  x  120,1 e 0 nos demais casos, quantos defeitos um lote de 500 eixos conterá aproximadamente se se consideram defeituosos os eixos mais finos que 119,92 ou mais grossos que 120,08? 17. Considere que X seja uma variável aleatória capaz de assumir todos os valores reais. Quais são os complementares dos eventosX  b, X < b, X  c, X > c, b  X  c, b < X  c? 18. Uma caixa contém 4 parafusos dextrogiros e 6 levogiros. Dois parafusos são selecionados aleatoriamente sem reposição. Considere que X seja o número de parafusos levogiros. Encontre as 

tenhatambém um comprimento entre 200 –c e 200 + c. Sugestão: veja o Exemploqualquer 5.

X = 1), probabilidades (X>=1)0),e PP((0,5 = 2), P(1 < X < 2), P(X 1), P(X  1), PP(X < XP 0), qual é a milhagem esperada desse tipo de pneu? Considere u = 0,04 e encontre a probabilidade de 1 que um pneu dure pelo menos 40 000 milhas. (13) g   E([X  m]3). s3 10. Que soma podemos esperar obter ao lançarmos um dado honesto 10 vezes? Faça este experimento. Repita-o 20 vezes e registre Mostre que, para uma distribuição simétrica (cujo terceiro momencomo a soma vai variando. to central existe), a assimetria é zero. 11. Um pequeno posto de combustível é suprido com gasolina todo (e) Encontre a assimetria da distribuição com densidadef(x) = xe–x sábado à tarde. Suponha que seu volumeX de vendas em dezenas quando x > 0 e f(x) = 0 nos demais casos. Esbocef(x). de milhares de galões tenha a densidade de probabilidadef(x) = (f) Calcule a assimetria de algumas simples distribuições discretas 6x(1 – x) se 0  x  1 e 0 nos demais casos. Determine a média, de sua escolha. a variância e a variável padronizada. (g) Encontre uma distribuição discreta assimétrica com 3 valores 12. Qual capacidade deve ter o tanque do Problema 11 para que a probabilidade de ele ficar vazio numa dada semana seja de 5%? possíveis, média 0 e assimetria 0. X

196

Parte G • Probabilidade, Estatística

24.7 Distribuições Binomial, de Poisson e Hipergeométrica

Estas são as três mais importantes distribuições discretas, com inúmeras aplicações.

Distribuição Binomial A distribuição binomial ocorre em jogos de azar (p. ex., no jogo de dados, que será visto a seguir etc.), nas inspeções de qualidade (p. ex., na contagem do número de defeitos), nas pesquisas de opinião (p. ex., na contagem do número de empregados favoráveis a certas alterações de escala etc.), em medicina (p. ex., no registro do número de pacientes curados por uma nova remédio), e assim por diante. As condições de sua ocorrência são as seguintes. Estamos interessados no número de vezes que um evento A ocorre em n tentativas independentes. Em cada tentativa, o evento A tem a mesma probabilidade P(A) = p. Então, em uma tentativa, a probabilidade de A não ocorrer é q = 1 – p. Em n tentativas, a variável aleatória que nos interessa é X = Número de vezes em que um evento A ocorre em n tentativas.

pode assumir os valores 0, 1, , n e desejamos determinar as probabilidades correspondentes. Ora, X = x significa que A ocorre em x tentativas e não ocorre em n – x tentativas. Podemos representar isso do seguinte modo.

X







A

(1)

A







A

B

x vezes

B

n









B.

x vezes

Aqui, B = A é o complementar de A, significando que A não ocorre (Seção 24.2). Suponhamos agora que as tentativas sejam independentes, isto é, que elas não exerçam influência umas sobre as outras. Logo, (1) tem a probabilidade (veja a Seção 24.3 sobre eventos independentes) c

(1*)

pp









p

x vezes

qq n









q

p x qn

x

.

x vezes

Ora, (1) é apenas uma ordem de arranjo de x As e de n – x Bs. Utilizemos agora o Teorema (1b) da Seção 24.4, que fornece o número de permutações de n objetos (os n resultados das n tentativas) consistindo em 2 classes, a classe 1 contendo os n1 = x As e a classe 2 contendo os n – n1 = n – x B s. Esse número é n! x! ( n

x)!

 nx  .

Dessa forma, (1*) multiplicada por esse coeficiente binomial fornece a probabilidade P(X = x) de X = x, isto é, da obtenção de A precisamente x vezes em n tentativas. Logo, X tem a função de probabilidade

(2)

ƒ(x)

 nx  p q

x n

x

(x  0, 1,







, n)

e f(x) = 0 nos demais casos. A distribuição de X com a função de probabilidade (2) é chamada de distribuição binomial ou distribuição de Bernoulli. A ocorrência de A é chamada de sucesso (independentemente do que A venha de fato a representar, podendo, por exemplo, significar que você perdeu seu avião ou seu relógio) e a nãoocorrência de A é chamada de fracasso. A Fig. 516 mostra típicos exemplos. Os valores numéricos podem ser obtidos da Tabela A5 no Apêndice 5 ou de seu programa de computador. A média da distribuição binomial é (veja o Projeto de Equipe 16)

(3)

m  np

e a variância é (veja o Projeto de Equipe 16)

(4)

s2  npq.

197

Capítulo 24: Análise de Dados. Teoria da Probabilidade

0,5

0 0

5

0

p = 0,1

5

0

5

p = 0,2

0

p = 0,5

5

0

p = 0,8

5 p = 0,9

Fig. 516. Função de probabilidade (2) da distribuição binomial para n = 5 e vários valores de p

Para o caso simétrico de chances iguais de sucesso e fracasso ( p = q = 1/2), isso fornece a média n/2, a variância n/4 e a função de probabilidade

(2*) EXEMPLO 1

n

 nx  12

ƒ(x)

(x  0, 1,







, n).

Distribuição Binomial Calcule a probabilidade da ocorrência de pelos menos duas faces “Seis” em 4 lançamentos de um dado honesto.

Solução. p = P(A) = P(“Seis”) = 1/6, q = 5/6, n = 4. O evento Logo, a resposta é

“Pelo menos duas faces ‘Seis’”

ocorre se obtivermos 2 ou 3 ou 4 faces

“Seis”.

P

ƒ(2)

ƒ(3)

22

3

4

              1

4 2

ƒ(4)

6

1 64

5

4 3

6

1 6

171

(6 25 4 5 1 )

1296

5 6

4 4

1 6 

13,2%.

Distribuição deparaPoisson A distribuição discreta um número infinito de valores possíveis e para a função de probabilidade mx

ƒ(x)   em x!

(5)

(x  0, 1,





)



é chamada de distribuição de Poisson, que recebeu esse nome em homenagem a S. D. Poisson (Seção 18.5). A Fig. 517 mostra (5) para alguns valores de m. Pode-se provar que essa distribuição é obtida como um caso limite da distribuição binomial, se fizermos p 0 e n ∞ de forma que a média m = np aproxima-se de um valor finito. (Por exemplo, m = np pode ser mantida constante.) A distribuição de Poisson tem média m e a variância (veja o Projeto de Equipe 16) →



(6)

s2  m.

A Fig. 517 dá a impressão de que, com o aumento da média, a dispersão da distribuição aumenta, ilustrando assim a fórmula (6), e que a distribuição vai se tornando mais e mais simétrica (aproximadamente).

0,5

0

5

µ = 0,5

0

5

µ=1

0

5

µ= 2

0

5

10

µ=5

Fig. 517. Função de probabilidade (5) da distribuição de Poisson para vários valores de m

198

Parte G • Probabilidade, Estatística

EXEMPLO 2

Distribuição de Poisson Se a probabilidade de se produzir um parafuso defeituoso é p = 0,01, qual é a probabilidade de que um lote de 100 parafusos contenha mais que 2 defeituosos?

Solução. O evento complementar é A : não mais que 2 parafusos defeituosos. Para essa probabilidade, obtemos da distribuição binomial com média m = np = 1, o valor [veja (2)] c

P(Ac )



100 0

0,99





100

100

100

0,01 0,99 99

1

0,012 0,9998.

2

Como p é muito pequena, podemos aproximá-la pela distribuição de Poisson, muito mais conveniente, de média m = np = 100 0,01 = 1, obtendo [veja (5)] 

P(Ac )

e

1



1

1

1 2



91,97%.

Portanto, P(A) = 8,03%. Mostre que a distribuição binomial forneceP(A) = 7,94%, de modo que a aproximação de Poisson é bastante boa. 

EXEMPLO 3

Problemas de Estacionamento. Distribuição de Poisson Se, em média, 2 carros entram em um certo pátio de estacionamento por minuto, qual é a probabilidade de que, durante um minuto qualquer dado, 4 ou mais carros entrem no estacionamento?

Solução. Para entender que a distribuição de Poisson é um modelo dessa situação, imaginemos o minuto sendo dividido em um número muito grande de breves intervalos de tempo, consideremos que p é a probabilidade (constante) de que um carro entre no estacionamento durante qualquer um desses breves intervalos, e suponhamos que os eventos ocorrendo durante esses intervalos sejam independentes. Então, estamos lidando com uma distribuição binomial com um n muito grande e um p muito pequeno, uma situação que pode ser aproximada por uma distribuição de Poisson com m  np  2,

visto que, em média, 2 carros entram no estacionamento. O evento complementar do evento “4 carros ou mais durante um dado minuto” é “3 carros ou menos entram no estacionamento” e tem a probabilidade ƒ(0)

ƒ(1)

ƒ(2)

ƒ(3)

e

2



20

21

22

23

0!

1!

2!

3!



0,857.

Resposta: 14,3%. (Por que consideramos esse complementar?)



Amostragem com Reposição Esta expressão quer dizer que retiramos objetos um a um de um dado conjunto e, após cada tentativa, recolocamos o objeto selecionado (isto é, o devolvemos ao conjunto dado e misturamos) antes de selecionarmos o próximo objeto. Isso garante a independência das tentativas e leva à distribuição binomial. Com efeito, se uma caixa contém N objetos, por exemplo, parafusos, M dos quais são defeituosos, a probabilidade de retirarmos um parafuso defeituoso em uma tentativa é p = M/N. Logo, a probabilidade de retirarmos um parafuso não-defeituoso é q = 1 – p = 1 – M/N, e (2) fornece a probabilidade se retirarmos x parafusos defeituosos em n tentativas, na forma x

(7)

ƒ(x)

 nx   MN  1

M N



n

x

(x  0, 1,







, n).

Amostragem sem Reposição. Distribuição Hipergeométrica A amostragem sem reposição significa que não devolvemos nenhum parafuso à caixa. Logo, não mais temos a independência das tentativas (por quê?) e, ao invés de (7), a probabilidade de retirarmos x parafusos defeituosos em n tentativas é

(8)

ƒ(x)

 Mx   Nn  Nn 

M x



(x  0, 1,







, n).

A distribuição com essa função de probabilidade é chamada de distribuição hipergeométrica (porque sua função geradora de momentos (veja o Projeto de Equipe 16) pode ser expressa pela função hipergeométrica definida na Seção 5.4, um fato que não usaremos).

Capítulo 24: Análise de Dados. Teoria da Probabilidade

199

Obtenção de (8). Por (4a) na Seção 24.4, há

 Nn  diferentes maneiras de selecionarmos n objetos de N, M (b)  x  diferentes maneiras de selecionarmos x objetos defeituosos de M, (c)  N M  diferentes maneiras de selecionarmos n – x objetos não-defeituosos de N – M, n x (a)

e cada maneira em (b) combinada com cada maneira em (c) fornece o número total de maneiras mutuamente exclusivas de obtermos x objetos não-defeituosos em n retiradas sem reposição. Como (a) é o número total de resultados e a seleção é aleatória, cada uma dessas maneiras tem a probabilidade de ocorrência de 1 N . Disso, n



decorre (8). A distribuição hipergeométrica tem a média (Projeto de Equipe 16)



M mn N

(9) e a variância

(10) EXEMPLO 4

s2 

nM(N  M)(N  n)  . N (N  1) 2

Amostragem com e sem Reposição Desejamos selecionar aleatoriamente amostras de duas juntas de vedação de uma caixa contendo 10 juntas, três das quais são defeituosas. Encontre a função de probabilidade da variável aleatória X = Número de defeitos na amostra.

Solução. Temos N = 10, M = 3, N – ƒ(x)

M

= 7, n = 2. Quando amostramos com reposição, (7) fornece

    x

3

2 x

10

7 10

2

x

,

ƒ(0)

0,49, ƒ(1)

0,42, ƒ(2)

0,09.

Quando amostramos sem reposição, temos que usar (8), encontrando ƒ(x)

3 x

7

    2

x

10 , 2

ƒ (0)

ƒ(1)

21 0,47, ƒ(2) 45

30,07. 45



Se N, M e N – M são grandes comparados com n, então não importa muito se a amostragem é feita com ou sem reposição e, neste caso, a distribuição hipergeométrica pode ser aproximada pela distribuição binomial (com p = M /N), que é algo mais simples. Logo, na amostragem de uma população indefinidamente grande (“população infinita”), podemos utilizar a distribuição binomial, independentemente de amostrarmos com ou sem reposição.

PROBLEMAS PROPOSTOS 24.7 1. Quatro moedas honestas são lançadas simultaneamente. Encontre 5. Considere que X seja o número de carros passando por minuto em a função de probabilidade da variável aleatóriaX = Número de um certo ponto de uma rodovia entre 8 e 10 h da manhã em um caras e calcule as probabilidades de obtenção de nenhuma cara, domingo. Suponha queX tenha uma distribuição de Poisson com precisamente 1 cara, pelo menos 1 cara, não mais que 3 caras. média 5. Encontre a probabilidade de observarmos 3 ou menos carros durante um dado minuto qualquer. 2. Se a probabilidade de acertarmos um alvo em um único tiro é de 10% e 10 tiros são disparados independentemente, qual é a 6. Suponha que um operador de uma companhia telefônica em média

probabilidade o alvo seja atingido menos uma vez? atenda 300 ligações por hora, que de Utilizando sua mesa seja possível fazer no máximo 10 conexões por eminuto. a distribuição de 3. No Problema 2,deseque a probabilidade de acertopelo fosse de 5% e fizéssePoisson, estime a probabilidade de a capacidade da mesa ficar mos 20 disparos, a probabilidade de acertarmos o alvo pelo menos esgotada durante um dado minuto. (Use a Tabela A6 do Apêndice uma vez será menor, igual ou maior que no Problema 2? Responda 5 ou o seu programa de computador.) primeiro por palpite e depois calcule. 4. Suponha que 3% dos parafusos produzidos por uma máquina apre- 7. (Experimentos de Rutherford–Geiger ) Em 1910, E. Rutherford e H. Geiger demonstraram experimentalmente que o sentem defeitos, e que os parafusos defeituosos ocorram aleatorianúmero de partículas alfa emitidas por segundo em um promente durante a produção. Se os parafusos são acondicionados em cesso radioativo é uma variável aleatória X com uma distri50 por caixa, qual a aproximação de Poissonda probabilidade de que uma dada caixa contenhax = 0, 1, , 5 parafusos defeituosos? buição de Poisson. Se X tem média 0,5 qual é a probabilidade •





200

Parte G • Probabilidade, Estatística

de observarmos duas ou mais partículas durante um segundo A1, , Ak com as probabilidadesp1, , pk, respectivamente, qualquer? onde p1 + + pk = 1. Suponha que n tentativas independentes Um processo de produção de parafusos é verificado a cada hora sejam realizadas. Mostre que a probabilidade de obtermosx1 A1s, inspecionando-se n parafusos selecionados aleatoriamente da , xk Aks é produção ocorrida durante essa hora. Se um ou mais parafusos n! x x apresentam defeito, o processo é interrompido e examinado cuiƒ(x1, , xk)   pk x1! xk! p1 dadosamente. Quão grande deve sern se o fabricante deseja uma , k, e x1 + + xk = n. A distribuição probabilidade de cerca de 95% de que o processo seja interrompido onde 0  xj  n, j = 1, quando 10% dos parafusos produzidos são defeituosos? (Suponha apresentando essa função de probabilidade é chamada dedistribuique a qualidade de um determinado parafuso independa da qualição multinomial. dade dos demais parafusos produzidos.) 16. PROJETO DE EQUIPE. Função Geradora de Momentos. A Suponha que, na produção de resistores de 50, os itens não-defeifunção geradora de momentosG(t) é definida por tuosos são aqueles que possuem uma resistência entre 45 e 55 tX j txj G(t)  E(e )  e ƒ(x j)  e que a probabilidade de que um resistor seja defeituoso seja de j 0,2%. Os resistores são vendidos em lotes de 100, com a garantia de ou que nenhum deles apresenta falhas. Qual é a probabilidade de que  um dado lote viole essa garantia? (Use a distribuição de Poisson.) G(t )  E(etX)  etxƒ(x) dx  Considere que p = 1% seja a probabilidade de que um certo tipo onde X é uma variável aleatória discreta ou contínua, respectivade lâmpada falhe em um teste de 24 h. Encontre a probabilidade mente. de que um letreiro usando 10 dessas lâmpadas fique aceso durante (a) Supondo que seja possível fazer tanto a derivação termo a 24 horas sem que nenhuma lâmpada falhe. termo quanto sob o sinal da integral, mostre queE(Xk) = G(k)(0), Tente imaginar por palpite quão menor a probabilidade obtida no onde G(k) = dkG/dtk e, em particular, que,m = G(0). Problema 10 seria se o letreiro utilizasse 100 lâmpadas. Então calcule. (b) Mostre que a distribuição binomial tem a função geradora de momentos Suponha que um certo tipo de fita magnética contenha, em média, 2 n n defeitos por 100 metros. Qual é a probabilidade de que um rolo de n n G(t) etx p xqn x ( pet)xqn x fita de 300 metros contenha (a)x defeitos, (b) nenhum defeito? x x x 0 x 0 Suponha que, emum teste de percepção extra-sensorial, o indivíq)n. ( pet duo examinado tenha que identificar (em qualquer ordem) 3 cartas selecionadas aleatoriamente de um baralho de 13 cartas. Encontre a (c) Usando (b), prove (3). probabilidade de que, por sorte apenas, uma pessoa nomeie corre(d) Prove (4). tamente: (a) nenhuma carta, (b) 1 carta, (c) 2 cartas, (d) 3 cartas. •









8.















1









9.

10.

11. 12. 13.

k



























14. Uma caixa contém 20 fusíveis, 5 dos quais são defeituosos. Encontre a probabilidade de que, se uma amostra de 3 fusíveis for retirada da caixa aleatoriamente e sem reposição,x fusíveis na amostra sejam defeituosos. 15. (Distribuição multinomial) Suponha que uma tentativa possa resultar em precisamente um dek eventos mutuamente excludentes



de Poisson tem a função geradora de (e) Mostre que a distribuição momentos G(t) = e–memet e prove (6). (f) Prove x

  M x

M



M x



1 . 1

Usando isso, prove (9).

24.8 Distribuição Normal Passando das distribuições discretas para as contínuas, nesta seção discutiremos a distribuição normal. Trata-se da distribuição contínua mais importante, visto que, nas aplicações, muitas variáveis aleatórias são variáveis aleatórias normais (ou seja, possuem uma distribuição normal), ou são aproximadamente normais, ou ainda podem ser transformadas em variáveis aleatórias normais de uma maneira relativamente simples. Além disso, a distribuição normal é uma aproximação útil de distribuições mais complicadas e também surge nas demonstrações de diversos testes estatísticos. A distribuição normal ou distribuição de Gauss é definida como a distribuição com a densidade

(1)

ƒ(x)

1 2



exp

1 2



x

 2

(s  0)

onde exp é a função exponencial com base e = 2,718 . Tudo isso é mais simples do que pode parecer à primeira vista. f(x) tem as seguintes características (veja também a Fig. 518). •





1. m é a média e s o desvio-padrão. 2. 1/(s 2p) é um fator constante que faz com que a área abaixo da curva de f(x) de –∞ a como requer (10) da Seção 24.5.



seja igual a 1,

Capítulo 24: Análise de Dados. Teoria da Probabilidade

201

3. A curva de f(x) é simétrica com relação a x = m, pois o expoente é quadrático. Logo, para m = 0, ela é simétrica com relação ao eixo y ( x = 0) (Fig. 518, “curvas em forma de sino”). 4. A função exponencial em (1) decresce em direção a zero muito rapidamente — tão mais rápido quanto menor for o desvio-padrão s, como deve ser (Fig. 518). f(x) 1,5

σ

= 0,25

1,0 σ

0,5

= 0,5 σ

–2

–1

0

= 1,0

1

x

2

Fig. 518. Densidade (1) da distribuição normal com m = 0 para vários valores de s

Função de Distribuição F(x) De (7) na Seção 24.5 e de (1), vemos que a distribuição normal tem a função de distribuição

(2)

x

1

F(x)

exp

2



1 2



 2

v

dv.

Aqui, precisamos de x para indicar o limite superior de integração, de modo que escrevemos v (ao invés de x) no integrando. Para a distribuição normal padronizada correspondente, com média 0 e desvio-padrão 1, representamos F(x) por (z). Então, simplesmente temos de (2)

(3)

(z) 

1   2 p

z

eu

2

/2



du.

Não é possível usar os métodos de cálculo para realizar essa integração. Mas isso não chega a ser um problema sério, visto que os valores dessa integral podem ser obtidos da Tabela A7 do Apêndice 5 ou usando-se um programa de computador. Esses valores são necessários ao se trabalhar com as distribuições normais. A curva de (z) tem a forma de um S. Ela cresce monotonamente (por quê?) de 0 a 1 e intercepta o eixo vertical em 1/2 (por quê?), como mostra a Fig. 519.

Relação entre F(x) e (z). Embora você possa usar seu programa computacional para encontrar diretamente os valores de F(x) em (2) para quaisquer valores de m e s, é importante compreender por que essa função F(x) pode ser expressa em termos da função padronizada e tabulada (z), como se segue. y Φ(x)

1,0 0,8 0,6 0,4 0,2

–3

–2

–1

0

1

2

3

x

Fig. 519. Função de distribuição (z) da distribuição normal com média 0 e variância 1

202

Parte G • Probabilidade, Estatística

TEOREMA 1

Uso da Tabela Normal A7 do Apêndice 5 A função de distribuição F(x) da distribuição normal com quaisquerm e s [veja (2)] relaciona-se à função de distribuição padronizadaΦ(z) em (3) pela fórmula

(4)

PROVA

x

F(x)



.

Comparando (2) e (3), vemos que o novo limite superior de integração deve ser escrito como u

m  . v

Então

x

v

fornece

u

s

xm  s

Além disso, v – m = su; portanto, dv = s du . Juntando isso, visto que s é eliminado, (x

1

F(x)

)/

e

2

u2/2

du

x

.



Na estatística vista no Capítulo 25, com muita freqüência precisaremos de probabilidades correspondentes a intervalos, que são obtidas como se segue. TEOREMA 2

Probabilidades Normais para Intervalos A probabilidade de que uma variável aleatória normal X com uma média m e um desvio-padrão s assuma qualquer valor no intervalo a< x  b é

(5)

PROVA

P(a

b)

X

F(b)

F(a)

b 

a

.

A fórmula (2) na Seção 24.5 fornece a primeira igual dade em (5), e (4) desta seção fornece a segunda igua ldade.

Valores Numéricos Nos trabalhos práticos com a distribuição normal, é bom lembrar que cerca de 2/3 de todos os valores de X a serem observados estão situados entre m  s, que cerca de 95% deles situam-se entre m  2s, e que praticamente todos se encontram entre os limites de três-sigmas m  3 s. Mais precisamente, pela Tabela A7 do Apêndice 5,

 68%  95,5% P(m  3 s  X  m  3 s)  99,7%.

(a) (b) (c)

(6)

P(m  s  X  m  s)

P(m  2 s  X  m  2 s)

As fórmulas (6a) e (6b) são ilustradas na Fig. 520. As fórmulas em (6) mostram que um valor afastando-se de m por mais do que s, 2 s ou 3s ocorrerá em uma de cerca de 3, 20 e 300 tentativas, respectivamente. 95,5%

68%

16%

16%

µ− -- σ

µ

µ+σ

2,25%

µ− -- 2σ

(a)

2,25%

µ

µ + 2σ

(b)

Fig. 520. Ilustração da fórmula (6)

Em testes (Capítulo 25), inversamente procuraremos os intervalos correspondentes a certas probabilidades dadas; na prática, as probabilidades mais importantes são as de 95%, 99% e 99,9%. Para elas, a Tabela A8 do Apêndice 5 fornece as respostas m  2 s, m  2,5 s e m  3,3 s respectivamente. De forma mais precisa,

Capítulo 24: Análise de Dados. Teoria da Probabilidade

(7)

(a)

P(m 

1,96s  X  m  1,96s)  95%

(b)

P(m 

2,58s  X  m  2,58s)  99%

(c)

P(m 

3,29s  X  m  3,29s)  99,9%.

203

Trabalhando com as Tabelas Normais A7 e A8 do Apêndice 5 As Tabelas A7 e A8 do Apêndice 5 fornecem duas tabelas normais. Se você deseja trabalhar com probabilidades, utilize a Tabela A7. Se as probabilidades são dadas e você deseja encontrar os correspondentes intervalos ou valores de x, use a Tabela A8. Os exemplos dados a seguir são típicos. Faça-os com cuidado, verificando todos os valores, evitando considerá-los comoparecem exercícios monótonos a serem feitos pelo computador. Esboce as funções de densidade para ver se os resultados razoáveis. EXEMPLO 1

Lendo os Valores da Tabela A7 Se X é normal padronizada (de modo que m = 0, s = 1), então P(X 

2,44)  0,9927  99 14 %

P(X  1,16)  1   (1,16)  1  P(X  1)  1  P(X  1)  1  P(1,0  X 

EXEMPLO 2

0,8770  0,1230  12,3%

0,8413  0,1587 por (7), Seção 24.3

1,8)  (1,8)  (1,0)  0,9641  0,8413  0,1228.



Probabilidades para Intervalos Dados, Tabela A7 Considere que X seja normal com média 0,8 e variância 4 (de modo que s = 2). Então, por (4) e (5) 2,44)

P(X



F(2,44)

2,44

0,80 2



(0,82)

0,7939

80%

ou, se você quiser melhorá-la (de modo similar ao que ocorre nos outros casos) P(X

2,44)

P(X

1)

1

2,44

0,80

2 P(X 1)

X 1,8)

P(1,0

EXEMPLO 3

0,80

X

P

2



1

(0,5)

1

 

0,8

1

2

(0,1)

0, 82)

P(Z

0,6915

0,7939

0,5398

0,4602

0,5398

0,1517.



Valores Desconhecidos c para Probabilidades Dadas, Tabela A8 Considere que X seja normal com média 5 e variância 0,04 (logo, com um desvio-padrão de 0,2). Encontre c ou k correspondente à probabilidade dada P(X

c) 95%,

P(5

k

P(X

EXEMPLO 4

c)

X

 5

1%,

5

c 0,2

k) 9 0%, assim P(X



c

95%, 5

0,2 k

5,329

5,329

c

(como antes; por que?) 5

c

99%,

c)

5 1,645,

2,326,

0,2

c

5,465.



Defeitos Em uma produção de hastes de aço, considere que seu diâmetro X tenha uma distribuição normal com uma média de 2 polegadas e um desvio-padrão de 0,008 polegada.

(a) Que percentual de defeitos podemos esperar se determinarmos que os limites de tolerância são 2 (b) Que limites de tolerância devemos escolher para que haja 4% de defeitos?



Solução. (a) 1 14 % porque, de (5) e da Tabela A7, obtemos para o evento complementar a probabilidade P(1,98

X

2,02)



2,02

(2,5) 0,9938 0,9876 983_4%.

2,00

0,008



( 2,5) (1

0,9938)



1,98

2,00

0,008



0,02 polegadas?

204

Parte G • Probabilidade, Estatística

(b) 2  0,0164, pois, para o evento complementar, temos 0,96  P(2  c  X  2

 c)

ou 0,98  P(X  2

 c)

de modo que a Tabela A8 fornece 0,98



2

2

c 0,008

2



,

2

c

2,054,

0,008

c



0,0164.

Aproximação Normal da Distribuição Binomial A função de probabilidade da distribuição binomial é (Seção 24.7) (8)

 nx  p q

x n

ƒ(x)

(x  0, 1,

x







, n).

Se n é grande, os coeficientes binomiais e as potências tornam-se muito inconvenientes. É de grande importância prática (e teórica) que, em casos assim, a distribuição normal forneça uma boa aproximação para a distribuição binomial. Isto ocorre graças ao teorema a seguir, um dos mais importantes de toda a teoria da probabilidade. TEOREMA 3

Teorema do Limite de De Moivre e Laplace Para n grande,

ƒ(x)  ƒ *(x)

(9) Aqui, f é dada por

(x  0, 1,







, n).

(8). A função 1

(10)

ƒ*(x)

x

z2/2

npq e

2

,

z

np npq

é a densidade da distribuição normal com médiam = np e variância s2 = npq (a média e a variância da distribuição binomial). O símbolo ~ (lê-se assintoticamente igual) significa que a razão entre ambos os lados aproxima-se de 1 à medida que n se aproxima de ∞. Além disso, para quaisquer inteiros não-negativos a e b (> a) b

P(a

X

(11)

x

a

np npq

 nx  p q

x n

b) a

0,5

,

x

b

()

( ),

np

0,5

npq

.

Pode-se encontrar a prova desse teorema na Ref. [G3] do Apêndice 1. A prova mostra que o termo 0,5 em b e a é a correção causada pela mudança que se faz de uma distribuição discreta para uma distribuição contínua.

PROBLEMAS PROPOSTOS 24.8 4. Considere que X seja normal com média 4,2 e variância 0,04. DISTRIBUIÇÃO NORMAL Determine c de modo que P(X  c) = 50%, P(X > c) = 10%, P(–c 1. Considere que X seja normal com média 80 e variância 9. Encontre < X – 4,2  c) = 99% P(X > 83), P(X < 81), P(X < 80) e P(78 < X < 82). 2. Considere que X seja normal com média 120 e variância 16. Encon- 5. Se o tempo de vida X de um certo tipo de bateria de automóvel é normalmente distribuído com uma média de 4 anos e um destre P(X  126), P(X > 116), P(125 < X < 130). vio-padrão de 1 ano, e o fabricante deseja garantir a bateria por 3 3. Considere que X seja normal com média 14 e variância 4. Determianos, que percentual de baterias ele terá que substituir durante a ne c de modo que P(X  c) = 95%, P(X  c) = 5%, P(X  c) = garantia? 99,5%.

1–13

Capítulo 24: Análise de Dados. Teoria da Probabilidade

205

6. Se, no Problema 5, odesvio-padrão fosse menor, o percentual seria normal com uma média de 1000 horas e um desvio-padrão de 100 maior ou menor? horas, qual deve ser o valor orçado para o próximo mês do tempo t de faltas por motivo de doença, de modo que a probabilidade de 7. Um fabricante sabe porexperiência que aresistência dos resistores ele ser excedido seja de somente 20%? por ele produzidos é normal com médiam = 150  e desvio-padrão s= 5 . Qual é então a porcentagem de resistores com resistência 14. PROJETO DE EQUIPE. Distribuição Normal. (a) Obtenha as entre 148  e 152 ? E entre 140  e 160 ? fórmulas em (6) e (7) a partir da tabela normal apropriada. 8. A tensão de ruptura X [kgf] de um certo tipo de bloco plástico é (b) Mostre que (–z) = 1 – (z). Dê um exemplo. distribuída normalmente com uma média de 1250 kgf e um desvio(c) Encontre os pontos de inflexão da curva de (1). padrão de 55 kgf. Qual é a carga máxima capaz de fazer com que (d) Considerando2(∞) e introduzindo coordenadas polares na inteseja de 5% o percentual esperado de blocos que se rompam? gral dupla (um truque-padrão que vale a pena lembrar), prove 9. Um fabricante produz envelopes decorreio aéreo cujo pesopossui  1 uma distribuição normal com médiam = 1,950 grama e desvio(12) ()   eu /2 du  1.  padrão s = 0,025 grama. Os envelopes são vendidos em lotes de 2p   1000. Quantos envelopes em um lote terão um peso superior a 2 (e) Mostre que s em (1) é, de fato, o desvio-padrão da distribuição gramas? normal. [Use (12).] 10. Se a resistência X de certos cabos de uma rede elétrica é normal (f) Lei de Bernoulli dos grandes números. Em um experimento, com uma média de 0,01  e um desvio-padrão de 0,001, em considere que um eventoA tenha a probabilidade de ocorrênciap 1000 cabos, quantos satisfarão às especificações segundo as quais (0 < p < 1), e considere queX seja o número de vezes em queA o valor da resistência deve se situar entre 0,009 e 0,011? ocorre em n tentativas independentes. Mostre que, para um dado 11. Nos exames SAT* para ingresso no ensino superior,se os resultae > 0, dos de matemática são normais com uma média de 480 pontos e X um desvio-padrão de 100 pontos (estes são aproximadamente os P p →1 como n → . n valores de anos recentes) e se algumas instituições requerem um mínimo de 500 pontos de seus candidatos à admissão, qual é o (g) Transformação. Se X é normal com média m e variância s2, percentual de estudantes que não atingirão essa pontuação? mostre que X* = c1X + c2 (c1 > 0) é normal com médiam* = c1m + c2 e variância s*2 = c12s2. 12. Em uma certa fábrica, os custosmensais X de manutenção e reparo das máquinas têm uma distribuição normal com uma média de 15. PROJETO ESCRITO. Uso das Tabelas.Faça uma discussão $12 000 e um desvio-padrão de $2000, qual é a probabilidade de sistemática do uso das Tabelas A7 e A8 para a obtenção deP(X que os custos de reparo para o próximo mês excedam o montante < b), P(X > a), P(a < X < b), P(X < c) = k e P(X > c) = k, bem orçado de $15 000? como P(m – c < X < m + c) = k; inclua exemplos simples. Se você dispuser de um programa de computador, descreva até que ponto 13. Se os tempos mensais X de faltas por motivo de doença dos trabalhadores de uma companhia tiveremgrosso modo uma distribuição isso torna supérfluo o uso das tabelas; dê exemplos.





2



24.9 Distribuições de Várias Variáveis Aleatórias As distribuições de duas ou mais variáveis aleatórias são de interesse por duas razões:

1. Elas ocorrem em experimentos onde se observam diversas variáveis aleatórias, como, por exemplo, o conteúdo de carbono X e a dureza Y do aço, a quantidade de fertilizante X e a produção de milho Y, a altura X1, o peso X2 e a pressão sangüínea X3 de pessoas, e assim por diante. 2. Elas serão necessárias na justificativa matemática dos métodos de estatística do Capítulo 25. Nesta seção, consideraremos duas variáveis aleatórias X e Y ou, como também dizemos, uma variável aleatória bidimensional (X, Y). Para (X, Y), o resultado de uma tentativa é um par de números X = x, Y = y, ou, sucintamente, (X, Y) = (x, y), que podemos plotar como um ponto no plano XY. A distribuição de probabilidade bidimensional da variável aleatória (X, Y) é dada pela função de distribuição F(x, y)  P(X  x, Y  y). (1) Esta é a probabilidade de que, em uma tentativa, X assumirá um valor não maior do que x e, na mesma tentativa, Y assumirá um valor não maior do que y. Isso corresponde à região cinza da Fig. 521, estendendo-se a – ∞ para a esquerda e para baixo. F(x, y) determina unicamente a distribuição de probabilidade, devido à sua analogia

*O SAT (Scholastic Aptitude Test) é um teste aplicado aos estudantes do último ano do ensino médio norte-americano e que pretendem ingressar na universidade. (N.T.)

206

Parte G • Probabilidade, Estatística

com a fórmula (2) da Seção 24.5, isto é, P(a  X Problema 14)

 b)  F(b)  F(a),

agora temos para o retângulo (veja o

(x, y)

Y

X

Fig. 521. Fórmula (1)

(2) P(a1  X  b1, a2  Y  b2)  F(b1, b2)  F(a1, b2)  F(b1, a2)  F(a1, a2). Como antes, no caso bidimensional também teremos variáveis e distribuições aleatórias discretas e contínuas.

Distribuições Bidimensionais Discretas Em analogia com o caso de uma única variável aleatória (Seção 24.5), dizemos que ( X, Y) e sua distribuição são discretas se (X, Y) puder assumir somente um número finito ou, no máximo, infinitamente contábil de pares de valores (x1, y1), ( x2, y2), com probabilidades positivas, ao passo que a probabilidade para qualquer domínio não contendo nenhum desses valores de (X, Y) é zero. Consideremos que (xi, yj) seja qualquer um desses pares e que P(X = xi, Y = y j) = pij (onde admitimos que pij possa ser 0 para certos pares de subíndices i, j). Então, definimos a função de probabilidade f(x, y) de (X, Y) por •

(3)





ƒ(x, y)  pij se x  xi, y  yj

aqui, i = 1, 2, e j = 1, 2, função de distribuição a fórmula •











e

ƒ(x, y) 0 caso contrário;

independentemente. Em analogia a (4) da Seção 24.5, agora temos para a F(x, y)    ƒ( xi, yj).

(4)

xix yjy

Em vez de (6) da Seção 24.5, agora temos a condição (5) ƒ( xi, yj)  1. i

EXEMPLO 1

j

Distribuição Bidimensional Discreta Se simultaneamente lançarmos uma moeda de dez e uma de cinco centavos e considerarmos X

= Número de caras fornecido pela moeda de dez,

Y = Número de caras fornecido pela moeda de cinco,

Então X e Y podem ter os valores 0 ou 1, e a função de probabilidade é ƒ(0, 0)



ƒ(1, 0)  ƒ(0, 1)  ƒ(1, 1)  14 , ƒ(x, y)  0, nos demais casos.



Y b2

a2 a1

b1

X

Fig. 522. Noção de uma distribuição bidimensional

Distribuições Bidimensionais Contínuas Em analogia com o caso de uma única variável aleatória (Seção 24.5) diremos que (X, Y) e sua distribuição são contínuas se a função de distribuição correspondente F(x, y) pode ser dada pela integral dupla

(6)

F(x, y) 

  y

x





ƒ(x *, y *) dx * dy *

207

Capítulo 24: Análise de Dados. Teoria da Probabilidade

cujo integrando f, chamado de densidade de (X, Y), é não-negativo em todo lugar, e é contínuo, possivelmente exceto para um número finito de curvas. De (6), obtemos que a probabilidade de ( X, Y) assumir qualquer valor em um retângulo (Fig. 522) é dada pela fórmula

 b2

(7)

P(a1  X  b1,

a2  Y  b2) 

a2

EXEMPLO 2

b1

ƒ(x, y) dx dy.

a1

Distribuição Bidimensional Uniforme em um Retângulo Consideremos que R seja o retângulo a1 < x  b1, a2 < y  b2. A densidade (veja a Fig. 523) (8)

ƒ(x, y)  1/ k se ( x, y) está em R,

ƒ(x, y)  0 caso contrário

define a chamada distribuição uniforme no retângulo R; aqui, k  ( b1  a1)(b2  a2) é a área de R. A função de distribuição é mostrada na Fig. 524. 

1

y y

β2 β

x

β2

x

β

1

α1

α2

α1

α2

0

1

0

Fig. 523. Função de densidade (8) da distribuição uniforme

Fig. 524. Função de distribuição da distribuição uniforme definida por (8)

Distribuições Marginais de uma Distribuição Discreta Esta é uma idéia um tanto natural, que não possui contraparte para o caso de uma única variável aleatória. Ela trata somente de uma das duas variáveis de (X, Y), digamos, de X, e de sua distribuição, chamada de distribuição marginal de X em (X, Y). Dessa forma, desejamos conhecer a probabilidade P(X = x, Y arbitrário). Como (X, Y) é discreta, o mesmo ocorre com X. Obtemos sua função de probabilidade, que chamaremos de f1(x), a partir da função de probabilidade f(x, y) de (X, Y), fazendo a soma em y: ƒ1(x)  P(X  x, Y arbitrário)  ƒ( x, y)

(9)

y

onde somamos todos os valores de f(x, y) que não são nulos para esse x. De (9), vemos que a função de distribuição da distribuição marginal de X é

(10)

F1(x)  P(X  x, Y arbitrário)   ƒ 1(x *). x*x

Similarmente, a função de probabilidade ƒ2 ( y)  P(X arbitrário, Y  y)  ƒ( x, y)

(11)

x

determina a distribuição marginal de Y em (X, Y). Aqui, somamos todos os valores de f(x, y) que não sejam nulos para o y correspondente. A função de distribuição dessa distribuição marginal é (12) F2( y)  P(X arbitrário, Y  y)   ƒ 2(y *). y *y

EXEMPLO 3

Distribuições Marginais de uma Variável Aleatória Bidimensional Discreta Ao retirarmos 3 cartas com reposição de um baralho de bridge, consideremos (X, Y),

X = Número de damas,

Y = Número de reis ou ases.

O baralho possui 52 cartas, que incluem 4 damas, 4 reis e 4 ases. Logo, em uma única tentativa, uma dama tem uma probabilidade de 4/52 = 1/13 de ser escolhida, e uma carta que seja um rei ou um ás tem uma probabilidade de 8/52 = 2/13 de ser escolhida. Isso fornece a função de probabilidade de (X, Y),

208

Parte G • Probabilidade, Estatística

3!

ƒ(x, y)

x! y! (3

x

1

x

y

2

10

    13

y)!

13

3

x

y

(x  y  3)

13

e f(x, y) = 0 nos demais casos. A Tabela 24.1 mostra no centro os valores de f(x, y) e nas margens direita e inferior os valores das funções de probabilidade f1(x) e f2(y) das distribuições marginais de X e de Y, respectivamente. 

Tabela 24.1 Valores das Funções de Probabilidade f(x, y), f1(x), f2(y) na Retirada de Três Cartas com Reposição de um Baralho de Bridge, onde X É o Número de Damas Retiradas e Y É o Número de Reis ou Ases Retirados x

y

0 1 2 3 ƒ2( y)

0

_

1

1000 2197

_ _ _

300 2197

30 2197 1 2197

1331 2197

2

_ _

3

ƒ

(x)

1

_

_

0

6 2197

_ _0

0

0

0

_ _

600 2197 120 2197

_

726 2197

120 2197

8 2197

12 2197

1728 2197 432 2197 36 2197

0

_

1 2197

_

132 2197

8 2197

Distribuições Marginais de uma Distribuição Contínua Conceitualmente este assunto é o mesmo que para as distribuições discretas, com as funções de probabilidade e os somatórios sendo substituídos por densidades e integrais. Para uma variável aleatória contínua (X, Y) com densidade f(x, y), agora temos a distribuição marginal de X em (X, Y), definida pela função de distribuição

(13)

F1(x)  P(X  x,   Y  ) 



x

ƒ1(x *) dx *



com a densidade f1 de X obtida de f(x, y) pela integração em y, 

(14)

ƒ

(x) 

ƒ( , ) .  , obtemos a distribuição marginalde em ( , ) com a função de distribuição ( ) ( , )  ƒ ( *) * 1



x y dy

Trocando as posições deX e Y

Y

X Y

y

(15)

F2 y  P   X   Y  y 

2

y

dy



e a densidade 

(16)

ƒ2( y) 





ƒ(x, y) dx.

Independência de Variáveis Aleatórias Em uma variável aleatória (discreta ou contínua) ( X, Y), dizemos que X e Y são independentes se

(17)

F(x, y)  F1(x)F2( y)

y). De se verifica são parasugeridas todo (x,pelas outro modo, dizemos que essas variáveis aleatórias são dependentes . Essas definições definições correspondentes para eventos, que vimos na Seção 24.3. A condição necessária e suficiente para a independência é

(18)

ƒ(x, y)  ƒ 1(x)ƒ2( y)

para todo x e y. Aqui, as f s são as funções de probabilidade acima se ( X, Y) for discreta ou as densidades se ( X, Y) for contínua. (Veja o Problema 20.)

Capítulo 24: Análise de Dados. Teoria da Probabilidade

EXEMPLO 4

209

Independência e Dependência No lançamento de uma moeda de dez e de uma de cinco centavos, X = Número de caras na moeda de dez , Y = Número de caras na moeda de cinco podem assumir os valores 0 ou 1 e são independentes. As variáveis aleatórias na Tabela 24.1 são dependentes. 

Extensão da Independência a Variáveis Aleatórias n-Dimensionais. Precisaremos disso ao longo de todo o Capítulo 25. A distribuição dessa variável aleatória X = (X1, , Xn) é determinada por uma função de distribuição da forma •

F(x1,



Dizemos que as variáveis aleatórias X1,

(19) para todo (x1,

F(x1, •















, xn)  P(X1  x1,









, Xn  xn).

, Xn são independentes se









, xn)  F1(x1)F2(x2)







Fn(xn)

, xn). Aqui, Fj(xj) é a função de distribuição da distribuição marginal de XJ em X, isto é, Fj (xj)  P(Xj  xj, Xk arbitrário, k  1, , n, k  j ). •





De outro modo, dizemos que essas variáveis aleatórias são dependentes.

Funções de Variáveis Aleatórias Quando n = 2, escrevemos X1 = X, X2 = Y, x1 = x, x2 = y. Tomando uma função contínua não-constante g(x, y) definida para todo x, y, obtemos uma variável aleatória Z = g(X, Y). Por exemplo, se lançarmos dois dados e X e Y forem os números que os dados fornecerem em uma tentativa, então Z = X + Y será a soma desses dois números (veja a Fig. 513 na Seção 24.5). No caso de uma variável aleatória discreta ( X, Y), podemos obter a função de probabilidade f(z) de Z = g(X, Y) pelo somatório de todos as f(x, y) para as quais g(x, y) é igual ao valor de z considerado; portanto,

(20)

ƒ(z)  P(Z  z)    ƒ(x, y). g(x,y)z

Logo, a função de distribuição de Z é F(z)  P(Z  z)  g x y) (21) (x,y) z ƒ( , onde somamos todos os valores de f(x, y) para os quais g(x, y)  z. No caso de uma variável aleatória contínua ( X, Y), similarmente temos

(22)

F(z)  P(Z  z) 

  ƒ( ,

x y) dx dy

g(x,y)z

onde para cada z integramos a densidade f(x, y) de (X, Y) sobre a região g(x, y)  z no plano xy, com a curva de contorno dessa região sendo g(x, y) = z.

Adição de Médias O número

(23)

E(g(X, Y ))



x

g(x, y)ƒ(x, y )

[(X, Y ) discreto]

g(x, y )ƒ(x, y) dx dy

[(X, Y ) contínuo]

y

é chamado de expectativa matemática ou sucintamente de expectativa de g(X, Y). Aqui se supõe que a série dupla converge absolutamente e que a integral de g(x, y)f(x, y) sobre o plano xy existe (é finita). Como o somatório e a integração são processos lineares, temos de (23) que (24)

E(ag(X, Y )  bh(X, Y ))  aE(g(X, Y ))  bE(h(X, Y )).

Um importante caso especial é E(X  Y )  E(X )  E(Y ),

e, por indução, temos o seguinte resultado:

210

Parte G • Probabilidade, Estatística

TEOREMA 1

Adição de Médias A média (expectativa) de uma soma de variáveis aleatórias é igual à soma das médias(expectativas), ou seja,

(25)

E(X1  X2 







 Xn)  E(X1)  E(X2) 







 E(Xn).

Além disso, prontamente obtemos

TEOREMA 2

Multiplicação de Médias

A média (expectativa) do produto de variáveis aleatóriasindependentes é igual ao produto das médias (expectativas), ou seja,

(26) PROVA

E(X1X2







Xn)  E(X1)E(X2)







E(Xn).

Se X e Y são variáveis aleatórias independentes (ambas discretas ou ambas contínuas), então E(XY) = E(X)E(Y). De fato, no caso discreto, temos E(XY )    xy ƒ(x, y)   xƒ1(x)  yƒ2( y)  E(X )E(Y ), x

y

x

y

e no caso contínuo a prova da relação é similar. A extensão para n variáveis aleatórias independentes fornece (26) e o Teorema 2 fica provado. 

Adição de Variâncias Este é outro assunto de importância prática de que necessitaremos. Como antes, consideremos Z = X + Y e representemos a média e a variância de Z por m e s2. Então, primeiramente temos (veja o Projeto de Equipe 16(a) em Problemas Propostos 24.6) s2  E([Z  m]2)  E(Z 2)  [ E(Z )]2. De (24), vemos que o primeiro termo no lado direito é igual a E(Z 2)  E(X 2  2 XY  Y 2)  E(X 2)  2 E(XY )  E(Y 2).

Para o segundo termo à direita, obtemos do Teorema 1 [E(Z )]2  [ E(X )  E(Y )]2  [ E(X )]2  2 E(X )E(Y )  [ E(Y )]2. Substituindo essas expressões na fórmula para s2, temos s2  E(X 2)  [ E(X )]2  E(Y 2)  [ E(Y )]2 

2[ E(XY )  E(X )E(Y )].

Do Projeto de Equipe 16 na Seção 24.6, vemos que a expressão na primeira linha à direita é a soma das variâncias de X e de Y, que representamos por s12 e s22, respectivamente. A quantidade na segunda linha (excetuando pelo fator 2) é 



sXY E(XY ) E(X )E(Y ) (27) e é chamada de covariância de X e Y. Conseqüentemente, nosso resultado é

(28)

s2  s12  s22  2 sXY.

Se X e Y são independentes, então E(XY )  E(X )E(Y );

logo, sXY = 0, e

Capítulo 24: Análise de Dados. Teoria da Probabilidade

(29)

211

s2  s12  s22.

A extensão para mais de duas variáveis fornece o fundamental TEOREMA 3

Adição de Variâncias A variância da soma de variáveis aleatórias independentes é igual à soma das variâncias dessas variáveis.

CUIDADO! Nas inúmeras aplicações dos Teoremas 1 e 3, precisamos sempre nos lembrar de que o Teorema 3 vale somente para variáveis independentes. Este éespeciais o fim dodiscutidas Capítulo neste 24 sobre a teoria da probabilidade. A maior parte dos métodosque e distribuições capítulo desempenhará um papel fundamental no conceitos, próximo capítulo, trata dos métodos de inferência estatística, ou seja, conclusões tiradas de amostras de populações, cujas propriedades desconhecidas desejamos tentar descobrir e conhecer, por meio da observação de propriedades adequadas de amostras por nós obtidas.

PROBLEMAS PROPOSTOS 24.9 1. Considere f(x, y) = k quando 8  x  12 e 0  y  2 e zero nos se 0  x  1, 0  y  1 e f(x, y) = 0 e g(x, y) = 0 nos demais demais casos. Encontrek. Encontre P(X  11, 1  Y  1,5) e P(9 casos, têm a mesma distribuição marginal.  X  13, Y  1). 12. Considere que X [cm] e Y [cm] serem o diâmetro de um pino 2. Encontre P(X > 2, Y > 2) e P(X  1, Y  1) se (X, Y) tem a dene de uma cavidade, respectivamente. Suponha que X(, Y) tem a sidade f(x, y) = 1/8 se x  0, y  0, x + y  4. densidade 3. Considere f(x, y) = k se x > 0, y > 0, x + y < 3 e 0 nos demais ƒ(x, y) 2500  se casos. Encontre k. Esboce f(x, y). Encontre P(X + Y  1), P(Y 0,99  x  1,01, 1,00  y  1,02 > X). e 0 nos demais casos. (a) Encontre as distribuições marginais. (b) 4. Encontre a densidade da distribuição marginal Xdeno Problema 2. Qual é a probabilidade de que um pino escolhido aleatoriamente Encontre densidade da distribuição marginal deY médio na Fig.de523. se encaixe numa cavidade cujo diâmetro é de 1,00? 5. Se 6. certas afolhas de papel de embrulho têm peso 10 g cada, com um desvio-padrão de 0,05 g, qual é a média e o desvio- 13. Um artefato eletrônico consiste em dois componentes. Considere que X e Y [em meses] sejam o tempo corrido até respectivamente padrão do peso de um pacote de 10 000 folhas? o primeiro e o segundo componentes falharem. Suponha queX(,Y) 7. Qual é a espessura média e o desvio-padrão de núcleos de transfortenha a densidade de probabilidade madores, cada um consistindo em 50 camadas de folhas metálicas ƒ(x, y)  0,01e0,1(xy) se x  0 e y  0 e de 49 folhas de papel isolante, se as folhas metálicas têm uma espessura média de 0,5 mm cada, com um desvio-padrão de 0,05 e 0 nos demais casos. (a) São X e Y dependentes ou independentes? mm, e as folhas de papel têm uma média de 0,05 mm cada com (b) Encontre as densidades das distribuições marginais. (c) Qual um desvio-padrão de 0,02 mm? é a probabilidade de que o primeiro componente tenha um tempo 8. Se o peso de certos contêineres (vazios) têm uma média de 2 lb de vida de 10 meses ou mais? e um desvio-padrão de 0,1 lb, e se o enchimento dos contêineres 14. Prove (2). tem um peso médio de 75 lb e um desvio-padrão de 0,8 lb, qual 15. Encontre P(X > Y) quando (X, Y) tem a densidade será o peso médio e o desvio-padrão dos contêineres cheios? ƒ(x, y)  0,25e0,5( xy) se x  0, y  0 9. Uma montagem de 5 engrenagens é feita com espaçadores entre as engrenagens. A espessura média das engrenagens é de 5,020 e 0 nos demais casos. cm, com um desvio-padrão de 0,003 cm. A espessura média dos espaçadores é de 0,040 cm com um desvio-padrão de 0,002 cm. 16. Considere que (X, Y) tenha a densidade Encontre a média e o desvio-padrão das unidades montadas, cada ƒ(x, y)  k se x 2  y 2  1 qual consistindo em 5 engrenagens selecionadas aleatoriamente e de 4 espaçadores também selecionados aleatoriamente. e 0 nos demais casos. Determine k. Encontre as densidades das distribuições marginais. Encontre a probabilidade 10. Dê um exemplo de duas diferentes distribuições discretas que possuem as mesmas distribuições marginais. P(X 2  Y 2  1/4). 11. Mostre que as variáveis aleatórias com as densidades 17. Considere que ( X, Y) tenha a função de probabilidade ƒ(x, y)  x  y ƒ(0, 0)  ƒ(1, 1)  1/8, e ƒ(0, 1)  ƒ(1, 0)  3/8. g(x, y)  ( x  12 )( y  12 ) São X e Y independentes?

212

Parte G • Probabilidade, Estatística

18. Usando o Teorema 1, obtenha a fórmula para a média da distribui- 19. Usando os Teoremas 1 e 3, obtenha as fórmulas para a média e ção hipergeométrica. Você poderia utilizar o Teorema 3 para obter para a variância da distribuição binomial. a variância dessa distribuição? 20. Prove a afirmação envolvendo (18).

QUESTÕES E PROBLEMAS DE REVISÃO DO 1. Por que iniciamos o capítulo com uma seção sobre manipulação 23. de dados? 2. O que são ramos-e-folhas? Diagramas de caixa? Histogramas? 24. Compare suas vantagens. 3. Que quantidades medem o tamanho médio dos dados? E a disper- 25. são? 4. O que nos leva a considerar a teoria da probabilidade? Qual é o 26. seu papel na estatística? 5. O que entendemos por um experimento? Por uma variável aleatória 27. relacionada a ele? O que são resultados? Eventos? 6. Dê exemplos de experimentos nos quais os casos são igualmente prováveis e outros nos quais eles não o são. 28. 7. Enuncie de memória a definição de probabilidade. 8. Qual é a diferença entre os conceitos de permutação e combina- 29. ção? 9. Enuncie os principais teoremas da probabilidade. Ilustre-os com 30. exemplos simples. 10. O que é uma distribuição de uma variável aleatória? Uma função 31. de distribuição? A função de probabilidade? A densidade? 11. Enuncie de memória as definições de média e de variância de uma 32. variável aleatória. 12. Se P(A) = P(B) e A  B, pode A  B? 33. 13. Se E  S (= o espaço amostral), podeP(E) = 1? 14. Que distribuições correspondem a uma amostragem com reposição 34. e sem reposição? 15. Quando um experimento envolverá uma distribuição binomial? Uma distribuição hipergeométrica? 16. Quando a distribuição de Poisson será uma boa aproximação da 35. distribuição binomial? 17. O que você sabe sobre a aproximação da distribuição binomial 36. pela distribuição normal? 18. Explique o uso das tabelas da distribuição normal. Se você dispuser 37. de um programa de computador, como você procederia sem as tabelas? 38. 19. Pode a função de probabilidade de uma variável aleatória discreta ter um número infinito de valores positivos? 39. 20. Enuncie os fatos mais importantes sobre as distribuições de duas variáveis aleatórias e suas distribuições marginais. 21. Faça um ramo-e-folhas, um histograma e um diagrama de caixa dos dados: 22,5, 23,2, 22,1, 23,6, 23,3, 23,4, 24,0, 20,6, 23,3. 40. 22. Repita o Problema 21 para os dados: 210, 213, 209, 218, 210, 215, 204, 211, 216, 213.

CAPÍTULO 24 Encontre a média, o desvio-padrão e a variância no Problema 21. Encontre a média, o desvio-padrão e a variância no Problema 22. Quais são os resultados do espaço amostral deX: Lançamento de uma moeda até que a primeira Cara apareça ? Quais são os resultados no espaço amostral do experimento de se lançarem simultaneamente três moedas? Uma caixa contém 50 parafusos, cinco dos quais são defeituosos. Encontre a função de probabilidade da variável aleatória X= Número de parafusos defeituosos na retirada de dois parafusos sem reposição e calculo seus valores.

Encontre os valores da função de distribuição no Problema 27. Usando um diagrama de Venn, mostre queA  B se e somente se A  B = B. Usando um diagrama de Venn, mostre queA  B se e somente se A  B = A. Se X tem a densidade f(x) = 0,5x (0  x  2) e 0 nos demais casos, quais são a média e a variância deX* = –2X + 5? Se há disponíveis 6 tintas diferentes, de quantas formas podemos selecionar duas cores para um trabalho de pintura? Quatro cores? Calcule 5! pela fórmula de Stirling e encontre os erros absoluto e relativo. Dois parafusos são retirados aleatoriamente sem reposição de uma caixa contendo 7 parafusos destrogiros e 3 levogiros. Considere que X seja o número selecionado de parafusos levogiros. Encontre P(X  0), P(X  1), P(X  2), P(1  X  2), P(0  X  5). Encontre a média e a variância da distribuição com densidadef(x) = 1/2 e–x. Encontre a assimetria da distribuição com densidade ƒ( x)  2(1  x) se 0 < x < 1, f(x) = 0 nos demais casos. Esboce a função de probabilidadef(x) = x2/30 (x = 1, 2, 3, 4) e a função de distribuição. Encontrem. Esboce F(x) = 0 se x  0, F(x) = 0,2x se 0 < x  5, F(x) = 1 se x > 5, e sua densidade f(x). Se a vida de pneus tem uma distribuição normal com uma média 2 de 25 000 km e uma variância de 25 000 000 km , qual é a probabilidade de que um desses pneus dure pelo menos 30 000 km? Pelo menos 35 000 km? Se o peso de sacos de cimento é normal com uma média de 50 kg e um desvio-padrão de 1 kg, qual é a probabilidade de que 100 sacos sejam mais pesados do que 5030 kg?

Capítulo 24: Análise de Dados. Teoria da Probabilidade

213

24

RESUMO DO CAPÍTULO

Análises de Dados. Teoria da Probabilidade Um experimento aleatório , sucintamente chamado de experimento, é um processo no qual o resultado depende do “acaso” (efeitos ou fatores que desconhecemos). Exemplos disso são os jogos de azar com dados ou cartas, a medida da dureza do aço, a observação das condições climáticas ou o registro do número de acidentes em uma cidade. (Portanto, a palavra “experimento” é usada aqui em um sentido muito mais amplo do que na linguagem comum.) Os resultados são considerados como pontos (elementos) de um conjunto S, chamado de espaço amostral, cujos subconjuntos são chamados de eventos. Para os eventos E, definimos uma probabilidade P(E) pelos axiomas (Seção 24.3) 0  P(E)  1 (1)

P(S)  1 P(E1  E2 





)  P(E1)  P(E2) 









(Ej  Ek  ).

Esses axiomas se fundamentam nas propriedades das distribuições de freqüências de dados (Seção 24.1). O complementar E de E tem a probabilidade c

(2)

P(E

c

)1

 P(E).

A probabilidade condicional de um evento B sob a condição de que um evento A aconteça é (Seção 24.3) P(BA) 

(3)

P( A  B)

 P(A)

[P(A)  0].

Dois eventos A e B são chamados de independentes se a probabilidade de suas ocorrências simultânas em uma tentativa é igual ao produto de suas probabilidades, ou seja, se (4)

P(A  B)  P(A)P(B).

A um experimento associamos uma variável aleatória X. Esta é uma função definida em S cujos valores são números reais; além disso, X é tal que a probabilidade P(X = a) com a qual X assume qualquer valor a e a probabilidade P(a < x  b) com a qual X assume qualquer valor em um intervalo a < x  b são definidas (Seção 24.5). A distribuição de probabilidade de X é determinada pela função de distribuição F(x)  P(X  x). (5) Nas aplicações, há dois tipos importantes de variáveis aleatórias: as do tipo discreto, que surgem quando fazemos contagens (itens defeituosos, clientes em um banco etc.), e as do tipo contínuo, que surgem quando fazemos medidas (comprimento, velocidade, temperatura, peso etc.) Uma variável aleatória discreta tem uma função de probabilidade

(6)

ƒ(x)  P(X  x).

Sua média m e sua variância s2 são (Seção 24.6) (7)

m

xj ƒ(xj)

e

s2 

( xj  m)2ƒ(xj)

j

j

onde os xj são os valores para os quais X possui uma probabilidade positiva. Importantes variáveis e distribuições aleatórias discretas são a binomial, a de Poisson e a hipergeométrica, discutidas na Seção 24.7. Uma variável aleatória contínua tem uma densidade ƒ(x)  F(x)

(8)

[veja (5)].

Sua média e sua variância são (Seção 24.6) (9)

m





( 

x ƒ(x) dx

e

s2 



x  m)2ƒ(x) dx.



Muito importante é a distribuição normal (Seção 24.8), cuja densidade é 1 1 xm (10) ƒ(x)  exp   s2 p 2  s



  

e cuja função de distribuição é (Seção 24.8; Tabelas A7, A8 do Apêndice 5) (11)

F(x)  

. xm s

2

214

Parte G • Probabilidade, Estatística

Uma variável aleatória bidimensional (X, Y) ocorre se simultaneamente observarmos duas quantidades (p. ex., altura X e peso Y de adultos). Sua função de distribuição é (Seção 24.9) (12) X e Y têm

(13)

F(x, y)  P(X  x, Y  y).

as funções de distribuição (Seção 24.9) F1(x)  P(X  x, arbitrário) Y

e

F2( y)  P(x arbitrário, Y  y)

respectivamente; suas distribuições são chamadas de distribuições marginais. Se ambas X e Y são discretas, então ( X, Y) tem a função de probabilidade ƒ(x, y)  P(X  x, Y  y). Se ambas X e Y são contínuas, então (X, Y) tem a densidade f(x, y).

CAPÍTULO

25

Estatística Matemática Na teoria da probabilidade, elaboramos modelos matemáticos para processos que são afetados pelo “acaso”. Em estatística matemática ou, sucintamente, em estatística, verificamos esses modelos em relação à realidade observável. Isto é sucintamente a chamada inferência . Ela, éque feita , isso provenientes é, pela extração amostragem de amostras aleatórias, chamadasestatística de amostras sãopor conjuntos de valores de um conjunto muito maior de valores passíveis de estudo, chamado de população. Exemplo de uma amostra são 10 diâmetros de parafusos tomados de um grande conjunto de parafusos. A amostragem é feita com o intuito de verificar se um modelo da população é acurado o bastante para propósitos práticos. Se esse for o caso, o modelo pode ser usado para previsões, decisões e ações, por exemplo, no planejamento de produção, na compra de equipamentos, nos investimentos em projetos de negócios, e assim por diante. Os mais importantes métodos de inferência estatística são a estimação de parâmetros (Seção 25.2), a determinação de intervalos de confiança (Seção 25.3) e os testes de hipótese (Seções 25.4, 25.7, 25.8), que têm aplicação no controle de qualidade (Seção 25.5) e na amostragem de aceitação (Seção 25.6). Na última seção (25.9), apresentamos uma introdução à regressão e à análise de correlação, referentes a experimentos envolvendo duas variáveis. Pré-requisito: Capítulo 24. Seções que podem ser omitidas em um curso menor: 25.5, 25.6, 25.8. Referências, Respostas dos Problemas e Tabelas Estatísticas: Parte G do Apêndice 1, Apêndice 2, Apên-

dice 5.

25.1 Introdução. Amostragem Aleatória A estatística matemática consiste em métodos de modelar e de avaliar valores de experimentos aleatórios para obter informações acerca de problemas práticos, tais como explorar a relação entre o conteúdo de ferro e a densidade do minério de ferro, a qualidade de matérias-primas ou de produtos manufaturados, a eficiência de sistemas de ar-condicionado, o desempenho de certos automóveis, o efeito da propaganda, as reações de consumidores a um novo produto etc. Em engenharia (e em outras áreas), as variáveis aleatórias ocorrem com mais freqüência do que se imagina. Por exemplo, as propriedades de artigos produzidos em massa (parafusos, lâmpadas etc.) sempre apresentam variações aleatórias, devido a pequenas (incontroláveis!) diferenças na matéria-prima ou nos processos de produção. Assim, o diâmetro de parafusos é uma variável aleatória X, de modo que temos parafusos não-defeituosos, com diâmetros situados entre certos limites de tolerância, e parafusos defeituosos, com diâmetros fora desses limites. Podemos nos interessar pela distribuição de X, pelo percentual esperado de parafusos defeituosos e por aperfeiçoamentos necessários ao processo produtivo. As amostras são selecionadas de populações — 20 parafusos de um lote de 1000, 100 eleitores em 5000, 8 castores em um projeto de conservação da vida selvagem — pois inspecionar a população inteira pode ser muito oneroso, consumir muito tempo, impossível de ser feito ou mesmo absurdo (pense num teste destrutivo de lâmpadas ou dinamite). Para obter conclusões significativas, as amostras devem ser seleções aleatórias. Pelo menos aproximadamente, cada um dos 1000 parafusos deve ter a mesma chance de ser coletado (ou seja, de ser selecionado para a nossa amostra). Somente assim a média amostral x– = ( x1 +    + x20)/20 (Seção 24.1) de uma amostra de tamanho n = 20 (ou qualquer outro n) será uma boa aproximação da média populacional m (Seção 24.6); e a acurácia da aproximação geralmente aumentará com o crescimento de n, conforme veremos. Algo similar ocorre com outros parâmetros (desvio-padrão, variância etc.). Os valores de amostras independentes serão obtidos em experimentos com um espaço amostral S infinito (Seção 24.2), certamente para a distribuição normal. Isso também é verdade nas amostragens com substituição. É aproximadamente verdade na obtenção de pequenas amostras a partir de uma grande população finita (por exem-

216

Parte G • Probabilidade, Estatística

plo, 5 ou 10 itens de 1000). Contudo, se fizermos uma amostragem sem substituição numa população pequena, o efeito da dependência dos valores amostrais poderá ser considerável. Os números aleatórios são úteis na obtenção de amostras que sejam de fato seleções aleatórias. Isso algumas vezes não é fácil de ser feito, porque há diversos fatores sutis capazes de produzir amostras viesadas (o que ocorrem em entrevistas pessoais, em máquinas com problemas de funcionamento, na escolha de condições observacionais atípicas etc.). Os números aleatórios podem ser obtidos de um gerador de números aleatórios em programas de computador como o Maple, o Mathematica ou outros relacionados neste livro. (Os números não são verdadeiramente aleatórios no sentido dos resultados de um lançamento de moedas ou dados, mas são calculados por uma engenhosa fórmula capaz de gerar números dos quais praticamente todos têm características essenciais a uma verdadeira aleatoriedade.) EXEMPLO 1

Números Aleatórios Produzidos por um Gerador de Números Aleatórios Para selecionar uma amostra de tamanho n = 10 a partir de um grupo dado de 80 rolamentos, numeramos os rolamentos de 1 a 80. Então, fazemos com que o gerador aleatoriamente produza 10 números inteiros pertencentes ao intervalo de 1 a 80 e incluímos na amostra os rolamentos com os números obtidos. Por exemplo, 44 55 53 03 52 61 67 78 39 54 ou outra seqüência do gênero. Há também tabelas estatísticas de números aleatórios (algo mais antigo).



A representação e o processamento de dados foram considerados na Seção 24.1 em associação com as distribuições de freqüência. Eles são as contrapartes empíricas das distribuições de probabilidade e parcialmente motivaram a existência de axiomas e propriedades da teoria das probabilidades. O novo aspecto tratado neste capítulo é a aleatoriedade: os dados são amostras selecionadas aleatoriamente de uma população. Logo, podemos imediatamente fazer uma conexão com a Seção 24.1, usando gráficos de ramos-e-folhas, diagramas de caixa e histogramas para representar graficamente as amostras. Além disso, agora chamamos a média x– em (5) na Seção 24.1 de média amostral

(1)

n

1

x

xj

n

j 1

1

n

( x1

x2





xn).



Dizemos que n é o tamanho amostral, s2 em (6) na Seção 24.1 é a variância e a variância amostral é

(2)

s2

n

1

n

1

x )2

( xj j 1

1

n

1

[ ( x1

x )2







(xn

x)2],

sendo sua raiz quadrada positiva s o desvio-padrão amostral. x–, s2 e s são chamados de parâmetros de uma amostra, e serão necessários ao longo de todo este capítulo.

25.2 Estimativa Pontual de Parâmetros Começando esta seção, discutiremos as tarefas práticas mais fundamentais em estatística e os correspondentes métodos estatísticos para realizá-las. A primeira delas é a estimativa pontual de parâmetros, ou seja, de quantidades que aparecem em distribuições, tais como p na distribuição binomial e m e s na distribuição normal. Uma estimativa pontual de um parâmetro é um número (um ponto sobre a reta dos números reais) calculado a partir de uma dada amostra e serve como uma aproximação do valor exato desconhecido do parâmetro populacional. Uma estimativa intervalar é um intervalo (“intervalo de confiança”) obtido de uma amostra; essas estimativas serão consideradas na próxima seção. A estimativa de parâmetros é de grande importância prática em muitas aplicações. Como uma aproximação da média m de uma população, podemos calcular a média x– de uma amostra correspondente. Isso nos fornece a estimativa mˆ = x– para m, isto é,

(1)

ˆ

x

1

n

( x1







xn )

onde n é o tamanho amostral. De forma similar, uma estimativa sˆ 2 para a variância de uma população é a variância s2 da amostra correspondente, isto é,

Capítulo 25: Estatística Matemática

(2)

ˆ

2

n

1

s2

n

217

( xj

1

j

x)2.

1

Obviamente, (1) e (2) são estimativas de parâmetros para distribuições nas quais m ou s2 aparecem explicitamente como parâmetros, como nas distribuições normal e de Poisson. Para a distribuição binomial, p = m/n [veja (3) na Seção 24.7]. Portanto, de (1) obtemos para p a estimativa

(3)

x



.

n

Mencionamos que (1) é um caso especial do chamado método dos momentos. Neste método, os parâmetros a serem estimados são expressos em termos dos momentos da distribuição (veja a Seção 24.6). Nas fórmulas resultantes, esses momentos são substituídos momentos da amostra. Isso fornece as estimativas. Aqui, da o kdistribuição -ésimo momento da amostrapelos x1, correspondentes   , xn é n

1

mk

xjk.

n

j

1

Método da Máxima Verossimilhança Outro método de obtenção de estimativas é o chamado método da máxima verossimilhança de R. A. Fisher [Messenger Math. 41 (1912), 155–160]. Para explicá-lo, consideremos uma variável aleatória X discreta (ou contínua) cuja função de probabilidade (ou de densidade) f(x) depende de um único parâmetro u. Tomamos a amostra correspondente de n valores independentes x1,   , xn. Então, no caso discreto, a probabilidade de que uma amostra de tamanho n consista precisamente nesses n valores é

(4)

l

= f(x1) f(x2)    f(xn)

No caso contínuo, a probabilidade de que a amostra consista em valores situados nos pequenos intervalos xj  x  xj   x (j = 1, 2,   , n) é

(5)

f(x1)x f(x2)x    f(xn)x = l(x)n.

Como f(xj) depende de u, a função l em x1,  , xn sejam dados e fixos. Então, l é

(5) dada por (4) depende de x1,   , xn e de u. Imaginemos que uma função de u, que é chamada de função de verossimilhança. A idéia básica do método da máxima verossimilhança é bem simples, como se segue. Escolhemos essa aproximação para o valor desconhecido de u para o qual l é tão grande quanto possível. Se l for uma função derivável de u, uma condição necessária para l ter um máximo num intervalo (não na fronteira) é l

(6)

0.

(Escrevemos uma derivada parcial, porque l depende também de x1,   , xn.) Uma solução de (6) dependente de x1,   , xn é chamada de estimativa de máxima verossimilhança para u. Podemos substituir (6) por ln l

(7)

0,

pois f(xj) > 0, um máximo de l é em geral positivo, e ln l é uma função monótona crescente de l. Isso freqüentemente simplifica os cálculos. Se a distribuição de X envolve r parâmetros u1,   , ur, então ao invés de (6) temos as r Vários Parâmetros. condições ∂l/∂u1 = 0,   , ∂l/∂ur = 0, e ao invés de (7) temos

(8)

ln l

0,







,

1

EXEMPLO 1

ln l

0.

r

Distribuição Normal Encontre a estimativa de máxima verossimilhança para u1 = m e u2 = s no caso da distribuição normal.

Solução. De (1) da Seção 24.8, e de (4), obtemos a função de probabilidade

218

Parte G • Probabilidade, Estatística

l

   n

1

n

1

e

2

h

n

1

h

onde

2

2

(xj

2

) .

j 1

Usando logaritmos, temos ln l

n ln

n ln

2

h.

A primeira equação em (8) é∂(ln l)/∂m = 0, escrita como ln l

h

n

1

n

(xj

2

)

0,

xj

logo,

j 1

n

0.

j 1

A solução é a estimativa desejadamˆ para m; encontramos 1

ˆ

n

n

xj

x.

j 1

A segunda equação em (8) é∂(ln l)/∂s = 0, escrita como ln l

n

h

n

1

n

(xj

3

)2

0.

j 1

Substituindo m por mˆ e resolvendo para s , obtemos a estimativa 2

2

1

n

n

(xj

2

x)

j 1

que utilizaremos na Seção 25.7. Note que isso difere de (2). Não podemos discutir critérios para a eficiência de estimativas, mas vale mencionar que, para pequenos valores de n, a fórmula (2) é preferível. 

PROBLEMAS PROPOSTOS 25.2 1. Encontre a estimativa de máxima verossimilhança para o parâmetro m de uma distribuição normal com variância conhecidas2 = s02. 2. Aplique o método da máxima verossimilhança à distribuição normal com m = 0. 3. (Distribuição binomial) Obtenha a estimativa de máxima verossimilhança para p. 4. Estenda o Problema 3 como a seguir. Suponha quem vezes n tentativas foram feitas e que nasn primeiras tentativasA aconteceu k1 vezes, nas n segundas tentativasA aconteceu k2 vezes,  , e nas n m-ésimas tentativasA aconteceu km vezes. Encontre uma estimativa de máxima verossimilhança dep baseada nessa informação. 5. Suponha que, no Problema 4, tenhamos feito 5 tentativas 4 vezes e que A aconteceu 2, 1, 4, 4 vezes, respectivamente. Estimep. 6. Considere X = Número de tentativas independentes até um evento A ocorrer. Mostre que X tem a função de probabilidadef(x) = pqx–1, x = 1, 2,  , onde p é a probabilidade deA numa única tentativa e q = 1 – p. Encontre a estimativa de máxima verossimilhança de p correspondente a uma amostrax1,   , xn de valores observados de X. 7. No Problema 6, encontre a estimativa de máxima verossimilhança de p correspondente a uma única observaçãox de X. 8. No lançamento de um dado, suponha que obtemos a primeira face Seis na sétima tentativa e que, começando de novo, nós a obtemos na sexta tentativa. Estime a probabilidadep de obtermos uma face Seis lançando o dado uma única vez.

9. (Distribuição de Poisson) Aplique o método da máxima verossimilhança à distribuição de Poisson. 10. (Distribuição uniforme) Mostre que, no caso dos parâmetrosa e b de uma distribuição uniforme (veja a Seção 24.6), a estimativa de máxima verossimilhança não pode ser obtida igualando-se a primeira derivada a zero. Como podemos obter a estimativa de máxima verossimilhança nesse caso? de máxima verossimilhança deu na densi11. Encontre a estimativa dade f(x) = ue-ux se x  0 e f(x) = 0 se x < 0. 12. No Problema 11, encontre a médiam, substitua-a emf(x), encontre a estimativa de máxima verossimilhança dem e mostre que ela é idêntica à estimativa param que pode ser obtida da estimativa para u no Problema 11. 13. Calcule uˆ no Problema 11 apartir da amostra 1,8; 0,4; 0,8; 0,6; 1,4. Represente num mesmo gráfico a função de distribuição amostral Fˆ(x) e a função de distribuiçãoF(x) da variável aleatória, com u = uˆ. Elas concordam razoavelmente bem? (A qualidade do ajuste será sistematicamente tratada na Seção 25.7.) 14. Repita o Problema 13 considerando que a amostra dada seja 0,5; 0,7; 0,1; 1,1; 0,1. 15. EXPERIMENTO DE ÁLGEBRACOMPUTACIONAL. Estimativas de Máxima Verossimilhança. (EMVs). Encontre experimentalmente o quanto as EMVs podem diferir dependendo do tamanho da amostra.Sugestão: gere algumas amostras de mesmo tamanho n, ou seja, da distribuição normal padronizada, e vá registrando os valores dex– e s2. Então, aumente n.

25.3 Intervalos de Confiança Os intervalos de confiança1 para um dado parâmetro desconhecido u de uma distribuição (p. ex., u = m) são intervalos u1  u  u2 que contêm u, não com absoluta certeza, mas com uma elevada probabilidade g, passível JERZY NEYMAN (1894–1981), estatístico americano, desenvolveu a teoria dos intervalos de confiança ( Annals of Mathematical Statistics 6 (1935), 111–116). 1

Capítulo 25: Estatística Matemática

219

de ser escolhida por nós (95% ou 99% são valores comuns). Tal intervalo é calculado a partir de uma amostra. g = 95% significa a probabilidade de 1 – g = 5% = 1/20 de o intervalo estar errado — ou seja, um em 20 desses intervalos não conterá u. Em vez de escrevermos u1  u  u2, especificamos mais isso escrevendo (1)

CONFg {u1  u  u2}

A possível importância desse símbolo especial, CONF, é evitar o mal-entendido de que u necessariamente se situa entre u1 e u2. g é o chamado nível de confiança, e u1 e u2 são os chamados limites inferior e superior do intervalo de confiança. Eles dependem de g. Quanto maior for o g escolhido, menor será a probabilidade de erro 1 – g, porém maior será o intervalo de confiança. Se g 1, então seu comprimento tende ao infinito. A escolha de g depende do tipo de aplicação. Quando se vai para algum lugar sem guarda-chuva, uma chance de 5% de chover não é algo trágico. Já numa decisão médica envolvendo um caso de vida ou morte, uma chance de 5% de algo dar errado →

pode ser demasiadamente grande e uma chance de erro de 1% (g = 99%) pode ser mais desejável. Os intervalos de confiança são mais valiosos que as estimativas pontuais (Seção 25.2). Com efeito, podemos considerar o ponto médio de (1) como uma aproximação de u e a metade do comprimento de (1) como uma “margem de erro” (não no sentido estrito dos métodos numéricos, mas sim significando um erro cuja probabilidade de ocorrência nos é conhecida). u1 e u2 em (1) são calculados a partir de uma amostra x1,   , xn. Estas são n observações de uma variável aleatória X. Agora vem um truque-padrão. Consideramos x1,   , xn como observações únicas de n variáveis . Então u1 = u1(x1,   , xn) e u2 = u2(x1,   , aleatórias X1,   , Xn ( com a mesma distribuição, a saber, a de X) xn) em (1) são valores observados de duas variáveis aleatórias 1 = 1(X1,   , Xn) e 2 = 2(X1,   , Xn). A condição (1) envolvendo g pode agora ser escrita como (2)

P(

1

2

)

.

Vejamos o que tudo isso concretamente significa em casos práticos. Em cada caso desta seção, primeiro apresentaremos os passos a serem seguidos para obtermos um intervalo de confiança na forma de uma tabela, depois consideraremos um exemplo típico e finalmente justificaremos teoricamente esses passos.

Intervalo de Confiança para a Média m da Distribuição Normal com a Variância s2 Conhecida Tabela 25.1 Determinação de um Intervalo de Confiança para a Média  de uma Distribuição Normal com a Variância 2 Conhecida Passo 1. Passo 2.

Escolha um nível de confiança g (95%, 99%, ou outro). Determine o c correspondente:

0,95 0,99 0,999 1,960 2,576 3,291 – Passo 3. Calcule a média x da amostra x1,  , xn. c / n. O intervalo de confiança para m é Passo 4. Calcule k g c

(3) EXEMPLO 1

0,90 1,645

CONF {x

k

x

k}.

Intervalo de Confiança para a Média  da Distribuição Normal com a Variância 2 Conhecida Determine um intervalo de confiança de 95% para a média de uma distribuição normal com variância s2 = 9, utilizando uma amostra de n = 100 valores com a média x– = 5. – Solução. Passo 1. Adotamos g = 0,95. Passo 2.O valor correspondente de c = 1,960; veja a Tabela 25.1.Passo 3. x = 5 é dada. Passo – – 4. Precisamos de k 1,960 3/ 100 0,588 . Portanto, x – k = 4,412, x + k = 5,588 e o intervalo de confiança é CONF 0,95{4,412  m  5,588}. Isto é às vezes escrito como m = 5 ± 0,588, porém não usaremos essa notação, que pode ser enganosa. Usando um programa de computador, podemos determinar esse intervalo mais diretamente. Algo similar ocorre com os outros exemplos desta seção. 

Teoria para a Tabela 25.1.O método da Tabela 25.1 decorre do seguinte teorema, de importância fundamental,

220

Parte G • Probabilidade, Estatística

TEOREMA 1

Soma de Variáveis Aleatórias Normais Independentes Consideremos que X1,   , Xn sejam variáveis aleatórias normais independentes que possuem média m e variância s2. Então o seguinte se verifica: (a) A soma X 1 +    + Xn é normal com média nm e variância ns2. – (b) A seguinte variável aleatória X é normal com média m e variância s2/n.

(4)

1

X

(X1

n





Xn)



(c) A seguinte variável aleatória Z é normal com média 0 e variância 1. (5)

PROVA

X

Z

/

n

As afirmações sobre a média e a variância em (a) seguem dos T eoremas 1 e 3 da Seção 24.9. Disto e do Teorema2 da – Seção 24.6, vemos que X tem a média (1/n)nm = m e a variância (1/n)2ns2 = s2/n. Isto implica que Z tem média 0 e variância 1 pelo Teorema 2(b) da Seção 24.6. A normalidade de X1 +    + Xn é provada na Ref. [G3], listada no Apêndice 1. Isso implica a normalidade de (4) e (5). 

Obtenção de (3) na Tabela 25.1. A amostragem de uma distribuição normal fornece valores amostrais independentes (veja a Seção 25.1), de modo que o Teorema 1 se aplica. Logo, podemos escolher g e então determinar c tal que (6)

P( c

Z

c)

P



X

c

/

n

c



( c)

( c)

.

Para o valor g = 0,95, obtemos z(D) = 1,960 na Tabela A8 do Apêndice 5, do mesmo modo como ela foi utilizada no Exemplo 1. Para g = 0,9; 0,99; 0,999, obtemos os outros valores de c listados na Tabela 25.1. Finalmente, tudo o que temos que fazer é converter a desigualdade em (6) na desigualdade para m e inserir os valores observados e obtidos da amostra. Multiplicamos – c  Z  c por –1 e então por / n, escrevendo c / n k (como na Tabela 25.1), P( c

Z

Adicionando X , temos P(X

k

c)

P(c

Z

c)



P c P(k



X

X /

c

n X

k)

 .

ou

k)

P(X k X k) . (7) – Inserindo o valor observado x– de X , obtemos (3). Aqui, temos considerado x1,  , xn como as únicas observações – de X1,  , Xn (o truque padrão!), de modo que x1 +    + xn é um valor observado de X +    + Xn e x é um – – – 1 valor observado de X . Note também que (7) é da forma (2) com 1 = X – k e 2 = X + k. 

EXEMPLO 2

Tamanho Amostral Necessário para um Intervalo de Confiança de um Comprimento Predeterminado Quão grande deve ser o valor de n no Exemplo 1 se desejamos obter um intervalo de confiança de 95% com o comprimento L = 0,4?

Solução. O intervalo (3) tem o comprimento

L

2k

2c /

n

n. Resolvendo para n,

obtemos

(2c /L)2.

No presente caso, a resposta é n = (2  1,960  3/0,4)2 870. A Fig. 525 mostra como L diminui à medida quen aumenta e que, para g = 99%, o intervalo de confiança é substancialmente maior que para g = 95% (com o mesmo tamanho amostral n).  

221

Capítulo 25: Estatística Matemática

0,6

γγ = 99%

0,4

γγ = 95% L/σ

0,2

0 0

Fig. 525. Comprimento do intervalo de confiança (3) (medido em múltiplos de s) como uma função do tamanho amostral n para g = 95% eg = 99%

500 n

Intervalo de Confiança para a Média m da Distribuição Normal com a Variância s2 Desconhecida Na prática, freqüentemente a variância s2 é desconhecida. Então o método da Tabela 25.1 não tem utilidade e toda a teoria se altera, embora os passos para a determinação do intervalo de confiança para m permaneçam bastante similares. Estes são mostrados na Tabela 25.2. Vemos que k difere daquele da Tabela 25.1, a saber, o desviopadrão amostral s toma o lugar do desvio-padrão desconhecido s da população. E c agora depende do tamanho amostral n e deve ser determinado da Tabela A9 no Apêndice 5 ou com o uso de um programa de computador. Essa tabela lista os valores z para valores dados da função de distribuição (Fig. 526) z

(8)

F(z)

Km



1

u2 m



(m

1)/2

du

da distribuição t. Aqui, m (= 1, 2,   ) é um parâmetro, chamado denúmero de graus de liberdadeda distribuição (abreviado como g.l.). No presente caso, m = n – 1; veja a Tabela 25.2. A constanteKm é tal que F(∞) = 1. Por _1) / [ m (_12 m (_12 m)], onde  é a função gama (veja (24) no Apêndice A3.1). integração, temos queKm 2 Tabela 25.2 Determinação de um Intervalo de Confiança para a Média  de uma Distribuição Normal com Variância 2 Desconhecida Passo 1. Passo 2.

Escolha um nível de confiança g (95%, 99%, ou outro). Determine a solução c da equação

(9)

F(c)

_1 (1 2

)

usando a tabela da distribuição t com n – 1 graus de liberdade (Tabela A9 no Apêndice 5; ou use um programa de computador; n = tamanho da amostra). – Passo 3. Calcule a média x e a variância s2 da amostra x1,  , xn. cs/ n. O intervalo de confiança é Passo 4. Calcule k

(10)

CONF {x

k

x

k}.

y 3 g.l.

1,0

y 1 g.l.

0,8

–3

–2

–1

0,4

0,6

0,3

0,4

0,2

0,2

0,1

0

3 g.l.

1 g.l.

1

2

3

x

Fig. 526. Funções de distribuição da distribuição t com 1 e 3 g.l. e da distribuição normal padronizada (curva mais inclinada)

–3

–2

–1

0

1

2

3

x

Fig. 527. Densidades da distribuição t com 1 e 3 g.l. e da distribuição normal padronizada

222

Parte G • Probabilidade, Estatística

A Fig. 527 compara a curva da densidade da distribuição t com a da distribuição normal. Esta última é mais inclinada. Isso ilustra o fato de que a Tabela 25.1 (que usa mais informações, a saber, o valor conhecido de s2) produz intervalos de confiança menores que os da Tabela 25.2. Tal fato é confirmado na Fig. 528, que também nos dá uma idéia do ganho obtido com o decréscimo do tamanho amostral. 2

'

L /L 1,5

γγ = 99% γγ = 95%

1 0

10

20

n

Fig. 528. Razão dos comprimentos L’ e L dos intervalos de confiança (10) e (3) com g = 95% eg = 99% como uma função do tamanho amostral n para s e s iguais

EXEMPLO 3

Intervalo de Confiança para a Média  da Distribuição Normal com a Variância 2 Desconhecida Cinco medições independentes do ponto de inflamação (ponto de chama) do óleo diesel (D-2) fornecem os valores (em oF) 144 147 146 142 144. Supondo a ocorrência de normalidade, determine um intervalo de confiança de 99% para a média.

Solução.

Passo 1. Adotemos g = 0,99.

Passo 2.F(c)



_1 (1

)

2

Passo 3.x = 144,6,

s2

0,995

e a Tabela A9 do Apêndice 5 comn – 1 = 4 g.l. fornecem c = 4,60.

= 3,8.

3,8 4,60 / 5 4,01. O intervalo de confiança é CONF 0,99 {140,5 148,7}. Se a variância s2 fosse conhecida e fosse igual à variância amostral s2, então s2 = 3,8 e portanto a Tabela 25.1 forneceria 2,576 3,8 / 5 2,25 e CONF 0,99 {142,35 146,85}. Vemos que o presente intervalo é aproximadamente duas vezes k c / n maior que o obtido da Tabela 25.1 (coms2 = 3,8). Logo, para pequenas amostras, a diferença é considerável! Veja também a Fig. 528. 

Passo 4.k

Teoria para a Tabela 25.2.Para obtermos (10) na Tabela 25.2, precisamos da Ref. [G3] TEOREMA 2

Distribuição t de Student Consideremos que X1,   , Xn sejam variáveis aleatórias normais independentes com a mesma média m e a mesma variância s2. Então, a variável aleatória

(11) possui uma distribuição t

X

T

S/

n



[veja (8)] com n – 1 graus de liberdade (g.l.); aqui, X é dada por (4) e

(12)

n

1

S2

n

1

(Xj

X )2.

j 1

Esta prova é 5similar Escolhemos umprograma número gdeentre 0 e 1 e determinamos um Demonstração de (10). número A9 do Apêndice com nà–de1 (3). g.l. (ou usando um computador) tal que c da Tabela (13)

P( c

T

c)

F(c)

F ( c)

.

Sendo a distribuição t simétrica, temos F( c)

F(c),

1

e (13) assume a forma (9). Substituindo (11) em (13) e transformando o resultado como antes, obtemos (14)

P(X

K

X

K)

Capítulo 25: Estatística Matemática

223

onde K

cS/

n.

– Inserindo os valores observados x– de X e s2 de S2 em (14), finalmente obtemos (10).



Intervalo de Confiança para a Variância s2 da Distribuição Normal A Tabela 25.3 mostra os passos, que são similares aos das Tabelas 25.1 e 25.2. Tabela 25.3 Determinação de um Intervalo de Confiança para a Variância 2 de uma Distribuição Normal, cuja Média Não Precisa Ser Conhecida Passo 1. Passo 2.

Escolha um nível de confiança g (95%, 99%, ou outro). Determine as soluções c1 e c2 das equações

(15)

F(c1)

_ (1 1 2

_1 (1

F(c2)

),

2

)

usando a tabela da distribuição do qui-quadrado com n – 1 graus de liberdade (Tabela A10 do Apêndice 5; ou use um programa de computador; n = tamanho da amostra). Passo 3. Calcule (n – 1)s2, onde s2 é a variância da amostra x1,  , xn. Passo 4. Calcule k1 = (n – 1)s2/c1 e k2 = (n – 1)s2/c2. O intervalo de confiança é

(16) EXEMPLO 4

2

CONF {k2

k1}.

Intervalo de Confiança para a Variância da Distribuição Normal Determine um intervalo de confiança de 95% (16) para a variância, usando a Tabela 25.3 e uma amostra (tensão de ruptura de uma folha de aço em kgf/mm2, arredondada para valores inteiros) 89 84 87 81 89 86 91 90 78 89 87 99 83 89.

Solução. Passo 1.Adotamos g = 0,95. Passo 2.Para n – 1 = 13, encontramos c1

5,01

e

c2

24,74.

Passo 3.13 s = 326,9. 2

Passo 4.13 s2/c1 = 65,25, 13s2/c2 = 13,21.

O intervalo de confiança é CONF0,95 {13,21

2

65,25}.

Ele é algo grande e, para obter um resultado mais preciso, precisaríamos de uma amostra muito maior.



Teoria para a Tabela 25.3. Na Tabela 25.1, usamos a distribuição normal, na Tabela 25.2, a distribuição t e agora usaremos a distribuição 2 (distribuição de qui-quadrado), cuja função de distribuição é F(z) = 0 se z < 0 e z

F(z)

Cm

e

u/2 (m 2)/2

u

du

se z

0

(Fig.529).

0

y

1

2 g.l.

0,8

3 g.l.

0,6

0,4 5 g.l.

0,2

0

2

4

6

8

10

x

Fig. 529. Função de distribuição da distribuição de qui-quadrado com 2, 3, 5 g.l.

224

Parte G • Probabilidade, Estatística

O parâmetro m (= 1, 2,   ) é chamado de número de graus de liberdade (g.l.), e 1/[2 m / 2 (_12 m)].

Cm

Note que a distribuição não é simétrica (veja também a Fig. 530). Para obter (16) na Tabela 25.3, necessitamos do seguinte teorema. TEOREMA 3

Distribuição de Qui-quadrado Sob as suposições do Teorema2, a variável aleatória

(17)

Y

(n

1)

S2 2

com S2 dado por (12) tem uma distribuição de qui-quadrado com n– 1 graus de liberdade.

Prova na Ref. [G3] do Apêndice 1. y

0,5

0,4

2 g.l.

0,3

0,2

3 g.l. 5 g.l.

0,1

0

2

4

6

8

10

x

Fig. 530. Densidade da distribuição de qui-quadrado com 2, 3, 5 g.l.

Demonstração de (16). Esta prova é similar à de (3) e (10). Escolhemos um número g situado entre 0 e 1 e determinamos c1 e c2 da Tabela A10, Apêndice 5, tal que [veja (15)] P(Y

c1 )

F(c1)

_1 (1

),

c2 )

P(Y

c2 )

2

P(Y

c2 )

F(c2)

_1 (1

).

2

Uma subtração fornece P(c1

Y

P(Y

c1 )

F(c2)

F(c1)

.

Transformando c1  Y  c2 com Y dado por (17) em uma desigualdade para s2, obtemos n

1

c2

S2

2

n

1

c1

S 2.

Inserindo os valores observados s2 de S2, obtemos (16).



Intervalos de Confiança para Parâmetros de Outras Distribuições Os métodos das Tabelas 25.1–25.3 para os intervalos de confiança para m e s2 foram modelados para uma distribuição normal. Mostremos agora que eles também podem ser aplicados a outras distribuições se utilizarmos grandes amostras. Sabemos que, se X1,   , Xn são variáveis aleatórias independentes com a mesma média m e a mesma variância s2, então sua soma Yn = X1 +    + Xn possui as seguintes propriedades.

(A) Yn tem a média nm e a variância ns2 (pelos Teoremas 1 e 3 na Seção 24.9). (B) Se essas variáveis são normais, então Yn é normal (pelo Teorema 1).

Capítulo 25: Estatística Matemática

225

Se essas variáveis aleatórias não são normais, então (B) não se aplica. Entretanto, para grandes valores de n, a variável aleatória Yn é ainda aproximadamente normal. Isso decorre do teorema do limite central, um dos resultados mais fundamentais da teoria das probabilidades. TEOREMA 4

Teorema do Limite Central Consideremos que X1,   , Xn,    sejam variáveis aleatórias independentes que possuem a mesma função de distribuição e, portanto, a mesma médiam e a mesma variância s2. Façamos Yn = X1 +    + Xn. Então, a variável aleatória

(18) é assintoticamente

Yn

Zn

n n

normalcom média0 e variância1; isto é, a função de distribuição nF(x) de Zn satisfaz a lim Fn(x)

n→

( x)

1 2

x

e

u2/2

du.

Uma prova pode ser encontrada na Ref. [G3] do Apêndice 1. Conseqüentemente, quando aplicamos as Tabelas 25.1–25.3 a uma distribuição não-normal, precisamos utilizar amostras suficientemente grandes. Como uma regra prática, se uma amostra indica que a assimetria da distribuição (veja o Projeto de Equipe 16(d), Problemas Propostos 24.6) é pequena, utilize pelo menos n = 20 para a média e pelo menos n = 50 para a variância.

PROBLEMAS PROPOSTOS 25.3 1–7

11. Conteúdo de cobre (%) em latão: 66, 66, 65, 64, 66, 67, 64, 65,

MÉDIA (VARIÂNCIA CONHECIDA) médiam

de 1. Encontre um intervalo de confiança de 95% para a uma população normal com um desvio-padrão de 4,00 da amostra 30, 42, 40, 34, 48, 50. 2. O intervalo no Problema 1 fica maior ou menor se tivermosg = 0,99 em vez de 0,95? Por qual fator? 3. Por qual fator o tamanho do intervalo no Problema 1 se altera se dobrarmos o tamanho da amostra? 4. Encontre um intervalo de confiança de 90% para a médiam de uma população normal com uma variância de 0,25, usando uma amostra de 100 valores com média 212,3. 5. Qual o tamanho da amostra necessário para a obtenção de um intervalo de confiança (3) de 95% e de comprimento s2? E de comprimento s? 6. (Uso da Fig. 525) Encontre um intervalo de confiança de 95% para uma amostra de 200 valores com média 120 de uma distribuição normal com variância 4, usando a Fig. 525. 7. Qual o tamanho amostral necessário para se obter um intervalo de confiança de 99% e de tamanho 2,0 para a média de uma população normal de variância 25? Utilize a Fig. 525. Verifique por

63, 64 de fusão (oC) do alumínio: 660, 667, 654, 663, 662 12. Ponto 13. Encontre um intervalo de confiança de 95% para a porcentagem de automóveis com freios mal-ajustados numa certa rodovia, utilizando uma amostra aleatória de 500 carros parados num bloqueio nessa rodovia, 87 dos quais apresentaram freios mal-ajustados. 14. Encontre um intervalo de confiança de 99% parap numa distribuição binomial a partir de um clássico resultado de K. Pearson, que em 24000 tentativas de lançamento de uma moeda, obteve 12 012 caras. Você acha que a moeda era honesta?

15–20 VARIÂNCIA

Encontre um intervalo de confiança de 95% para a variância de uma população normal por meio da amostra: 15. Uma amostra de 30 valores com variância 0,0007 16. A amostra do Problema 9 17. A amostra do Problema 11 18. Emissão de monóxido de carbono (em gramas por milha) de um certo tipo de automóvel de passeio (viajando a 55 mph): 17,3; 17,8; cálculos. 18,0; 17,7; 18,2; 17,4; 17,6; 18,1 8–12 MÉDIA (VARIÂNCIA DESCONHECIDA) 19. Energia média (keV) de um grupo de nêutrons atrasados (Grupo 3, meia-vida 6,2 s) para a fissão de urânio U235: 435, 451, 430, 444, Encontre um intervalo de confiança de 99% para a média de uma 438 população normal a partir de uma amostra: 8. 425, 420, 425, 435 20. Máximo esforço de tensão (k psi) de uma liga metálica (Maraging H) à temperatura ambiente: 251, 255, 258, 253, 253, 252, 250, 252, 9. Comprimento de 20 porcas com uma média amostral de 20,2 cm 255, 256 e uma variância amostral de 0,04 cm2 10. Durezas Knoop de diamantes: 9500, 9800, 9750, 9200, 9400, 21. Se X é normal com média 27 e variância 16, que distribuições têm 9550 –X, 3 X, e 5X – 2?

226

Parte G • Probabilidade, Estatística

22. Se X1 e X2 são variáveis aleatórias normais e independentes, com média 23 e 4 e variância 3 e 1, respectivamente, que distribuição tem 4X1 – X2? Sugestão: use o Projeto de Equipe 14(g) na Seção 24.8. 25. 23. Uma máquina preenche comX lb de sal caixas de pesoY lb, onde X e Y são normais com média 100 lb e 5 lb e desvio-padrão 1 lb e 0,5 lb, respectivamente. Qual é a porcentagem esperada de caixas preenchidas pesando entre 104 lb e 106 lb? 24. Se o peso X de sacos de cimento é normalmente distribuído com uma media de 40 kg e um desvio-padrão de 2 kg, quantos sacos

25.4 Teste de Hipóteses.

pode um caminhão de entregas carregar de tal forma que a probabilidade de a carga total exceder 2000 kg é de 5%? EXPERIMENTO DE ÁLGEBRA COMPUTACIONAL. Intervalos de Confiança. Obtenha 100 amostras de tamanho 10 de uma distribuição normal padronizada. Usando-as, calcule e represente graficamente os intervalos de confiança de 95% para a média e conte quantos deles não contêm 0. O resultado está de acordo com a teoria? Repita todo o experimento, compare e comente.

Decisões

As idéias dos intervalos de confiança e dos testes2 são as duas mais importantes na estatística moderna. Num teste estatístico, fazemos inferências para a população a partir de amostras, por meio da testagem de uma hipótese, resultando de experiências ou observações, de uma teoria ou de um requerimento de qualidade, e assim por diante. Em muitos casos, usa-se o resultado de um teste como base para uma decisão, por exemplo, sobre comprar (ou não comprar) um certo modelo de carro, dependendo de um teste de eficiência do consumo de combustível (em milhas/galão) (e outros testes, naturalmente), sobre aplicar alguma medicação, dependendo de um teste sobre seu efeito; para adotar uma estratégia de mercado, dependendo de um teste de reações dos consumidores etc. Expliquemos esse teste por meio de um exemplo típico e introduzamos as correspondentes notações-padrão da testagem estatística.

EXEMPLO 1

Teste de Hipóteses. Alternativa. Nível de Significância  Desejamos comprar 100 rolos de um certo tipo de arame, no intuito de verificarmos a afirmação do fabricante de que o arame tem um limite de ruptura de m = m0 = 200 lb (ou mais). Isto é um teste da hipótese (também chamada dehipótese nula) m = m0 = 200. Não compraremos o arame se o teste (estatístico) mostrar que, na verdade, m = m1 < m0, sendo o arame fraco e a afirmação do fabricante não seria verdadeira. m1 é a chamada alternativa (ou hipótese alternativa) do teste. Devemos aceitar a hipótese se o teste sugerir que ela é verdadeira, exceto por um pequeno erro de probabilidade , chamado de nível de significância do teste. De outro modo, rejeitamos a hipótese. Conseqüentemente,  é a probabilidade de rejeitar uma hipótese apesar de ela ser verdadeira. A escolha de  fica a nosso critério. 5% e 1% são valores comuns. Paraexperimentalmente o teste, precisamososdelimites uma amostra. Selecionamos aleatoriamente arame,de cortamos pedaçotenha de cada rolo ex–determinamos de ruptura. Suponha que essa amostra 25 de rolos n = 25devalores limite deumruptura a média = 197 lb (um tanto menor que o anunciado!) e o desvio-padrão s = 6 lb. Neste ponto, poderíamos somente especular se a diferença 197 – 200 = –3 se deve a arredondamentos, se é um efeito casual, ou se é significante, devido à real qualidade inferior do arame. Para irmos além das especulações, precisamos da teoria das probabilidades, como se segue. Suponhamos que os limites de ruptura tenham uma distribuição normal. (Essa suposição pode ser testada pelo método da Seção 25.7. Ou podemos nos recordar do teorema do limite central (Seção 25.3) e coletar uma amostra ainda maior.) Então, T

X S/

0

n

em (11) da Seção 25.3, com m = m0, tem uma – distribuição t com n – 1 graus de liberdade ( n – 1 = 24 para a nossa amostra). Além disso, – x = 197 e s = 6 são valores observados de X e S a serem usados mais tarde. Podemos agora escolher um nível de significância, digamos, c tal que P(T  c) =  = 5%. Para  = 5%. Da Tabela A9 no Apêndice 5 ou de um programa de computador, obtemos então um valor crítico P(T  c ) = 1 –  = 95%, a tabela fornece c = 1,71, de forma que c = –c = –1,71 devido à simetria da distribuição (Fig. 531). Usamos agora o seguinte raciocínio – esta é a idéia crucialdo teste. Se a hipótese é verdadeira, então temos uma chance de somente  (= 5%) de observarmos um valor t de T (calculado a partir da amostra) que estará situado entre – ∞ e –1,71. Logo, se não obstante observarmos esse valor t, afirmaremos que a hipótese não pode ser verdadeira e a rejeitamos. Então aceitamos a alternativa. Se, contudo, t  c, aceitamos a hipótese. 





Rejeitar a hipótese

Não rejeitar a hipótese

95%

α = 5% c

= –1,71

0

t

Fig. 531. Distribuição t do Exemplo 1 Iniciando-se por volta de 1930, uma teoria sistemática de testes foi desenvolvida por NEYMAN (veja a Seção 25.3) e EGON SHARPE PEARSON (1895–1980), estatístico inglês, filho de Karl Pearson (veja a nota de rodapé mais adiante). 2

Capítulo 25: Estatística Matemática

227

Um simples cálculo finalmente nos fornece t (197 200) /(6/ 25) 2,5 como um valor observado de T. Como –2,5 < –1,71, rejeitamos a hipótese (a afirmação do fabricante) e aceitamos a alternativa m = m1 < 200, a de que o arame parece ser mais fraco que o anunciado. 

Esse exemplo ilustra os passos de um teste: 1. Formule a hipótese u = u0 a ser testada. ( u0 = m0 neste exemplo.) 2. Formule uma alternativa u = u1. ( u1 = m1 neste exemplo.) 3. Escolha um nível de significância  (5%, 1%, 0,1%).

ˆ = g(X1,  , Xn) cuja distribuição depende da hipótese e da alternativa, e essa 4. Use uma variável aleatória  ˆ , supondo que distribuição é conhecida em ambos os casos. Determine um valor crítico c da distribuição de 

ˆ P(T  c) = ). a hipótese seja verdadeira. (No exemplo,  = T, e c = , com c obtido ˆ = gde ˆ . (t no exemplo.) (x1,  , xn) de  5. Use uma amostra x1,  , xn para determinar um valor observado  ˆ relativo a c. (neste exemplo, t < c, o que levou à 6. Aceite ou rejeite a hipótese, dependendo do tamanho de  rejeição da hipótese.) Dois importantes fatos requerem uma discussão adicional e uma maior atenção. O primeiro é a escolha de uma alternativa. No exemplo, m1 < m0, porém outras aplicações podem requerer m1 > m0 ou m1  m0. O segundo fato tem a ver com os erros. Sabemos que  (o nível de significância do teste) é a probabilidade de rejeição de uma hipótese verdadeira. E discutiremos a probabilidade b da aceitação de uma hipótese falsa.

Alternativas Uni e Bilaterais (Fig. 532) Consideremos u um parâmetro desconhecido numa distribuição e suponhamos que desejamos testar a hipótese u = u0. Então, há três tipos principais de alternativas, a saber, (1) (2) (3)

u > u0 u < u0 u  u0

(1) e (2) são alternativas unilaterais e (3) é uma alternativa bilateral. Chamamos de região de rejeição (ou região crítica) a região na qual rejeitamos a hipótese caso nela caia o valor observado do teste. Em “1”, o c crítico situa-se à direita de u0 porque o mesmo ocorre com a alternativa. Logo, a região de rejeição se estende à direita. Este é o chamado teste do lado direito. Em “2”, o c crítico situase à esquerda de u0 (como no Exemplo 1), a região de rejeição se estende à esquerda e temos um teste do lado esquerdo (Fig. 532, parte central). Esses são os testes unilaterais. Em “3”, temos duas regiões de rejeição. Este é o chamado teste unilateral (Fig. 532, parte inferior).

Região de Aceitação Não rejeitar a hipótese (Aceitar a hipótese) 1

Região de Rejeição (Região Crítica) Rejeitar a hipótese

θ0

Região de Rejeição (Região Crítica) Rejeitar a hipótese

c

Região de Aceitação Não rejeitar a hipótese (Aceitar a hipótese)

2 c

θ0

Região de Aceitação Não rejeitar a hipótese (Aceitar a hipótese)

Região de Rejeição (Região Crítica) Rejeitar a hipótese

Região de Rejeição (Região Crítica) Rejeitar a hipótese

3 c1

θ0

c2

Fig. 532. Teste no caso da alternativa (1) (parte superior da figura), alternativa (2) (parte central) e alternativa (3)

228

Parte G • Probabilidade, Estatística

Todos os três tipos de alternativas ocorrem em problemas práticos. Por exemplo, (1) pode acontecer se u0 é a máxima inexatidão tolerável de um voltímetro ou de algum outro instrumento. A alternativa (2) pode ocorrer em testes de resistência de material, como no Exemplo 1. Finalmente, u0 em (3) pode ser o diâmetro de eixos, e os eixos excessivamente finos ou grossos são igualmente indesejáveis, de modo que temos que observar desvios em ambas as direções.

Erros em Testes Os testes sempre envolvem riscos de tomarem-se falsas decisões:

(I) Rejeição de uma hipótese verdadeira ( Erro do tipo I). a = Probabilidade de ocorrência de um erro do tipo I. de uma hipótese falsa (de ). II. (II) Aceitação Erro de ocorrência um do errotipo do II tipo b = Probabilidade Obviamente, não podemos evitar esses erros porque conclusões absolutamente certas sobre populações não podem ser tiradas de amostras. Mas mostraremos que há caminhos e meios de escolher níveis apropriados de risco, ou seja, de valores a e b. A escolha de a depende da natureza do problema (p. ex., um pequeno risco a = 1% é adotado se isto se trata de um caso de vida ou morte). Discutamos isso sistematicamente para o teste de uma hipótese u = u0 contra uma alternativa que seja um único número u1, por simplicidade. Seja u1 > u0, de modo que tenhamos um teste do lado direito. Para um teste do lado esquerdo ou um teste bilateral, a discussão é bastante similar. Escolhemos um valor crítico c > u0 (como na parte superior da Fig. 532, pelos métodos discutidos a seguir). De uma dada amostra x1,  , xn calculamos então um valor ˆ

g(x1,







, x n)

com um g apropriado (cuja escolha será um ponto crucial mais tarde em nossa discussão; por exemplo, façamos g = ( x1 +    + xn)/n no caso em que u é a média). Se uˆ > c, rejeitamos a hipótese. Se uˆ  c aceitamo-la. Aqui, o valor uˆ pode ser considerado como um valor observado da variável aleatória ˆ (4) g(X1, , X n) pois xj pode ser considerado como um valor observado de Xj, j = 1,  , n. Nesse teste, há duas possibilidades de ocorrer um erro, como a seguir. •





Erro do Tipo I (veja a Tabela 25.4). A hipótese é verdadeira, mas é rejeitada (logo, a alternativa é aceita) porque  assume um valor uˆ > c. Obviamente, a probabilidade de ocorrência desse erro é igual a P( ˆ

(5) a

c)

0

.

é o chamado nível de significância do teste, como mencionado antes.

ˆ assume um valor uˆ  c. A Erro do Tipo II (veja a Tabela 25.4). A hipótese é falsa, mas é aceita porque  probabilidade de ocorrência desse erro é denotada por b; portanto, P( ˆ

(6) h

c)

1

.

= 1 – b é chamado de poder do teste. Obviamente, o poderh é a probabilidade de se evitar um erro do tipo II.

Tabela 25.4 Erros do Tipo I e do Tipo II no Teste da Hipótese  =  contra a Alternativa  =  0

1

Verdade desconhecida 0

o ã ç ta i e c A

Decisão verdadeira 0

P

1

Erro do tipo I 1

P

1

Erro do tipo II

P Decisão verdadeira

P

1

Capítulo 25: Estatística Matemática

229

As fórmulas (5) e (6) mostram que tanto a quanto b dependem de c, e gostaríamos de escolher c de forma que essas probabilidades de ocorrência de erros sejam tão pequenas quanto possível. Porém, a importante Fig. 533 mostra que essas solicitações são conflitantes, pois, para diminuirmos a, precisamos deslocar c para a direita, o que faz b crescer. Na prática, primeiramente escolhemos a (5% ou, às vezes, 1%), então determinamos c e finalmente calculamos b. Se b é grande, de forma que h = 1 – b é pequeno, devemos repetir o teste, escolhendo uma amostra maior, por razões que logo ficarão claras. ^ Densidade de Θ se a alternativa é verdadeira

^ Densidade de Θ se a hipótese é verdadeira

β

α

θ0

θ1

c

Região de aceitação

Região de rejeição (Região crítica)

Fig. 533. Ilustração dos erros do tipo I e II no teste de uma hipótese u = u0 contra uma alternativa u = u1 (> u0, teste do lado direito)

Se a alternativa não for um único número, mas tiver a forma (1)–(3), então b torna-se uma função de u. Essa função b(u) é chamada de característica operacional (CO) do teste e sua curva é chamada de curva CO. Logicamente, nesse caso h = 1 – b também depende de u. Essa função h(u) é chamada de função do poder do teste. (Exemplos disso serão apresentados em breve.) Naturalmente, o fato de um teste levar à adoção de uma certa hipótese u0 não significa que essa hipótese seja a única ou a melhor possível. Conseqüentemente, as expressões “não rejeitar” e “não conseguir rejeitar” são talvez melhores que a expressão “não aceitar”.

Teste para a Média m da Distribuição Normal com a 2

s Conhecida Variância O seguinte exemplo explica os três tipos de hipóteses. EXEMPLO 2

Teste para a Média da Distribuição Normal com a Variância Conhecida

– Consideremos que X seja uma variável aleatória normal com variância s2 = 9. Usando uma amostra de tamanho n = 10 com médiax , testemos a hipótese m = m0 = 24 em relação a três tipos de alternativas, a saber, (a)

Solução. Adotemos o nível de significância

(b)

0

(c)

0

0.

a = 0,05. Uma estimativa da média será obtida de 1

X

n



(X1





Xn).



Se a hipótese é verdadeira, X é normal com médiam = 24 e a variância s2/n = 0,9, veja o Teorema 1 na Seção 25.3. Logo, podemos obter o valor crítico c na Tabela A8 do Apêndice 5.

Caso (a). Teste

do Lado Direito. Determinamos c a partir de P(X P(X

c)



24

c)

c

0,9

0,05,

24

24



1

ou seja,

0,95.

– A Tabela A8 do Apêndice 5 fornece(c 24) / 0,9 1,645 , e c = 25,56, que é maior que m0, como na parte superior da Fig. 532. Se x  – 25,56, a hipótese é aceita. Se x > 25,56, ela é rejeitada. A função do poder do teste é (Fig. 534) ( )

P(X

25,56)

1



(7)

P(X

1



25,56 0,9

25,56)

1

(26,94

1,05 )

Caso (b). Teste do Lado Esquerdo.O valor crítico c é obtido da equação P(X

c)



24



c

24 0,9



0,05.

– A Tabela A8 do Apêndice 5 fornecec = 24 – 1,56 = 22,44. Se x  22,44, aceitamos a hipótese. Se x < 22,44, rejeitamo-la. A função do poder do teste é

230

Parte G • Probabilidade, Estatística

( ) 1,0

0,8 0,6 0,4 0,2

20

22

26

0

28

Fig. 534. Função do poder h(m) do Exemplo 2, para o caso (a) (linha tracejada) e o caso (c)

(8)

P(X

( )



22,44)



22,44 0,9

(23,65

1,05 ).

Caso (c). Teste Bilateral.Como a distribuição normal é simétrica, escolhemos c1 e c2 eqüidistantes de m = 24, digamos, c1 = 24 – k e c2 = 24 + k, e determinamos k a partir de P(24

k

X

  



k

k)

24

24

0,9

k

1

0,9

0,95.

A Tabela A8 no Apêndice 5 fornecek / 0,9 1,960, logo, k = 1,86. Isso fornece os valores c1 = 24 – 1,86 = 22,14 e c2 = 24 + 1,86 = 25,86. – Se x não é menor que c1 ou maior que c2, aceitamos a hipótese. Caso contrário, rejeitamo-la. A função do poder do teste é (Fig. 534) ( )

(9)

P(X

P(X

22,14)

1



1

(23,34

25,86)

P(X





22,14

0,9

1,05 )

22,14)

1

P(X

25,86)

25,86 0,9 (27,26

1,05 ).

Conseqüentemente, a característica operacional b(m) = 1 – h(m) (veja antes) é (Fig. 535) ( )

(27,26

1,05 )

(23,34

1,05 ).

Se usarmos uma amostra maior, digamos, de tamanho n = 100 (ao invés de 10), então s2/n = 0,09 (ao invés de 0,9) e os valores críticos são c1 = 23,41 e c2 = 24,59, como podemos prontamente verificar. Então, a característica operacional do teste é



( )

24,59





0,09

(81,97

3,33 )

23,41 0,09 (78,03

3,33 ).

A Fig. 535 mostra que a curva CO correspondente é mais inclinada que para o caso de n = 10. Isso significa que o aumento de n resultou num aperfeiçoamento do teste. Em qualquer situação prática, n é escolhido tão pequeno quanto possível, porém ao mesmo tempo grande o suficiente para fazer o teste apresentar desvios entre m e m0 que sejam de interesse prático. Por exemplo, se estamos interessados em desvios de ±2 unidades, vemos da Fig. 535 que n = 10 é muito pequeno, pois quando m = 24 – 2 = 22 ou m = 24 + 2 = 26, b vale aproximadamente 50%. Por outro lado, vemos que n = 100 é suficiente para esse propósito.  ( )

1,0 0,8 0,6 0,4 n = 10

0,2 n = 100

20

22

0

26

28

Fig. 535. Curvas de característica operacional (curvas CO) do Exemplo 2, caso ( c), para dois diferentes tamanhos amostraisn

Capítulo 25: Estatística Matemática

231

Teste para a Média m Quando a Variância s2 É Desconhecida, e para s2 EXEMPLO 3

Teste para a Média da Distribuição Normal com a Variância Desconhecida

– Para n = 16 cordas de cânhamo (diâmetro de 3 polegadas), mediram-se suas tensões de ruptura. A média amostral foi x = 4482 kgf, e o desvio-padrão amostral foi s = 115 kgf (N. C. Wiley, 41o Encontro Anual da American Society for Testing Materials). Supondo que a resistência à tensão é uma variável aleatória normal, teste a hipótese m0 = 4500 kgf contra a alternativa m1 = 4400 kgf. Aqui, m0 pode ser um valor dado pelo fabricante, enquanto m1 pode resultar de experiências anteriores.

Solução. Adotemos o nível de significância a = 5%. Se a hipótese é verdadeira, então decorre do Teorema 2 na Seção 25.3 que a variável aleatória X T

S/

X

0

4500

S/4

n

0,05. A Tabela A9 do tem uma distribuição t com n – 1 = 15 g.l. O teste é do lado esquerdo. O valor crítico c é obtido de P(T c) 0 Apêndice 5 fornece c = –1,75. Como um valor observado de T, obtemos da amostra t = (4482 – 4500)/(115/4) = –0,626. Vemos quet > c e aceitamos a hipótese. Para obtermos valores numéricos sobre o poder do teste, precisaríamos das chamadas tabelas t de Student não-centrais; uma questão que não discutiremos aqui. 

EXEMPLO 4

Teste para a Variância da Distribuição Normal Usando uma amostra de tamanho n = 15 e uma variância amostrals2 = 13 de uma população normal, teste a hipótese s2 = s02 = 10 contra a alternativa s2 = s12 = 20.

Solução. Adotemos o nível de significância

a

= 5%. Se a hipótese é verdadeira, então Y

(n

1)

S2

14

2 0

S2

1,4S 2

10

tem uma distribuição de qui-quadrado com n – 1 = 14 g.l. pelo Teorema 3 da Seção 25.3. De P(Y

c)

0,05,

P(Y

ouseja,

c)

0,95,

2 1) 0,714Y e da Tabela A10 do Apêndice 5, com 14 graus de liberdade, obtemos c = 23,68. Este é o valor crítico de Y. Logo, a S 2 0 Y/(n corresponde o valor crítico c* = 0,714  23,68 = 16,91. Como s2 < c*, aceitamos a hipótese. 2 2 2 Se a alternativa é verdadeira, a variável aleatória Y1 = 14S /s1 = 0,7S tem uma distribuição de qui-quadrado com 14 g.l. Logo, nosso teste tem o poder

P(S 2

c*)

2

20

P(Y1

0,7c*)

2

1

20

P(Y1

11,84)

2

20

.

Usando uma tabela maior para a distribuição do qui-quadrado (como a encontrada na Ref. [G3] ou [G8]) ou um programa de computador, você verá que h 62%. Logo, o risco de ocorrência de um erro do tipo II é muito grande, a saber, 38%. Para tornar esse risco menor, temos que aumentar o tamanho amostral.  

Comparação de Médias e Variâncias EXEMPLO 5

Comparação das Médias de Duas Distribuições Normais Usando uma amostra x1,   , xn1 de uma distribuição normal com média desconhecida mx e uma amostra y1,   , yn2 de uma outra distribuição normal com média desconhecida my, desejamos testar a hipótese de que as médias são iguais, mx = my, contra uma alternativa, a saber, mx > my. As variâncias não precisam ser conhecidas, mas se supõem que elas sejam iguais. 3 Dois casos de comparação de médias são de importância prática:

Caso A. As amostras têm o mesmo tamanho. Além disso, cada valor da primeira amostra corresponde a precisamente um valor da outra amostra, porque os valores correspondentes referem-se a uma mesma pessoa ou objeto (comparação aos pares) – por exemplo, duas medidas de uma mesma coisa feitas por dois diferentes métodos ou duas medidas feitas separadamente por cada olho de uma mesma pessoa. Mais genericamente, elas podem resultar de pares de indivíduos ou objetos similares, tais como gêmeos idênticos, pares de pneus dianteiros usados em um mesmo automóvel etc. Então devemos obter as diferenças entre os valores correspondentes e testar a hipótese de que a população correspondente às diferenças tem média 0, usando o método do Exemplo 3. Se tivermos uma escolha, esse método é melhor que o seguinte. Caso B. As duas amostras são independentes e não necessariamente de mesmo tamanho. Então, podemos proceder como se segue. Suponha que a alternativa seja mx > my. Escolhemos um nível de significância a. Então, calculamos as médias amostrais x– e –y bem como (n1 – 1)sx2 e (n2 – 1)sy2, onde sx2 e sy2 são as variâncias amostrais. Usando a Tabela A9 do Apêndice 5 com n1 + n2 – 2 graus de liberdade, agora determinamos c a partir de (10)

P(T

c)

1

.

Essa suposição da igualdade das variâncias pode ser testada, como o próximo exemplo mostrará. Se o teste mostra que elas diferem significativamente, escolha duas amostras de mesmo tamanho n1 = n2 = n (não tão pequenas, mas com um tamanho, digamos, > 30), use o teste do Exemplo 2 juntamente com o fato de que (12) é um valor observado de uma variável aleatória normal aproximadamente padronizada. 3

232

Parte G • Probabilidade, Estatística

Finalmente, calculamos

(11)

t0

n1n2(n1

n2

n1

n2

x

2)

y 2

( n1

1)sx

2

(n2

.

1)sy

Pode-se mostrar que este é um valor observado de uma variável aleatória que possui a distribuição t com n1 + n2 – 2 graus de liberdade, desde que a hipótese seja verdadeira. Se t0  c, a hipótese é aceita. Se t0 > c, ela é rejeitada. Se a alternativa émx  my, então (10) deve ser substituída por (10*)

P(T

c 1)

P(T

0,5,

c 2)

1

0,5 .

Note que, para amostras de igual tamanho n1 = n2 = n, a fórmula (11) se reduz a

(12)

t0

x

n

y

sx2

sy2

.

Para ilustrarmos os cálculos, consideremos duas amostras (x1,   , xn1) e (y1,   , yn2) dadas por 105 108 86 103 103 107 124 105 e 89

92

84

97

103

107

111

97

mostrando a produção relativa de pratos de estanho por operários trabalhando sob duas diferentes condições [J. J. B. Worth, Journal of Industrial Engeneering 9, 249–253]. Considerando que as populações correspondentes sejam normais e tenham a mesma variância, testemos a hipótese mx = my contra a alternativa mx  my. (A igualdade de variâncias será testada no próximo exemplo.)

Solução. Encontramos x

y

105,125,

sx2

97,500,

sy2

106,125,

84,000.

Adotemos o nível de significância a = 5%. De (10*) com 0,5 a = 2,5%, 1 – 0,5a = 97,5% e da Tabela A9 do Apêndice 5, com 14 graus de liberdade, obtemos c1 = –2,14 e c2 = 2,14. A fórmula (12) comn = 8 fornece o valor t0

8 7,625/

190,125

1,56.

Como c1  t0  c2, aceitamos a hipótesemx = my de que, sob ambas as condições, as médias das produções são iguais. O Caso A se aplica ao exemplo porque os primeiros valores de cada amostra correspondem a um certo tipo de trabalho, os segundos valores foram obtidos em outro tipo de trabalho etc. Logo, podemos usar as diferenças 16

16

2

6

0

0

13

8

dos correspondentes valores amostrais e o método no Exemplo 3 para testar a hipótese – m = 0, onde m é a média da população correspondente às diferenças. Como uma alternativa lógica, fazemos m  0. A média amostral é d = 7,625 e a variância amostral é s2 = 45,696. Logo, t

8( 7,625

0) /

45,696

3,19.

De P(T  c1) = 2,5%, P(T  c2) = 97,5% e da Tabela A9 do Apêndice 5 comn – 1 = 7 graus de liberdade, obtemos c1 = –2,36 e c2 = 2,36 e rejeitamos a hipótese , porque t = 3,19 não se situa entre c1 e c2. Logo, nosso presente teste, no qual utilizamos mais informações (porém, as mesmas amostras), mostra que a diferença de produção é significativa. 

EXEMPLO 6

Comparação da Variância de Duas Distribuições Normais Usando as duas amostras do último exemplo, teste a hipótese sx2 = sy2; suponha que as populações correspondentes sejam normais e que a natureza do experimento sugira a alternativa sx2 > sy2.

Solução. Encontramos sx2 = 106,125, sy2 = 84,000. Escolhemos o nível de significância a = 5%. Usando P(V  c) = 1 – a = 95% e a Tabela A11 do Apêndice 5, com n(1 – 1, n2 – 1) = (7,7) graus de liberdade, determinamos c = 3,79. Finalmente, calculamos v0 = sx2/sy2 = 1,26. Como v0  c, aceitamos a hipótese. Se v0 > c, esta seria rejeitada. Esse teste é justificado pelo fato de que v0 é um valor observado de uma variável aleatória que tem a chamada distribuição F com (n1 – 1, n2 – 1) graus de liberdade, desde que a hipótese seja verdadeira. (A prova disso está na Ref. [G3] listada no Apêndice 1.) A distribuição F com (m, n) graus de liberdade foi introduzida por R. A. Fisher 4 e tem a função de distribuição F(z) = 0 se z < 0 e z

(13)

F(z)

t(m

Kmn

2)/2

(mt

n)

(m

n) /2

dt

(z  0),

0

onde

Kmn

mm/2 nn/2 (_12 m

_n ) / (_12m) (_12n). 1 2

(Sobre

, veja o Apêndice A3.1.)



Esta longa seção apresentou as idéias e conceitos básicos de testagem, juntamente com suas aplicações típicas, e você pode talvez desejar revisá-la rapidamente antes de seguir adiante, pois as próximas seções consistem em uma Após o pioneiro trabalho do estatístico e biólogo inglês KARL PEARSON (1857–1936), o fundador da escola inglesa de estatística, e de WILLIAM SEALY GOSSET (1876–1937), que descobriu a distribuição t (e publicou-a com o nome Student), o estatístico inglês Sir RONALD AYLMER FISHER (1890–1962), professor de eugenia em Londres (1933–1943) e catedrático de genética em Cambridge, Inglaterra (1943– 1957) e em Adelaide, Austrália (1957–1962), exerceu uma grande influência sobre o desenvolvimento posterior da estatística moderna. 4

Capítulo 25: Estatística Matemática

233

adaptação dessas idéias a aplicações de grande importância prática, bem como em testes resultantes relacionados ao controle de qualidade, à aceitação (ou rejeição) de bens produzidos, e assim por diante.

PROBLEMAS PROPOSTOS 25.4 1. Teste m = 0 contra m > 0, supondo normalidade e usando a amostra 0,4 onça. Teste a hipóteseH0: s = 0,4 contra a alternativaH1: s > 1, –1, 1, 3, –8, 6, 0 (desvios de azimute [medidos em múltiplos de 0,4 (um aumento indesejável), usando uma amostra de 10 emba0,01 radiano] em determinadas revoluções de um satélite). Escolha lagens com um desvio-padrão de 0,5 onça e supondo a ocorrência a = 5%. de normalidade. (Escolhaa = 5%.) 2. Em um de seus clássicos experimentos, Buffon obteve 2048 caras 14. Suponha que, na operação de um equipamento movido à bateria ao lançar uma moeda 4040 vezes. A moeda era honesta? elétrica, seja menos caro substituir todas as baterias em intervalos fixos do que substituir cada bateria individualmente quando ela se 3. Faça o mesmo teste do Problema 2, usando o resultado de K. esgotar, desde que o desvio-padrão do tempo de vida seja inferior a Pearson, que obteve 6019 caras em 12 000 tentativas. um certo limite, digamos, inferior a 5 horas. Formule e aplique um 4. Supondo normalidade e a variância conhecidas2 = 4, teste a hipóteste apropriado, usando uma amostra de 28 valores de tempos de tese m = 30,0 contra a alternativa (a)m = 28,5, (b) m = 30,7, usando vida com um desvio-padrãos = 3,5 horas e supondo a ocorrência uma amostra de tamanho 10 com médiax– = 28,5 e escolhendo a de normalidade; escolhaa = 5%. = 5%. 5. Como pode o resultado do Problema 4(a) mudar se utiliz armos uma 15. Uma marca A de gasolina foi utilizada em 9 automóveis de um mesmo modelo sob idênticas condições. A amostra correspondente amostra menor, digamos, de tamanho 4, com os demais dadosx–(= dos 9 valores teve uma média de 20,2 e um desvio-padrão de 0,5 28,5, a = 5% etc.) permanecendo como antes? (em milhas por galão). Sob as mesmas condições, a marca B de 6. Determine o poder do teste do Problema 4(a). gasolina de alto rendimento forneceu uma amostra de 10 valo7. Qual é a região de rejeição no Problema 4 para o caso de um teste res com média 21,8 e desvio-padrão 0,6. Será a milhagem de B bilateral com a = 5%? significativamente melhor que a de A? (Teste a um nível de 5%; 8. Usando a amostra 0,80, 0,81, 0,81, 0,82, 0,81, 0,82, 0,80, 0,82, suponha a ocorrência de normalidade.) 0,81, 0,81 (comprimentos de pregos em polegadas), teste a hipótese m = 0,80 polegada (valor indicado na caixa) contra a alter- 16. As duas amostras 70, 80, 30, 70, 60, 80 e 140, 120, 130,o 120, 120, 130, 120 são valores de diferenças de temperaturas (emC) nativa m  0,80 polegada. (Suponha a ocorrência de normalidade do aço em dois estágios de moldagem, tomadas de dois diferentes e escolha a = 5%.) recipientes. Será a variância da primeira população maior que a 9. Uma firma vende óleo em latas contendo 1000 g de óleo cada, da segunda? (Suponha a ocorrência de normalidade. Escolhaa = e está interessada se o de peso significativa5%.) mente de 1000 g em saber um nível 5%,médio caso difere no qual a máquina amostras de tamanhos 10 e 16 com variânciassx2 = 50 e que preenche as latas deve ser ajustada. Escolha uma hipótese e 17. Usando sy2 = 30 e supondo a ocorrência de normalidade nas populações uma alternativa e realize o teste, supondo normalidade e usando correspondentes, teste a hipóteseH0: sx2 = sy2 contra a alternativa uma amostra de 20 latas preenchidas com uma média de 996 g e sx2 > sy2. Escolha a = 5%. um desvio-padrão de 5 g. 10. Se uma amostra de 50 pneus de um certo tipo tem uma vida média 18. Supondo a ocorrência de normalidade e –de variâncias iguais e usando amostras independentes comn1 = 9, x = 12, sx = 2, n2 = 9, y– = de 32 000 milhas e um desvio-padrão de 4000 milhas, pode o fabri15, sy = 2, teste H0: mx = my contra mx  my; escolha a = 5%. cante afirmar que a verdadeira vida média desses pneus é maior do que 30 000 milhas? Formule um teste e realize-o com as corres- 19. Mostre que, para uma distribuição normal, os dois tipos de erros pondentes hipóteses a um nível de 5%, supondo normalidade. em um teste de hipótesesH0: m = m0 contra uma alternativa H1: m = m1 podem ser feitos tão pequenos quanto necessário (embora 11. Se medidas simultâneas de tensão elétrica por dois diferentes tipos não-nulos), tomando-se para isso uma amostra suficientemente de voltímetro produzem as diferenças (em volts) 0,8, 0,2, –0,3, 0,1, grande. 0,0, 0,5, 0,7, 0,2, podemos afirmar a um nível de 5% que não há diferença significativa na calibração dos dois tipos de instrumen- 20. EXPERIMENTO DE ÁLGEBRACOMPUTACIONAL. Testes tos? (Suponha a ocorrência de normalidade.) de Médias e de Variâncias. (a)Obtenha 100 amostras de tamanho 10 cada uma com distribuição normal de média 100 e variância 25. 12. Se um medicamento-padrão cura cerca de 70% dos pacientes de Para cada amostra, teste a hipótesem0 = 100 contra a alternativa uma certa doença e um novo medicamento curou 148 dos 200 m1 > 100 no nível de a = 10%. Anote o número de rejeições da primeiros pacientes nos quais ele foi experimentado, podemos hipótese. Faça o experimento mais uma vez e compare. concluir que o novo medicamento é melhor? (Escolhaa = 5%.) 13. Suponha que, no passado, o desvio-padrão de pesos de certas (b) Elabore um experimento similar para a variância de uma disembalagens de 25,0 onças preenchidas por uma máquina foi de tribuição normal e realize-o 100 vezes.

25.5 Controle de Qualidade As idéias sobre testagem podem ser adaptadas e estendidas de diversas formas, para serem aplicadas a necessidades práticas e fundamentais em engenharia e outros campos. Mostraremos isso nas próximas seções, apresentando

234

Parte G • Probabilidade, Estatística

algumas das mais importantes tarefas que se realizam por meio de métodos estatísticos. A primeira dessas áreas de problemas que discutiremos será o controle de qualidade industrial, que é um método bastante bem-sucedido e utilizado em diversas atividades de produção. Nenhum processo produtivo é tão perfeito que resulte numa completa igualdade entre todos os produtos fabricados. Ocorrem sempre pequenas variações causadas por um grande número de fatores pequenos e incontroláveis, levando-nos a ver o processo como uma variação casual. É importante se certificar de que os produtos estejam atendendo a certos requerimentos (p. ex., de comprimento, resistência, ou qualquer outra propriedade que possa ser essencial em algum caso particular). Para esse propósito, testa-se a hipótese de que os produtos tenham a propriedade requerida, digamos, m = m0, onde m0 é um valor especificado. Se isso for feito após um lote inteiro ter sido produzido (como um lote de 100 000 parafusos), o teste irá nos informar quão bom ou ruim é o conjunto dos produtos, porém, obviamente, será muito tarde para alterar os resultados indesejáveis. Muito melhor seria realizar o teste durante o processo produtivo. Isto é o que se faz em intervalos regulares de tempo (p. ex., a cada hora ou meia hora) e é o que se chama de . Em cada vez, extrai-se uma amostra de mesmo de aqualidade tamanho, o que na prática ocorre de 3 a 10controle vezes. Se hipótese for rejeitada, paramos a produção e procuramos pela causa do problema. Se interrompermos o processo produtivo apesar de ele estar se desenrolando apropriadamente, estaremos cometendo um erro do tipo I. Se não interrompermos o processo apesar de algo estar errado, estaremos cometendo um erro do tipo II (veja a Seção 25.4). O resultado de cada teste é registrado na forma de um gráfico, chamado de gráfico de controle. Este método, proposto por W. A. Shewhart em 1924, torna o controle de qualidade algo particularmente eficaz.

Gráfico de Controle para a Média A parte superior da Fig. 536 apresenta uma ilustração e um exemplo de um gráfico de controle. Esse gráfico, que trata da média de uma variável, apresenta o limite inferior de controle LIC, a linha central de controle LC e o limite superior de controle LSC. Os dois limites de controle correspondem aos valores críticos c1 e c2 no caso (c) do Exemplo 2 na Seção 25.4. Tão logo uma média amostral saia do intervalo definido pelos limites de controle, rejeitamos a hipótese e dizemos que o processo produtivo está “fora de controle”; ou seja, dizemos que houve um deslocamento no nível do processo. Faz-se necessário tomar uma ação sempre que um ponto exceder os limites. Se escolhermos de controle muito folgados, não detectaremos desviosaonoprocesso processo. Por outro lado, se escolhermos limiteslimites de controle muito estreitos, ficará impossível dar andamento devido às freqüentes procuras por problemas inexistentes. O nível de significância usual é a = 1%. Do Teorema 1 na Seção 25.3 e da Tabela A8 do Apêndice 5, vemos que, no caso da distribuição normal, os correspondentes limites de controle para a média são

(1)

LIC

0

2,58

n

,

LSC

0

2,58

n

.

Aqui, supõe-se que o desvio-padrão s seja conhecido. Se s for desconhecido, podemos calcular os desvios-padrão das primeiras 20 ou 30 amostras e considerar que sua média aritmética é uma aproximação de s. A linha quebrada conectando as médias na Fig. 536 serve meramente para apresentar os resultados. As atividades de produção freqüentemente também empregam outros controles, mais sutis. Por exemplo, podem-se observar os movimentos das médias amostrais acima e abaixo da linha central, que devem acontecer com freqüência. Dessa forma, longas seqüências (convencionalmente de tamanho 7 ou mais) de médias, estando todas acima (ou todas abaixo) da linha central podem indicar problemas.

Gráfico de Controle para a Variância Além da média, freqüentemente controlamos a variância, o desvio-padrão ou a amplitude. Na elaboração de um gráfico de controle para a variância no caso de uma distribuição normal, podemos empregar o método do Exemplo 4 da Seção 25.4, a fim de determinarmos os limites de controle. É costumeiro usar somente um limite de controle, a saber, um limite de controle superior. Ora, do Exemplo 4 da Seção 25.4, temos que S2 = s02Y/(n – 1), onde, devido à nossa suposição de normalidade, a variável aleatória Y apresenta uma distribuição de qui-quadrado com n – 1 graus de liberdade. Logo, o limite de controle desejado é 2

(2)

LSC

n

c 1

Capítulo 25: Estatística Matemática

4,20 0,5% 4,15

LSC

ia d é 4,10 M

LC

4,05

LIC

99%

0,5% 4,00 Amostra

5

10 1%

0,04 0,0365

LSC

0,03

o rã d a p io v s e D

0,02 99%

0,01

0 Amostra

5

10

Fig. 536. Gráficos de controle para a média (parte superior da figura) e para o desvio-padrão no caso das amostras na Tabela 25.5

Tabela 25.5 Doze Amostras de Cinco Valores Cada (Diâmetro de Pequenos Cilindros, Medidos em Milímetros) Número da amostra

Valores amostrais

x

s

R

1 2

4,06 4,10

4,08 4,10

4,08 4,12

4,08 4,12

4,10 4,12

4,080 4,112

0,014 0,011

0,04 0,02

3 4

4,06 4,06

4,06 4,08

4,08 4,08

4,10 4,10

4,12 4,12

4,084 4,088

0,026 0,023

0,06 0,06

5

4,08

4,10

4,12

4,12

4,12

4,108

0,018

0,04

6

4,08

4,10

4,10

4,10

4,12

4,100

0,014

0,04

7 8

4,06 4,08

4,08 4,08

4,08 4,10

4,10 4,10

4,12 4,12

4,088 4,096

0,023 0,017

0,06 0,04

9

4,06

4,08

4,10

4,12

4,14

4,100

0,032

0,08

10

4,06

4,08

4,10

4,12

4,16

4,104

0,038

0,10

11 12

4,12 4,14

4,14 4,14

4,14 4,16

4,14 4,16

4,16 4,16

4,140 4,152

0,014 0,011

0,04 0,02

235

236

Parte G • Probabilidade, Estatística

onde c é obtido da equação P(Y

c)

,

P(Y

ouseja,

c)

1

e da tabela da distribuição do qui-quadrado (Tabela A10 no Apêndice 5) com n – 1 graus de liberdade (ou de um aplicativo computacional); aqui, a (digamos, 5% ou 1%) é a probabilidade de que, num processo se desenrolando apropriadamente, um valor observado s2 de S2 seja maior que o limite de controle superior. Se desejássemos um gráfico de controle para a variância com ambos os limites de controle superior LSC e inferior LIC, esses limites seriam 2

(3)

LIC

2

c1

n

e

1

LSC

c2

n

1

.

onde c1 e c2 são obtidos da Tabela A10 com n – 1 g.l. e das equações (4)

P(Y

c1 )

P(Y

e

2

c2 )

1

2

.

Gráfico de Controle para o Desvio-padrão Para elaborarmos um gráfico de controle para o desvio-padrão, necessitamos de um limite superior de controle (5)

c

LSC

n

1

obtido de (2). Por exemplo, na Tabela 25.5, temos n = 5. Supondo que a população correspondente seja normal com um desvio-padrão s = 0,02 e escolhendo a = 1%, obtemos da equação P (Y

c)

1

99%

e da Tabela A10 do Apêndice 5 com 4 graus de liberdade, o valor crítico c = 13,28 e de (5) o valor correspondente LSC

0,02

13,28 4

0,0365,

que é mostrado na parte inferior da Fig. 536. Um gráfico de controle para o desvio-padrão com ambos os limites de controle superior e inferior é obtido de (3).

Gráfico de Controle para a Amplitude Em vez da variância ou do desvio-padrão, freqüentemente se controla a amplitude R (= maior valor amostral menos o menor valor amostral). Pode-se mostrar que, no caso de uma distribuição normal, o desvio-padrão s é proporcional à expectativa da variável aleatória R* para a qual R é um valor observado, digamos, s = nE(R*), onde o fator de proporcionalidade n depende do tamanho amostral n e tem os valores n n

/E(R*)

n n

/E(R*)

2

3

4

5

6

7

0,89

0,59

0,49

0,43

0,40

0,37

8

9

10

0,35

0,34

0,32

12

14

16

18

20

30

40

50

0,31

0,29

0,28

0,28

0,27

0,25

0,23

0,22

Como R depende somente de dois valores amostrais, ele fornece menos informações sobre uma amostra do que o desvio-padrão s. Obviamente, quanto maior o tamanho amostral n, mais informações perdemos quando usamos R em vez de s. Uma regra prática é utilizar s quando n é superior a 10.

Capítulo 25: Estatística Matemática

237

PROBLEMAS PROPOSTOS 25.5 1. Suponha que uma máquina usada para encher latas de óleo lubriinexistente se utilizarmos (a) limites de 1 sigma, (b) limites de 2 ficante seja ajustada de tal modo que os preenchimentos formem sigmas? (Suponha a ocorrência de normalidade.) uma distribuição normal com uma média de 1 galão e um des- 12. Faça um gráfico deln = s/E(R*) como uma função den. Por que vio-padrão de 0,03 galão. Elabore um gráfico de controle do tipo ln é uma função monótona decrescente den? mostrado na Fig. 536 para controlar a média (isto é, encontrar LIC 13. (Número de defeitos) Encontre fórmulas para LSC, LC e LIC e LSC), supondo que o tamanho amostral seja 6. (correspondentes a limites de 3s) no caso de um gráfico de controle 2. (Gráfico de controle três-sigmas) No Problema 1, mostre para o número de defeitos, supondo que, num estado de controle que o requerimento do nível de significânciaa = 0,3% leva a estatístico, a fração de defeitos sejap. LIC 3 / n e LSC 3 / n, e encontre os valores 14. Na operação automática de um torno mecânico, de que modo um numéricos correspondentes. gráfico de controle de médias pode indicar o desgaste progressivo Que tamanho amostral escolher no Problema se deseda máquina? Responda a mesma questão para o caso de ocorrência 3. jarmos que LIC e LSC devemos fiquem um pouco mais próximos1 um do de uma mudança repentina na posição da máquina nessa operaoutro, digamos, LSC – LIC = 0,05, sem alterarmos o nível de ção. significância? 15. (Número de defeitos por unidade) Emprega-se o chamadográfi4. Como o significado dos limites de controle (1) muda se aplicamos co c ou gráfico de defeitos por unidadepara se fazer o controle de um gráfico de controle com esses limites ao caso de uma população um número X de defeitos por unidade (p. ex., número de defeitos que não seja normal? por 10 metros de papel, número de rebites faltando na asa de um 5. No controle da média de uma população normal, como devemos avião etc.) (a) Obtenha fórmulas para LC, LIC e LSC corresponalterar o tamanho amostral se desejamos que a diferença dentes a 3 , LSC – LIC supondo que X tenha uma distribuição de Poisson. (b) Calcule LC, caia à metade do seu valor srcinal? LIC, e LSC num processo de controle do número de imperfeições 6. Quais valores de LIC e LSC devemos usar ao invés de (1) se, ao numa folha de vidro; assuma que esse número seja em média de invés de x–, usarmos a soma x1 +    + xn dos valores amostrais? 2,5 por folha quando o processo estiver sob controle. Determine esses limites no caso da Fig. 536. 7. Numa produção de parafusos, de um lote foram tomadas dez amos- 16. (Atribuição de gráficos de controle) Vinte amostras de tamanho 100 foram tomadas de uma produção de contêineres. Nessas tras de tamanho 2. Os valores (comprimentos em mm) são os mosamostras, os números de defeitos (contêineres com vazamento) (na trados a seguir. Suponha que a população seja normal, tenha a média ordem observada) foram 27,5 e a variância 0,024. Usando (1),elabore um gráfico de controle para a média e represente as médias amostrais no gráfico. 3 7 6 1 4 5 4 9 7 0 5 6 13 4 9 0 2 1 12 8.

9. Represente graficamente as amplitudes das amostras do Problema 8, usando um gráfico de controle para amplitudes. 10. Que efeito sobre LSC – LIC ocorre se duplicarmos o tamanho

Com base na experiência, sabe-se que a fração média de defeitos é p = 5%, desde que o processo produtivo transcorra normalmente. Utilizando a distribuição binomial, elabore umgráfico de fração de defeitos (também chamado degráfico p), ou seja, escolha LIC = 0 e determine LSC para a fração de defeito (em percentual), utilizando os limites de 3 sigmas, ondes2 é a variância da variável aleatória – X = Fração de defeitos numa amostra de tamanho100. Este processo encontra-se sob controle? 17. PROJETO DE ÁLGEBRA COMPUTACIONAL. Gráficos de Controle. (a) Obtenha 100 amostras de 4 valores cada de uma distribuição normal com média 8,0 e variância 0,16, calculando suas médias, variâncias e amplitudes. (b) Use essas amostras para fazer um gráfico de controle para a média. (c) Use-as num gráfico de controle para o desvio-padrão. (d) Faça um gráfico de controle para a amplitude.

a = 1% passar para a = 5%? E se fizermos 11. amostral? Como a presença de um ponto fora dos limites de controleda média indica problemas (“o processo está fora de controle”), com que freqüência podemos cometer o engano de detectar um problema

esses gráficos, descreva propriedades quantita(e) tivasObservando dessas amostras (p. ex., diga se o asprocesso correspondente encontra-se sob controle, se as quantidades observadas variam aleatoriamente etc.).

No da Amostra

1

Comprimento

2

3

4

5

6

7

8

91

0

27,4 27,4 27,5 27,3 27,9 27,6 27,6 27,8 27,5 27,3 27,6 27,4 27,7 27,4 27,5 27,5 27,4 27,3 27,4 27,7

8. Represente graficamente as médias das seguintes 10 amostras (espessuras de arruelas, em valores codificados), usando para isso um gráfico de controle para médias, supondo que a população seja normal com média 5 e desvio-padrão 1,55. Hora

8:0 0 8:30 9:00 9:30 10:00 10:30 11:00 11:30 12:00 12:30

3 Valores 4 Amostrais 8 4

3 6 6 8

5 2 5 6

77 5 4 45

3 6

4 4 3 6

5 6 4 6

6 4 6 4

5 5 6 4

5 2 5 3

238

Parte G • Probabilidade, Estatística

25.6 Amostragem de Aceitação A amostragem de aceitação é geralmente feita quando produtos deixam a fábrica (ou, em alguns casos, ela é feita ainda dentro da fábrica). Na amostragem de aceitação, a situação mais comum ocorre quando um produtor fornece a um consumidor (comprador ou atacadista) um lote de N itens (p. ex., uma caixa de parafusos). A decisão de aceitar ou rejeitar o lote é tomada com base na determinação do número x de defeitos (= itens defeituosos) em uma amostra de tamanho n do lote. O lote é aceito se x  c, onde c é o chamado número de aceitação, correspondente ao número permitido de defeitos. Se x > c, o consumidor rejeita o lote. Obviamente, é preciso que produtor e consumidor cheguem a um acordo sobre um determinado plano amostral que forneça n e c. Da distribuição hipergeométrica, vemos que o evento A: “Aceitar o lote” tem a probabilidade (veja a Seção 24.7) c

P(A)

(1)

P(X

c)

onde M é o número de defeitos num lote de N (1) como

c

(2)

M x

N n

M x

N n

     itens. Em termos da fração de defeitos x

P(A; ) x

0

0

  N x

 

N n

N x

u = M/N, podemos escrever

N . n

P(A; u) pode assumir n + 1 valores correspondentes a u =

0, 1/N, 2/N,   , N/N; aqui, n e c são fixos. Uma curva suave e monótona passando por esses pontos é chamada de curva característica de operação (curva CO) do plano amostral considerado. EXEMPLO 1

Plano Amostral Suponha que certas lâminas de ferramentas sejam embaladas em conjuntos de 20 por caixa e que se empregue o seguinte plano amostral. Retira-se uma amostra consistindo em duas lâminas, e a caixa correspondente é aceita se e somente se ambas as lâminas da amostra forem boas. Nesse caso, N = 20, n = 2, c = 0, e (2) assume a forma (um fator 2 é eliminado) P(A; )

 20

20

  20

0

2

(20

20 )(19

20 2

20 )

380

.

Os valores de P(A, u) para u = 0, 1/20, 2/20,   , 20/20 e a curva CO resultante são mostrados na Fig. 537. (Verifique!)



Em muitos casos práticos, u será pequeno (inferior a 10%). Então, se tomarmos amostras pequenas em comparação com N, podemos aproximar (2) pela distribuição de Poisson (Seção 24.7); assim, c

(3)

P(A; )

x

e x

0

(m = nu).

x!

1

P( A; θ )

1

0,5

0 0

P( A; θ )

0,5

1

θ

Fig. 537. Curva CO do plano amostral com n = 2 e c = 0 para lotes de tamanho N = 20

0,5

0 0

0,2

θ

Fig. 538. Curva CO do Exemplo 2

Capítulo 25: Estatística Matemática

EXEMPLO 2

239

Plano Amostral. Distribuição de Poisson Suponha que para grandes lotes se utilize o seguinte plano amostral. Seleciona-se uma amostra de tamanho n = 20. Se a amostra contiver não mais que um defeito, o lote será aceito. Se ela contiver dois ou mais defeitos, o lote será rejeitado. Nesse plano, obtemos de (3), P(A; )

e

20

(1

20 ).

A curva CO correspondente é mostrada na Fig. 538.



Erros na Amostragem de Aceitação Mostremos como a amostragem de aceitação se enquadra na teoria geral de testes (Seção 25.4) e o que isso significa em termos práticos. O produtor deseja um pequeno valor para a probabilidade a de rejeição de um lote aceitável (um lote para o qual u não exceda um certo número u0 sobre o qual ambas as partes concordam). u0 é chamado de nível de qualidade aceitável (NQA). Similarmente, P (A; θ )

95% Risco do produtor α = 5%

50%

Risco do consumidor β= 15% 15%

θ1 0 θ0 = 1% = 5% Material Zona de Material bom indiferença ruim

Fig. 539. Curva CO, riscos do produtor e do consumidor

o consumidor (comprador) deseja um pequeno valor para a probabilidade b de aceitação de um lote não-aceitável (um lote para o qual u é maior ou igual a um certo número u1). u1 é chamado de percentual defeituoso de tolerância do lote (PDTL) ou nível de qualidade rejeitável (NQR). a é o chamado risco do produtor e corresponde ao erro do tipo I na Seção 25.4. Por sua vez, b é o chamado risco do consumidor e corresponde ao erro do tipo II. A Fig. 539 mostra um exemplo disso. Vemos que os pontos ( u0, 1 – a) e (u1, b) situam-se sobre a curva CO. Pode-se mostrar que, para grandes lotes, podemos escolher u0, u1 (> u0), a, b e então determinar n e c tais que a curva CO se situe bem próximo aos pontos prescritos. A Tabela 25.6 apresenta uma analogia entre a amostragem de aceitação e a testagem de hipóteses vista na Seção 25.4. Tabela 25.6 Amostragem de Aceitação e Testagem de Hipóteses

AmostragemdeAceitação

TestagemdeHipóteses

Nível de qualidade aceitável (NQA) u = u0 Tolerância percentual de defeitos do lote (TPDL) u = u1 Número admissível de defeitos c Risco a do produtor de rejeição de um lote com u  u0

Hipótese u = u0 Alternativa u = u1 Valor crítico c Probabilidade a de se cometer um erro do Tipo I

Risco b do consumidor de aceitação de um lote com u  u1

(nível de significância) Probabilidade b de se cometer um erro do Tipo II

Retificação A retificação de um lote rejeitado significa que o lote é inspecionado item por item e que todos o s itens defeituosos são removidos e substituídos por itens não-defeituosos. (Isso pode acabar sendo muito caro se o lote for barato; em casos assim, o lote pode ser vendido a um preço menor ou refugado.) Se uma produção vem a apresentar 100u% de itens defeituosos, então em K lotes de tamanho N cada, KNu dos KN itens serão defeituosos. Ora,

240

Parte G • Probabilidade, Estatística

KP(A; u) desses lotes serão aceitos. Esses lotes conterão KPNu itens defeitusos, ao passo que os lotes rejeitados e os retificados não conterão defeitos, devido à retificação. Portanto, após a retificação, a fração de defeitos em todos os K lotes é igual a KPNu/KN. Essa é a chamada qualidade média de saída (QMS); assim,

(4)

P(A; ).

QMS ( ) 1

Curva CO

0,5

LQMS 0 0

Curva QMS

θ∗

0,5

θ

1

Fig. 540. Curva CO e curva QMS para o plano amostral da Figura 537

A Fig. 540 mostra um exemplo disso. Como QMS(0) = 0 e P(A; 1) = 0, a curva QMS tem um máximo em algum u = u*, fornecendo o limite de qualidade média de saída (LQMS), correspondente à pior qualidade média que se pode esperar havendo a retificação.

PROBLEMAS PROPOSTOS 25.6 Lotesamostra de facasdesão inspecionados um plano amostral utiliza 1. uma tamanho 20 e umpor número de aceitação c = que 1. Quais são as possibilidades de se aceitar um lote com 1%, 2%, 10% de 11. defeito (lâminas cegas)? Utilize a Tabela A6 do Apêndice 5. Faça um gráfico da curva CO. 2. No Problema 1, o queacontece se o tamanho amostral for aumentado para 50? Responda primeiro por palpite e depois calcule. Faça um gráfico da curva CO e compare. 12. 3. No Problema 1, comoas probabilidades comn = 20 mudam (para cima ou para baixo) se diminuirmosc até zero? Responda primeiro 13. por palpite. 4. No Problema 1, quais são os riscos do produtor edo consumidor 14. se NQA é 1,5% e o NQR é 7,5%? 5. Grandes lotes de baterias são inspecionados de acordo com o seguinte plano. n = 30 baterias são aleatoriamente selecionadas de um lote e testadas. Se essa amostra contém no máximoc = 1 15. bateria defeituosa, o lote é aceito. Caso contrário, ele é rejeitado. Faça um gráfico da curva CO desse plano, utilizando a aproxima16. ção de Poisson.

antes.1.Calcule P(A; 0,10) e P(A; 0,20) e compare com ocomo Exemplo Amostras de 5 parafusos são selecionadas de um lote com uma fração de defeitou. O lote é aceito se a amostra contém: (a) nenhum parafuso defeituoso, (b) no máximo 1 parafuso defeituoso. Usando a distribuição binomial, encontre, represente graficamente e compare as curvas CO. Encontre os riscos num único plano amostral comn = 5 e c = 0, supondo que o NQA é u0 = 1% e o NQR é u1 = 15%. Por que é impossível para uma curva CO ter uma porção vertical separando a qualidade boa da ruim? Se, num único plano amostral para grandes lotes de velas de ignição, o tamanho amostral é 100 e desejamos que o NQA seja 5% e o risco do produtor 2%, que número de aceitaçãoc devemos escolher? (Use a aproximação normal.) Qual é o risco do consumidor no Problema 14 se desejamos que o NQR seja de 12%? Faça um gráfico e compare planos amostrais comc = 1 e valores crescentes de n, digamos, n = 2, 3, 4. (Use a distribuição bino-

umsupondo gráfico que da acurva QMS seja no Problema mial.) 6. Faça LQMS, retificação aplicada. 5. Determine o 17. Amostras de 3 fusíveis são retiradas de lotes, e um lote é aceito se 7. Repita o Problema 5 comn = 50 e c = 0. na amostra correspondente não encontrarmos mais do que 1 fusível 8. Encontre a aproximação binomial da distribuição hipergeométrica defeituoso. Critique esse plano amostral. Em particular, encontre do Exemplo 1 e compare os valores aproximado e exato. a probabilidade de aceitação de um lote que seja 50% defeituoso. (Utilize a distribuição binomial.) 9. No Exemplo 1, quais são os riscos do produtor e do consumidor se o NQA é 0,1 e o NQR é 0,6? 18. Represente graficamente a curva CO e a curva QMS para um único plano amostral e para grandes lotes comn = 5 e c = 0, e encontre 10. No Exemplo 1, calcule P(A; u) se o tamanho amostral é aumentado de n = 2 para n = 3, com os outros dados permanecendo o LQMS.

Capítulo 25: Estatística Matemática

25.7 Eficiência do Ajuste.

241

Teste 2 (Qui-quadrado)

Testar a eficiência do ajuste significa que desejamos testar que uma certa função F(x) é a função distribuição de uma distribuição da qual temos uma amostra x1,  , xn. Então, testamos se a função de distribuição amostral F (x) definida por 



F

= Soma das freqüências relativas de todos os valores amostraisj xnão excedendo x

ajusta-se a F(x) “suficientemente bem.” Se isso ocorre, aceitaremos a hipótese de que F(x) é a função de distribuição da população; caso contrário, rejeitaremos a hipótese. Esse teste é de considerável importância prática e seu caráter difere dos testes de parâmetros ( m, s2 etc.) considerados anteriormente. Para fazermos uma testagem dessa forma, temos que saber de quanto F pode diferir de F(x) se a hipótese é verdadeira. Logo, podemos primeiramente introduzir uma quantidade que mede o desvio de F em relação a F(x) e precisamos conhecer a distribuição de probabilidades dessa quantidade sob a suposição de que a hipótese seja verdadeira. Então, procedemos do seguinte modo. Determinamos um número c tal que, se a hipótese é verdadeira, um desvio maior do que c possui uma pequena probabilidade predeterminada de ocorrer. Se, não obstante, um desvio maior do que c ocorrer, teremos razão de duvidar que a hipótese seja verdadeira, de modo que a rejeitamos. Por outro lado, se o desvio não exceder c, de modo que F (x) se aproxima de F(x) suficientemente bem, então aceitamos a hipótese. Naturalmente, se aceitamos a hipótese, isso significa que não temos evidências suficientes para rejeitá-la, e isso não exclui a possibilidade de que haja outras funções que não serão rejeitadas no teste. Quanto a isso, a situação é bastante similar à da Seção 25.4. A Tabela 25.7 mostra um teste desse tipo, que foi introduzido por R. A. Fischer. Esse teste se justifica pelo fato de que, se a hipótese é verdadeira, então 02 é um valor observado de uma variável aleatória cuja função de distribuição se aproxima da distribuição de qui-quadrado com K – 1 graus de liberdade (ou K – r – 1 graus de liberdade se r parâmetros são estimados) à medida que n se aproxima do infinito. A exigência de que ao menos cinco valores amostrais pertençam a cada intervalo na Tabela 25.7 resulta do fato de que, para n finito, essa variável aleatória tem apenas aproximadamente uma distribuição de qui-quadrado. Uma prova disso pode ser encontrada na Ref. [G3] listada no Apêndice 1. Se a amostra é tão pequena que essa exigência não pode ser satisfeita, pode-se continuar com o teste, mas deve-se então usar o resultado com cuidado. 





Tabela 25.7 Teste do Qui-quadrado para a Hipótese de que F(x) seja a Função de Distribuição de uma População da qual a Amostra x1,  , xn É Extraída Passo 1 .

Subdivida o eixo x em K intervalos I1, I2,   , Ik tais que cada intervalo contenha pelo menos 5 valores da amostra dada x1,  , xn. Determine o número bj de valores amostrais no intervalo Ij, onde j = 1,   , K. Se um valor amostral se situar num ponto comum da fronteira entre dois intervalos, adicione 0,5 a cada um dos dois bj correspondentes. Passo 2 . Usando F(x), calcule a probabilidade pj de que a variável aleatória X em consideração assuma qualquer valor no intervalo Ij, onde j = 1,  , K. Calcule ej

npj.

(Este é o número de valores amostrais teoricamente esperado em Ij se a hipótese for verdadeira.) Calcule o desvio

Passo 3.

K 0

ej

j 1

Passo 4 . Passo 5 .

ej)2

(bj

2

(1)

.

Escolha um nível de significância (5%, 1%, ou outro). Determine a solução c da equação P(

2

c)

1

usando a tabela da distribuição de qui-quadrado com K – 1 graus de liberdade (Tabela A10 do Apêndice 5). Se r parâmetros de F(x) são desconhecidos e suas estimativas de máxima verossimilhança (Seção 25.2) são usadas, então utilize K – r – 1 graus de liberdade (ao invés de K – 1). Se x02  c, aceite a hipótese. Se x02 > c, rejeite-a.

242

Parte G • Probabilidade, Estatística

Tabela 25.8 Amostra de 100 Valores do Esforço de Tensão de Ruptura (em lb/in 2) de Cilindros de Concreto 320 350 370 320 400 420 390 360 370

380 340 390 350 360 400 330 390 400

340 350 390 360 350 350 360 350 360

410 360 440 340 390 370 380 370 350

380 370 330 340 400 330 350 370 380

340 350 390 350 350 320 330 350 380

360 380 330 350 360 390 360 390 360

350 370 360 390 340 380 300 370 340

320 300 400 380 370 400 360 370 330

370 420 370 340 420 370 360 340 370

340

360

390

400

370

410

360

400

340

360

D. L. IVEY, Testes de tensão de rachadura em estruturas de concreto agregado leve. Texas Transportation Institute, College Station, Texas.

EXEMPLO 1

Teste de Normalidade Teste se a população da qual a amostra na Tabela 25.8 foi extraída é normal.

Solução. A Tabela 25.8 mostra os valores (coluna por coluna) na ordem obtida no experimento. A Tabela 25.9 fornece a distribuição de freqüências, e a Fig. 541, o histograma. É difícil adivinhar o resultado do teste — o histograma lembra suficientemente bem uma curva de densidade normal ou não? As estimativas de máxima verossimilhança para m e s2 são mˆ = x– = 364,7 e s 2 = 712,9. O cálculo na Tabela 25.10 retorna o valor x02 = 2,942. É muito interessante o fato de que o intervalo 375    385 contribui com mais de 50% do valor do x02. Pelo histograma, vemos que a freqüência correspondente parece ser muito pequena. A segunda maior contribuição vem de 395    405, e o histograma mostra que a freqüência parece ser algo excessivamente grande, o que talvez não pareça óbvio por inspeção. 

Tabela 25.9 Tabela de Freqüências da Amostra da Tabela 25.8

1 Tensão de Ruptura x [lb/in2] 300 310 320 330 340 350 360 370 380 390 400 410 420 430 440

2 Freqüência Absoluta 2 0

3 Freqüência Relativa ~ f (x) 0,02 0,00

4 Freqüência Absoluta Acumulada 2 2

5 Freqüência Relativa Acumulada F(x) 0,02 0,02

0,04 0,06 0,11 0,14 0,16 0,15 0,08 0,10 0,08 0,02 0,03 0,00 0,01

6 12 23 37 53 68 76 86 94 96 99 99 100

0,06 0,12 0,23 0,37 0,53 0,68 0,76 0,86 0,94 0,96 0,99 0,99 1,00

4 6 11 14 16 15 8 10 8 2 3 0 1 0,20

0,15 ~ f (x)

0,10

0,05

0 250

300

350 2

[lb/in ]

400

450

Fig. 541. Histograma de freqüências para a amostra da Tabela 25.8

Capítulo 25: Estatística Matemática

243

Adotemos a = 5%. Como K = 10 e estimado r = 2 parâmetros, temos que utilizar a Tabela A10 do Apêndice 5 com K – r – 1 = 7 graus de liberdade. Encontramosc = 14,07 como a solução deP(x2  c) = 95%. Como x02 < c, aceitamos a hipótese de que a população é normal.

Tabela 25.10 Cálculos do Exemplo 1 xj

xj

364,7

(

xj

26,7

















325 335



325

1,49







1,49 1,11

0,0000 0,0681

335







345

1,11







0,74

0,1335















0,74 0,36





355 365







0,36 0,01

0,2296 0,3594











0,01 0,39





375 385











0,39 0,76

0,4960 0,6517

385







395

0,76







1,13

395







405

1,13







1,51

405







1,51







345 355 365 375

364,7 )

ej

26,7 •











0,0681 0,1335





























0,7764



0,8708



0,9345



Termo em (1)

bj

6,81 6,54

6 6

0,096 0,045

0,2296

9,61

11

0,201

0,3594 0,4960

12,98 13,66

14 16

0,080 0,401



0,6517 0,7764

15,57 12,47

15 8

0,021 1,602





0,8708

9,44

10

0,033





0,9345

6,37

8

0,417





1,0000

6,55

6

0,046

x02

2,942

PROBLEMAS PROPOSTOS 25.7 1. Se 100 lançamentos de uma moeda resultam em 30 caras e 70 coro- 11. as, podemos afirmar num nível de 5% que a moeda é honesta? 12. 2. Se em 10 lançamentos de uma moeda obtemos a mesma razão obtida no Problema 1 (3 caras para 7 coroas), a conclusão será a mesma que a do Problema 1? Primeiramente conjecture, depois calcule. 3. Qual deve ser o menor número de caras no Problema 1 para o qual 13. a hipótese “Moeda honesta” é ainda aceita (coma = 5%)? 4. Se, lançando-se um dado 180 vezes, suas respectivas faces ocorrerem 39, 22, 41, 26, 20 e 32 vezes, podemos dizer num nível de 5% que o dado é honesto? 5. Repita o Problema 4 considerando que a amostra seja 25, 31, 33, 27, 29, 35. 6. Um fabricante declara que, no processo de produção de facas de cozinha, somente 2,5% das facas são cegas. Teste essa afirmação contra a alternativa de que mais de 2,5% das facas são cegas, usando uma amostra de 400 facas, sendo que 17 delas são cegas. (Utilize a = 5%.) 7. Entre 13 h e 14 h em cinco dias consecutivos (de segunda a sexta14. feira) um certo posto de serviço tem 92, 60, 66, 62, e 90 clientes, respectivamente. Teste a hipótese de que o número esperado de clientes durante essa hora é o mesmo em todos os dias. (Use a = 5%.) 8. Teste a normalidade no nível de 1% usando uma amostra den = 79 valores (arredondados) da variávelx (tensão de ruptura [em kgf/mm2] de folhas de aço de 0,3 mm de espessura),a = a(x) = 15. freqüência absoluta. (Tome os dois primeiros valores juntos e também os últimos três para obterK = 5.)

Verifique os cálculos no Exemplo 1 do texto. A variável aleatóriaX = Número de acidentes por semana em uma certa fundiçãotem uma distribuição de Poisson se, em 50 semanas, 33 não apresentaram acidentes, 1 acidente ocorreu em 11 das 50 semanas, 2 acidentes em 6 dessas semanas e em nenhuma semana houve mais de 2 acidentes? (Escolhaa = 5%.) Usando a amostra dada, teste se a população correspondente tem uma distribuição Poisson.x épor o número de partículas alfa por intervalos de 7,5 sdeobservadas E. Rutherford e H. Geiger em um de seus clássicos experimentos de 1910, ea(x) é a freqüência absoluta (= número de períodos de tempo durante os quais exatamente x partículas foram observadas). (Usea = 5%.) x

0

12

a

57

203

34

56

383

525

532

408

273

x

7

8

9

10

11

12

13

a

139

45

27

10

4

2

0

Podemos afirmar que o tráfego em três pistas de uma via expressa (numa certa direção) é aproximadamente o mesmo em cada pista se um contador informa a passagem de 910, 850, 720 carros nas pistas da direita, do meio, e da esquerda, respectivamente, durante um determinado intervalo de tempo? (Usea = 5%.) Se soubermos que 25% de certas varas de aço produzidas por um processo-padrão se partirão quando submetidas a uma carga de 5000 lb, podemos declarar que um novo processo fornece essa mesma taxa de ruptura se encontrarmos que, numa amostra de x 57 58 59 60 61 62 63 64 80 varas produzidas pelo novo processo, 27 varas se quebraram a 4 10 17 27 8 9 3 1 quando sujeitas a essa carga? (Utilizea = 5%.) 9. Em uma amostra de 100 pacientes de uma certa doença, 45 são 16. Três amostras de 200 rebites cada foram selecionadas de uma grande produção de cada uma de três máquinas. Os números de homens e 55 são mulheres. Isso está de acordo com a declaração rebites defeituosos nas amostras foram 7, 8 e 12. Essa diferença é de que a doença é igualmente comum em homens e mulheres? significativa? (Usea = 5%.) Escolha a = 5%. 10. No Problema 9 encontre o menor número (> 50) de mulheres que 17. Em uma tabela de valores apropriadamente arredondados de uma leve à rejeição da hipótese nos níveis de 5%, 1%, 0,5%. função, valores pares e ímpares dos últimos algarismos decimais

244

Parte G • Probabilidade, Estatística

devem aparecer com freqüência aproximadamente igual. Teste isso para os 90 valores deJ1(x) na Tabela A1 do Apêndice 5. 18. Os 5 caixas de uma certa agência bancária são igualmente eficientes quanto ao tempo de atendimento, se durante o mesmo intervalo de tempo num certo dia eles atendem 120, 95, 110, 108, 102 clientes? (Use a = 5%.) 19. EXPERIMETO DE ÁLGEBRA COMPUTACIONAL. Gerador de Números Aleatórios. Verifique experimentalmente um gerador próprio de números aleatórios, copiando os resultados de n lançamentos de um dado honesto, com um n conveniente (p. ex., 60, ou 300, ou algo do gênero). Faça isso diversas vezes e veja se você consegue perceber alguma “não-aleatoriedade”, por exemplo, verificando se ocorrem muito poucas faces Seis, ou um número excessivo de faces pares etc., ou se seu gerador parece trabalhar apropriadamente. Elabore e realize outros tipos de checagens. 20. PROJETO DE EQUIPE. Dificuldade com Seleções Aleatórias. 77 estudantes foram convidados a escolher, de forma completa-

  , mente arbitrária, 3 números do conjunto de inteiros 11, 12, 13, 30. O surpreendente resultado foi o seguinte. Número 11 12 13 14 15 16 17 18 19 20 Freq.

11 10 20

8 13

9 21

9 16

8

Número 21 22 23 24 25 26 27 28 29 30 Freq.

12

8 15 10 10

9 12

8 13

9

Se a seleção fosse completamente aleatória, as seguintes hipóteses deveriam ser verdadeiras. (a) Os 20 números são igualmente prováveis de serem escolhidos. (b) Os 10 números pares juntos têm a mesma probabilidade dos 10 números ímpares juntos. (c) Os 6 números primos juntos têm uma probabilidade de 0,3 e os 14 outros números juntos têm uma probabilidade de 0,7. Teste essas hipóteses, usandoa = 5%. Elabore experimentos adicionais que ilustrem as dificuldades da seleção aleatória.

25.8 Testes Não-paramétricos Os testes não-paramétricos, também chamados de testes livres de distribuição, são válidos para qualquer distribuição. Logo, eles são usados em casos nos quais o tipo de distribuição é desconhecido, ou é conhecido mas não está disponível nenhum teste elaborado especificamente para ele. Nesta seção, explicaremos a idéia básica desses testes, que se baseiam na “estatística de ordenação” e são razoavelmente simples. Se for possível escolher um teste, então os testes elaborados para distribuições específicas fornecem em geral resultados melhores que os testes não-paramétricos. Por exemplo, isso inclui os testes da Seção 25.4 para a distribuição normal. Discutiremos dois testes usando alguns exemplos típicos. Quando obtemos as distribuições utilizadas no teste, é essencial que as distribuições das quais extraímos as amostras sejam contínuas. (Também é possível obter testes não-paramétricos a partir de distribuições discretas, porém isso é algo um pouco mais complicado.) EXEMPLO 1

Teste do Sinal para a Mediana A mediana de uma população é uma solução x = m da equação F(x) = 0,5, onde F é a função de distribuição da população. Suponha que oito operadores de rádio foram testados durante um mesmo período de tempo de trabalho, primeiramente em ambientes sem ar-condicionado e depois em ambientes com ar-condicionado, e as diferenças dos erros cometidos (sem ar-condicionado menos com ar-condicionado) foram 

9 4 0 6 4 0 7 11. Teste a hipótese m = 0 (isto é, a de que o ar-condicionado não exerce qualquer efeito) contra a alternativa m– > 0 (isto é, o desempenho é inferior em ambientes sem ar-condicionado). 

Solução. Adotemos o nível de significância a = 5%. Se a hipótese é verdadeira, a probabilidade p de uma diferença positiva é a mesma que a de uma diferença negativa. Logo, nesse caso, p = 0,5, e a variável aleatória X = Número de valores positivos entre n valores

apresenta uma distribuição binomial com p = 0,5. Nossa amostra possui oito valores. Omitamos os valores nulos, que não contribuem para a decisão. Então, restam seis valores, sendo todos eles positivos. Como P(X

6)

 6 6

(0,5)6(0,5)0

0,0156 1,56%

observamos, de fato, um evento cuja probabilidade de ocorrência é muito pequena caso a hipótese seja verdadeira; com efeito, 1,56% < a = 5%. Logo, afirmamos que a alternativa m > 0 é verdadeira. Ou seja, o número de erros cometidos em ambientes sem ar-condicionado é significativamente mais alto, de modo de se deve cogitar a instalação de aparelhos de ar-condicionado nas salas de trabalho.  

EXEMPLO 2

Teste para uma Tendência Arbitrária Utiliza-se uma certa máquina para cortar pedaços de arame. Cinco pedaços produzidos sucessivamente tiveram os comprimentos 29

31

28

30

32.

Capítulo 25: Estatística Matemática

245

Usando esta amostra, teste a hipótese da inexistência de tendência, ou seja, a de que máquina não tem a tendência de produzir pedaços cada vez maiores ou cada vez menores. Suponha que o tipo de máquina utilizada sugira a alternativa de haver uma tendência positiva, isto é, uma tendência de que as peças sucessivas saiam cada vez maiores.

Solução. Contemos o número de transposições na amostra, isto é, o número de vezes em que um pedaço mais comprido de arame precede um pedaço mais curto: 29 precede 28

(1 transposição),

31 precede 28 e 30

(2 transposições).

Os três valores amostrais restantes obedecem a uma ordem crescente. Logo, na amostra, há 1 + 2 = 3 transposições. Consideremos agora a variável aleatória T = Número de transposições.

Se a hipótese é verdadeira (não existe tendência), então cada uma das 5! = 120 permutações dos cinco elementos 1 2 3 4 5 tem a mesma probabilidade (1/120) de ocorrência. Arranjemos essas permutações de acordo com o seu número de transposições: T

0

12345

T

T

1

T

2

12354

12453

12543

12435 13245

12534 13254

13452 13524

21345

13425 14235

14253 14325

21354 21435

15234 21453

23145

21534

31245

23154 23415

3

etc.

24135 31254 31425 32145 41235

Disso, obtemos P(T

3)

_ _ _ _ _

1 120

4 120

9 120

15 120

29 120

24%.

Aceitamos então a hipótese, pois o que observamos foi um evento com uma probabilidade relativamente grande de ocorrer (certamente muito maior que 5%) caso a hipótese seja verdadeira. Os valores da função de distribuição de T no caso de não haver tendência são mostrados na Tabela A12 do Apêndice 5. Por exemplo, se n = 3, então F(0) = 0,167, F(1) = 0,500, F(2) = 1 – 0,167. Se n = 4, então F(0) = 0,042, F(1) = 0,167, F(2) = 0,375, F(3) = 1 – 0,375, F(4) = 1 – 0,167, e assim por diante. Nosso método e esses valores se referem a distribuições contínuas. Teoricamente, podemos então esperar que todos os valores de uma amostra sejam diferentes entre si. Na prática, alguns valores amostrais podem ainda ser iguais, devido aos arredondamentos: se m valores são iguais, adicione m(m – 1)/4 (= valor médio das transposições no caso de haver permutações de m elementos), isto é, 1/2 para cada par de valores iguais, 3/2 para cada trio etc. 

PROBLEMAS PROPOSTOS 25.8 1. O que mudaria no Exemplo 1 se tivéssemos observado somente 5 5. Os filtros de ar do tipo A são melhores que os filtros do tipoB valores positivos? E se fossem somente 4? se em 10 tentativas, A fornece um ar mais limpo do queB em 7 B fornece A em 1 caso,ose mesmos? Um de produção de tubos plástico casos, um ar mais em 2 das 2. m tentativas os resultados paralimpo A e B do sãoque praticamente = 2processo metros necessita de ajustes se, emdeuma amostrde a, 4comprimento tubos têm o comprimento exato, 15 são menores e 3 são maiores que 2 metros? 6. Em um experimento clínico, a cada um dos 10 pacientes investigados, (Use a aproximação normal da distribuição binomial.) administraram-se dois diferentes sedativos A e B. A seguinte tabela mostra o efeito (aumento do tempo de sono, medido em horas). 3. Faça os cálculos do Problema 2 sem usar o teorema do limite de Usando o teste de sinais, verifique se a diferença é significativa. DeMoivre–Laplace (visto na Seção 24.8). 4. Teste se uma chave termostática está ajustada apropriadamente 1,9 0,8 1,1 0,1 0,1 4,4 5,5 1,6 4,6 3,4 A o para 20 C contra a alternativa de que o ajuste está muito baixo. 0,7 1,6 0,2 1,2 0,1 3,4 3,7 0,8 0,0 2,0 B o Use uma amostra de 9 valores, 8 dos quais são menores que 20C o Diferença 1,2 2,4 1,3 1,3 0,0 1,0 1,8 0,8 4,6 1,4 e 1 é maior que 20 C.

246

Parte G • Probabilidade, Estatística

7. Supondo que as populações correspondentes às amostras no Pro- 14. Teste a hipótese de que, para um certo tipo de voltímetro, as leituras blema 6 sejam normais, aplique um teste apropriado à distribuição são independentes da temperaturaT [oC] contra a alternativa de normal. que elas tendem a crescer comT. Utilize uma amostra de valores obtidos pela aplicação de uma tensão constante: 8. Trinta novos empregados foram agrupados em 15 pares de níveis similares de inteligência e experiência, e receberam então um treiTemperatura T [°C] 10 20 30 40 50 namento em processamento de dados por meio de: um método Tensão Lida V [volts] 99,5 101,1 100,4 100,8 101,6 antigo (A) aplicado a uma pessoa (selecionada aleatoriamente) de cada par, e por um método novo e presumivelmente melhor 15. Num experimento de alimentação de suínos, registraram-se os (B) aplicado à pessoa restante de cada par. Teste a igualdade dos seguintes ganhos de peso [em kg] de 10 animais (apresentados métodos contra a alternativa de que (B) é melhor que (A), usando em ordem crescente de quantidade de comida oferecida por dia): as seguintes pontuações obtidas pelos empregados após o final do 20 17 19 18 23 16 25 28 24 22. período de treinamento. Teste a ausência de tendência contra a ocorrência de tendência A 60 70 80 85 75 40 70 45 95 80 90 60 80 75 65 positiva. B 65 85 85 80 95 65 100 60 90 85 100 75 90 60 80 16. Aplique o teste explicado no Exemplo 2 aos seguintes dadosx (= pressão sangüínea diastólica [em mmHg],y = peso do coração [em 9. Supondo o ocorrência de normalidade, resolva o Problema 8 usangramas] de 10 pacientes que morreram de hemorragia cerebral). do um teste apropriado da Seção 25.4. x 121 120 95 123 140 112 92 100 102 91 10. Elabore um teste de sinais para o primeiro quartilq25 (definido pela condição F(q25) = 0,25). y 521 465 352 455 490 388 301 395 375 418 11. Como procederíamos num teste de sinais se a hipótese fossem = 17. Será que um aumento na temperatura causa um aumento do rendim 0 (um número qualquer) em vez dem = 0? mento de uma reação química para a qual a seguinte amostra foi 12. Verifique a tabela no Exemplo 2 do texto. extraída? 13. Aplique o teste no Exemplo 2 para os seguintes dadosx(= conteúTemperatura [°C] 10 20 30 40 60 80 do de bissulfureto em um certo tipo de lã, medido em porcentagem Rendimento [kg/min] 0,6 1,1 0,9 1,6 1,2 2,0 do conteúdo encontrado em fibras não reduzidas;y = conteúdo de água saturada na lã, medido em porcentagem). Teste a ausência de 18. Será que a quantidadede fertilizante aumenta a produção de trigo tendência contra a ocorrência de uma tendência negativa. X [em kg/lote]? Use uma amostra de valores dispostos em ordem 





x

10

15

30

40

50

55

80

100

y

50

46

43

42

36

39

37

33

crescente de quantidade utilizada de fertilizante: 41,4

43,3

39,6

43,0

44,1

45,6

44,5

46,7.

25.9 Regressão. Ajuste de Linhas Retas. Correlação Até aqui, estivemos trabalhando com experimentos aleatórios nos quais observamos uma única quantidade (variável aleatória) e obtivemos amostras cujos valores eram número s isolados. Nesta seção, discutiremos experimentos em que observamos ou medimos duas quantidades simultaneamente, de modo a obter amostras de pares de valores (x1, y1), (x2, y2),   , (xn, yn). A maioria dessas aplicações envolvem um ou dois tipos de experimentos, como se segue.

1. Na análise de regressão, uma das duas variáveis, que chamaremos de x, pode ser considerada uma variável ordinária, pois podemos medi-la sem erros substanciais ou podemos mesmo atribuir-lhe os valores que desejarmos. x é chamada de variável independente ou, algumas vezes, de variável controlada, porque podemos controlá-la (ajustá-la aos valores que escolhermos). A outra variável, Y, é uma variável aleatória e estamos interessados em investigar a dependência de Y em relação a x. Exemplos típicos são a dependência da pressão sangüínea Y em relação à idade x de uma pessoa ou, como diremos agora, a regressão de Y sobre x, a regressão do ganho de peso Y de certos animais em relação à ração diária de comida x que lhes é dada, a regressão da condutividade térmica Y de rolhas em relação ao peso específico x das rolhas etc. 2. Na análise de correlação, ambas as quantidades são variáveis aleatórias e estamos interessados nas relações entre elas. Exemplos disso são a relação (dizemos “a correlação”) entre o desgaste X e o desgaste Y de cada um dos pneus dianteiros de automóveis, entre as notas X e Y de estudantes, respectivamente, em matemática e física, entre a dureza X de chapas de aço em seu centro e a dureza Y próximo de suas bordas etc.

Análises de Regressão Na análise de regressão, a dependência de Y em relação a x é uma dependência da média m de Y em relação a x, de modo que m = m(x) é uma função no sentido ordinário. A curva de m(x) é chamada de curva de regressão de Y sobre x.

Capítulo 25: Estatística Matemática

247

Nesta seção, discutiremos o caso mais simples, a saber, o de uma reta de regressão

(1)

(x)

0

1

x.

Neste caso, podemos desejar fazer um gráfico dos valores amostrais na forma de n pontos no plano xY, ajustar uma linha reta passando através deles e usar essa reta para estimar m(x) em valores de x que nos interessam, de forma a conhecer os valores esperados de Y correspondentes a esses x. O ajuste apenas visual dessa linha não seria um bom procedimento, devido a sua subjetividade; ou seja, pessoas diferentes indicariam resultados diferentes, particularmente se os pontos estiverem espalhados. Dessa forma, precisamos de um método matemático que forneça um resultado único e dependente apenas dos n pontos. Um procedimento amplamente utilizado é o método dos mínimos quadrados de Gauss e Legendre. Para o que devemos fazer, formularemos esse método do seguinte modo. Princípio dos Mínimos Quadrados Deve-se ajustar uma linha reta passando pelos pontos dados de tal forma que a soma dos quadrados das (direção distâncias desses pontos até a reta seja mínima, onde as distâncias são medidas na direção vertical y). (As fórmulas são dadas a seguir.)

Para que a reta seja única, precisamos de uma condição adicional. Para vermos isso, consideremos a amostra (0, 1), (0, –1). Neste caso, todas as retas y = k1x com k1 qualquer satisfazem ao princípio. (Você pode ver isso?) A seguinte suposição implicará a unicidade, conforme veremos. Suposição Geral (A1) Os valores x: x 1,   , xn em nossa amostra (x1, y1),  , ( xn, yn) não são todos iguais.

De uma dada amostra ( x1, y1),   , ( xn, y n), determinaremos agora uma linha reta pelo método dos mínimos quadrados. Escrevamos a reta como

(2)

y

k0

k1 x

e chamemo-la de linha de regressão amostral, pois ela será a contrapartida da linha de regressão populacional (1). Ora, um ponto amostral (xj, y j) tem a distância vertical (distância medida na direção y) de (2) dada por yj

( k0

y

(veja a Fig. 542).

k1xj)

y = yj

y = k 0 + k 1 xj

x

xj

Fig. 542. Distância vertical entre um ponto (xj, y j) e uma reta y = k0 + k1x

Logo, a soma dos quadrados dessas distâncias é n

(3)

q

( yj j

k0

k1xj)2.

1

No método dos mínimos quadrados, agora temos que determinar k0 e k1 de tal forma que q seja mínimo. Do cálculo, sabemos que uma condição necessária para isso é (4)

q k0

0

e

q k1

0.

248

Parte G • Probabilidade, Estatística

Veremos que, dessa condição, obtemos para a linha de regressão amostral a fórmula

(5)

y

y

k1 ( x

x ).

Aqui, x– e y– são as médias dos valores x e y de nossa amostra, ou seja, (a)

x

(b)

y

1

n

(6)

1

n

( x1





( y1





xn )



yn).



A inclinação k1 em (5) é chamada de coeficiente de regressão da amostra e é dada por

(7)

sxy . sx 2

k1

Aqui, a “covariância amostral” sxy é

(8)

n

1

sxy

n

1

(xj j

x)( yj

1



1



1

y)

n

1

n

1

xj yj j

n

1

    n

n

xi

i

yj

j 1

1

e sx2 é dada por

(9a)

sx 2

n

1

n

1

j

1

x)2

( xj

n

1

n

1

xj2

n

j 1

n

2

 

.

 

.

xj

j 1

De (5), vemos que a linha de regressão amostral passa pelo ponto ( x–, y–), que a determina, juntamente com o coeficiente de regressão (7). Podemos dizer que sx2 é a variância dos valores x, mas devemos ter em mente que x é uma variável ordinária, e não uma variável aleatória. Também precisaremos logo de

(9b)

sy 2

n

1

n

1

1

y )2

( yj

n

j 1

1



n

1

yj2 j

n

1

n

2

yj

j

1

Obtenção de (5) e (7). Diferenciando (3) e utilizando (4), primeiramente obtemos q k0 q k1

2

( yj

k0

2

xj ( yj

k1xj)

k0

0,

k1 x j )

0

onde somamos em j de 1 a n. Agora, dividimos por 2, escrevemos cada uma das duas somas como três somas e passamos para o lado direito as somas contendo yj e xjyj. Assim, obtemos as “equações normais” k0 n

(10) k0

k1 xj

xj

k1

yj xj2

xj yj.

Este é um sistema linear de duas equações com duas incógnitas k0 e k1. Seu determinante dos coeficientes é [veja (9)] n

x

2

j

xj

x

2 j

n

xj2



xj



1)sx2

n(n

n

( xj

x )2

e é diferente de zero devido à Suposição (A1). Logo, o sistema possui uma solução única. Dividindo a primeira equação de (10) por n e usando (6), obtemos k0 = y– – k1x–. Juntamente com y = k0 + k1x em (2), isso fornece (5). Para obtermos (7), resolvemos o sistema (10) pela regra de Cramer (Seção 7.6) ou por eliminação, encontrando (11)

k1

n

xj yj

xi

n(n

1) sx2

yj

.

Capítulo 25: Estatística Matemática

249

Isso fornece (7)–(9) e completa a demonstração. [A igualdade das duas expressões em (8) e em (9) pode ser demonstrada pelo leitor; veja o Problema 14.]  EXEMPLO 1

Reta de Regressão Mediu-se o decréscimo do volume y [em %] de couro para certos valores fixos de pressão x [em atmosferas]. Os resultados são mostrados nas duas primeiras colunas da Tabela 25.11. Encontre a reta de regressão de y em relação a x. Solução. Vemos que n = 4 e obtemos os valores x– = 28 000/4 = 7000, y– = 19,0/4 = 4,75, e de (9) e (8)

Tabela 25.11 Regressão do Decréscimo de Volume y [em%] do Couro em Relação à Pressão x [em Atmosferas]

Valores dados

Valores auxiliares 2

xj

yj

xj

4.000 6.000 8.000 10.000 28.000

2,3 4,1 5,7 6,9 19,0

xjyj

16.000.000 36.000.000 64.000.000 100.000.000 216.000.000



1

sx2

3

sxy

1 3

9.200 24.600 45.600 69.000 148.400 28 0002

216 000 000



148 400

 

4

20 000 000 3

28 000 19

15 400

4

3

.

Logo, k1 = 15 400/20 000 000 = 0,00077 de (7) e a reta de regressão é y

4,75

0,00077 (x

7000)

y

ou

0,000 77x

0,64.

Note que y(0) = –0,64, o que não tem significado físico, mas usualmente indica o fato de que uma relação linear é meramente uma aproximação válida de algum intervalo restrito. 

Intervalos de Confiança em Análise de Regressão Se desejarmos obter intervalos de confiança, temos de fazer suposições sobre a distribuição de Y (o que não fizemos até agora; os mínimos quadrados são um “princípio geométrico”, em nenhuma parte eles envolvem probabilidades!). Suponhamos a ocorrência de normalidade e a independência na amostragem: Suposição (A2) Para cada x fixo, a variável aleatória Y é normal e tem a média

(12)

(x)

0

1

(1), isto é,

x

e a variância s2 independente de x.

Suposição (A3) As n realizações do experimento pelo qual obtemos uma amostra (x1, y1),

(x2, y2),







,

( xn , y n )

são independentes entre si.

Em (12), k1 é chamado de coeficiente de regressão da população, pois se pode mostrar que, sob as Suposições (A1)–(A3), a estimativa de máxima verossimilhança de k1 é o coeficiente de regressão amostral k1 dado por (11). Sob as Suposições (A1)–(A3), podemos agora obter um intervalo de confiança para k1, como mostrado na Tabela 25.12.

250

Parte G • Probabilidade, Estatística

Tabela 25.12 Determinação de um Intervalo de Confiança para 1 em (1) sob as Suposições (A1)–(A3) Passo 1. Passo 2.

Escolha um nível de confiança g (95%, 99%, ou outro). Determine a solução c da equação

(13)

_(1 1 2

F(c)

)

usando a tabela de distribuição t com n – 2 graus de liberdade (Tabela A9 do Apêndice 5; n = tamanho amostral). Passo 3. Usando uma amostra (x1, y1),   , ( xn, yn), calcule (n – 1)sx2 de (9a), (n – 1)sxy de (8), k1 de (7), n

(14)

1)sy2

(n

1

yj2

n

j 1

  n

2

yj

j 1

[como em (9b)], e q0

(15) Passo 4.

1)(sy2

(n

k12 sx2).

Calcule K

q0

c

(n

2)(n

1) sx2

.

O intervalo de confiança é

(16) EXEMPLO 2

CONF {k1

K

1

k1

K}.

Intervalo de Confiança para o Coeficiente de Regressão Usando a amostra na Tabela 25.11, determine um intervalo de confiança para k1 pelo método da Tabela 25.12.

Solução. Passo 1.Adotemos g = 0,95. Passo 2.A Equação (13) toma a forma F(c) = 0,975, e a Tabela A9 do Apêndice 5 com n – 2 = 2 graus de liberdade fornece c = 4,30. Passo 3.Do Exemplo 1, temos que 3sx2 = 20 000 000 e k1 = 0,00077. Da Tabela 25.11, calculamos 192

2

3sy

102,2

4

11,95,

q0

20 000 000 0,000772

11,95 0,092.

Passo 4.Então, obtemos K

4,30

0,092/(2 20 000 000)

0,000 206

e CONF0,95 {0,00056

1

0,00098}.



Análise de Correlação Faremos agora uma introdução aos aspectos básicos da análise de correlação; as provas envolvidas nisso estão nas Refs. [G2] ou [G8] do Apêndice 1. A análise de correlação trata da relação entre X e Y em termos de uma variável aleatória bidimensional (X, Y) (Seção 24.9). Uma amostra consiste em n pares ordenados de valores (x1, y1),  , (xn, yn), como antes. A interrelação entre os valores x e y na amostra é medida pela covariância amostral sxy em (8) ou pelo coeficiente de correlação amostral

(17)

r

sxy sx sy

com sx e sy dados por (9). Aqui, r tem a vantagem de não se alterar quando os valores de x e y são multiplicados por um fator (como na conversão de pés em polegadas etc.).

Capítulo 25: Estatística Matemática

TEOREMA 1

251

Coeficiente de Correlação Amostral O coeficiente de correlação amostral r satisfaz a –1  r  1. Em particular, r valores amostrais se situam sobre uma linha reta.(Veja a Fig. 543.)

= ±1 se e somente se os

A contrapartida teórica de r é o coeficiente de correlação r de X e Y, XY

(18)

X

Y

E([X onde X E(X), Y E(Y ), X X] ), buições marginais de X e Y; veja a Seção 24.9), e sXY é 2

2

2 Y

E([Y

r=1

0

10

0

20

0

r = 0,98

10

20

r = –0,3 10

0

10

0

20

0

r = 0,6

10

20

r = –0,9

10

0

) (as médias e as variâncias das distri-

10

10

0

2

r=0

10

0

Y]

10

0

10

0

20

0

10

20

Fig. 543. Amostras com vários valores do coeficiente de correlação r

a covariância de X e Y dada por (veja a Seção 24.9)

(19)

XY

E([X

Y

X][

Y])

E(XY )

E(X)E(Y ).

O análogo ao Teorema 1 é TEOREMA 2

Coeficiente de Correlação O coeficiente de correlação r satisfaz a linearmente relacionados, isto é, se Y

–1  r  1. Em particular, r = ±1 se e somente se X e Y são X

,X

*Y

*.

Dizemos que X e Y são não-correlacionadas se r = 0. TEOREMA 3

Independência. Distribuição Normal

(a) X e Y independentes (veja a Seção 24.9) são não-correlacionados. (b) Se (X, Y) é normal (veja a seguir), então X e Y não-correlacionados são independentes. Aqui, pode-se introduzir a distribuição normal bidimensional tomando-se duas variáveis aleatórias independentes normais padronizadas X*, Y*, cuja distribuição conjunta tem assim a densidade

252

Parte G • Probabilidade, Estatística

(20)

1

ƒ*( x *, y *)

2

(x*2

e

y*2) /2

(representando uma superfície de revolução sobre o plano x*y*, cuja seção transversal é uma curva em forma de sino) e ajustando X

X

Y

Y

X

X* Y

X*

2

1

Y

Y*.

Isso fornece a distribuição normal bidimensional geral com a densidade 1

(21a)

ƒ(x, y )

2

X

2

1

Y

h(x,y) /2

e

onde

(21b)

h(x, y )

2

2

        x

1 1

X

x

2

y

X

X

X

y

Y Y

Y Y

2



.

No Teorema (3b), a normalidade é importante, como podemos ver pelo seguinte exemplo. EXEMPLO 3

Variáveis Aleatórias Dependentes porém Não-correlacionadas Se X assume os valores –1, 0, 1 com uma probabilidade de 1/3 e Y = X2, então E(X) = 0 e, em (3), XY

E(XY )

E(X 3)

(1 )3

1

1

03

3

3

13

1 3

0,

de modo que r = 0 e X e Y são não-correlacionadas. Mas elas certamente não são independentes, já que chegam mesmo a se relacionar através de uma função. 

Teste para o Coeficiente de Correlação r A Tabela 25.13 mostra um teste para r no caso da distribuição normal bidimensional. t é um valor observado de uma variável aleatória que possui uma distribuição t com n – 2 graus de liberdade. Isso foi demonstrado por R. A. Fischer (Biometrika 10 (1915), 507–521). Tabela 25.13 Teste da Hipótese  = 0 contra a Alternativa  > 0 no Caso da Distribuição Normal Bidimensional Passo 1. Passo 2.

Escolha um nível de significância a (5%, 1%, ou outro). Determine a solução c da equação P(T

c)

1

usando a distribuição t (Tabela A9 do Apêndice 5) com n – 2 graus de liberdade. Calcule r de (17), usando uma amostra (x1, y1),   , ( xn, yn) Passo 4. Calcule Passo 3.

t

r



n

2

1

r2



.

Se t  c, aceite a hipótese. Se t > c, rejeite-a.

EXEMPLO 4

 Teste o Coeficiente de Correlação Teste apara hipótese de X e Y, devida ao Teorema 3) contra a alternativar > 0, usando os dados do canto inferior esquerdo r = 0 (independência

da Fig. 543, onde r = 0,6 (erros de solda manual em 10 placas bilaterais de circuitos cometidos por 10 operários; x = frente, y = verso das placas).

Solução. Adotemos a = 5%; portanto, 1 – a = 95%. Como n = 10, n – 2 = 8, e a tabela fornece c = 1,86. Além disso, t 0,6 8/0,64 2,12 > c. Rejeitamos a hipótese e dizemos que existe uma correlação positiva. Um operário cometendo poucos (muitos) erros no lado frontal tende a cometer poucos (muitos) erros no lado reverso da placa. 

Capítulo 25: Estatística Matemática

253

PROBLEMAS PROPOSTOS 25.9 1–10

9.

RETA DE REGRESSÃO AMOSTRAL

Encontre e faça um esboço ou gráfico da reta de regressão amostral de y e x usando os dados a seguir, representados como pontos nos mesmos eixos. 1. (–1, 1), (0, 1,7), (1, 3) 2. (3, 3,5), (5, 2), (7, 4,5), (9, 3) 3. (2, 12), (5, 24), (9, 33), (14, 50) 4. (11, 22), (15, 18), (17, 16), (20, 9), (22, 10) 5. Velocidade x [mph] de um carro 30 40 50 60 Distância de parada y [ft]

150

195

240

295

Além disso, encontre a distância percorrida até parar por um carro a 35 mph. 6. x = deformação de um certo tipo de aço [em mm],y = dureza Brinell [em kgf/mm2] x

6

9

11

13

22

26

28

33

35

y

68

67

65

53

44

40

37

34

32

7. x = revoluções por minuto, y = potência de um motor diesel [em hp]

8.

x

400

500

600

700

750

y

580

1030

1420

1880

2100

Umidade do ar x [%]

10

20

30

40

Expansão da gelatina y [%]

0,8

1,6

2,3

2,8

QUESTÕES E PROBLEMAS DE REVISÃO DO 1. O que é uma amostra? Por que extraímos amostras? 2. Qual é o papel da teoria da probabilidade em estatística? 3. Obtemos melhores resultados quando extraímos maiores amostras? Explique. 4. Várias amostras de uma mesma população têm a mesma média? A mesma variância? 5. O que é um parâmetro? Como podemos estimá-lo? Dê um exemplo. 6. O que é um teste estatístico? Que erros ocorrem na testagem? 7. Como fazemos testes em controle de qualidade? 8. O que é o teste do qui-quadrado ( 2)? Dê de memória um simples exemplo. 9. O que são testes não-paramétricos? Quando podemos aplicá-los? 10. Em que testes utilizamos a distribuiçãot? E a distribuição 2? 11. O que são testes unilaterais e bilaterais? Dê exemplos típicos. 12. Liste algumas áreas de aplicação dos testes estatísticos. 13. O que queremos dizer por “eficiência do ajuste”? 14. A amostragem de aceitação utiliza os princípios da testagem. Explique. 15. O que é o poder de um teste? O que podemos fazer se o poder for baixo? 16. Explique de memória a idéia relacionada à estimativa de máxima verossimilhança. 17. De que modo o tamanho de um intervalo de confiança depende do tamanho amostral? E do nível de confiança?

x [V]

40

40

80

80

110

110

Corrente y [A]

5,1

4,8

10,0

10,3

13,0

12,7

Tensão

Além disso, encontre a resistência R [em (Seção 2.9). 10.

Força x [ lb]

24

Extensão y [in] de uma mola 4,1

] pela lei de Ohm

Ω

6 7,8

8

12,3 15,8

Encontre também a constante elástica pela lei de Hooke (Seção 2.4).

11–13 INTERVALOS DE CONFIANÇA Encontre um intervalo de confiança de 95% para o coeficiente de regressão k1, supondo que (A2) e (A3) se verifiquem e utilizando a amostra: 11. Do Problema 6 12. Do Problema 7 13. Do Problema 8 14. Obtenha a segunda expressão parasx2 em (9a) a partir da primeira. 15. EXPERIMENTO DE ÁLGEBRA COMPUTACIONAL. Mudando os Dados. Usando uma amostra (como a do Proble-

ma 6), investigue e represente graficamente o efeito obtido quando os valores de y são alterados: (a) para pequenos valores de x, (b) para grandes valores de x, (c) para valores intermediários da amostra.

CAPÍTULO 25 18. Ao estimarmos um intervalo, não seria possível fazer o erro ser zero escolhendo um nível de confiança 1? 19. O que é o princípio dos mínimos quadrados? Dê aplicações dele. 20. Qual é a diferença entre análise de correlação e análise de regressão? 21. Encontre as estimativas de máxima verossimilhança da média e da variância de uma distribuição normal utilizando a amostra 5, 4, 6, 5, 3, 5, 7, 4, 6, 5, 8, 6. 22. Determine um intervalo de confiança de 95% para a médiam de uma população normal com variâncias2 = 16, usando uma amostra de tamanho 400 com média 53. 23. O que aconteceria ao tamanho do intervalo no Problema 22 se reduzíssemos o tamanho amostral para 100? 24. Determine um intervalo de confiança de 99% para amédia de uma população normal com desvio-padrão 2,2, utilizando a amostra 28, 24, 31, 27, 22.

confiança obtemos no Problema 24 se supuserm os 25. Que que aintervalo variânciadeseja desconhecida? 26. Supondo a ocorrência de normalidade, encontre um intervalo de confiança de 95% para a variância da amostra 145,3, 145,1, 145,4, 146,2.

27–29 Encontre um intervalo de confiança de 95% para a médiam, supondo que haja normalidade e usando a amostra: 27. Conteúdo de nitrogênio [em %] do aço: 0,74, 0,75, 0,73, 0,75, 0,74, 0,72

254

Parte G • Probabilidade, Estatística

28. Diâmetros de 10 juntas com média de 4,37 cm e desvio-padrão de 39. Usando amostras de tamanhos 10 e 5 com variânciassx2 = 50 e 0,157 cm sy2 = 20 e supondo a ocorrência de normalidade nas populações correspondentes, teste a hipóteseH0: sx2 = sy2 contra a alternativa 29. Massa específica [em g/cm3] do coque: 1,40, 1,45, 1,39, 1,44, sx2 > sy2. Adote a = 5%. 1,38 30. Que tamanho amostral devemos utilizar no Problema 28 se dese- 40. Suponha que a espessura X de arruelas tenha uma distribuição 2 normal com média 2,75 mm e variância 0,00024 mm . Elabore um jamos obter um intervalo de confiança de tamanho 0,1, assumindo gráfico de controle param escolhendo a = 1% e faça um gráfico que o desvio-padrão da amostra seja (aproximadamente) o mesdas médias das cinco amostras (2,74, 2,76), (2,74, 2,74), (2,79, mo? 2,81), (2,78, 2,76), (2,71, 2,75) no gráfico. 31–32 Encontre um intervalo de confiança de 99% para a variância 41. Num gráfico de controle para a média, qual é o efeito sobre 2 s , supondo que haja normalidade e utilizando a amostra: LSC – LIC se duplicarmos o tamanho amostral? E se passarmos de a = 1% para a = 5%? 31. Dureza Rockwell de materiais de corte: 64,9, 64,1, 63,8, 64,0 2 42. As seguintes amostras de parafusos (com o comprimento em polen = 128 com variância s = 1,921 Uma amostra tamanho gadas) foram tomadas de uma produção em curso. Supondo que 32. 33. Utilizando umadeamostra de 10 valores com média 14,5 extraída de a população seja normal com uma média 3,500 e uma variância uma população normal com variâncias2 = 0,25, teste a hipótese de 0,0004, elabore um gráfico de controle para a média adotando m0 = 15,0 contra a alternativam1 = 14,4 a um nível de 5%. a = 1% e represente no gráfico as médias amostrais. 34. No Problema 33, altere a alternativa param  15,0 e faça o tesN.do Amostra a 1 2 3 4 5 6 7 8 te como antes. 35. Encontre o poder do teste no Problema 33. 3,49 3,48 3,52 3,50 3,51 3,49 3,52 3,53 Comprimento 36. Usando uma amostra de 15 valores com média 36,2 e variância 0,9, 3,50 3,47 3,49 3,51 3,48 3,50 3,50 3,49 teste a hipótese m0 = 35,0 contra a alternativam1 = 37,0, supondo 43. Um comprador confere peças usando um plano amostral único que que haja normalidade e adotandoa = 1%. utiliza um tamanho amostral de 40 e um número de aceitação de 37. Usando uma amostra de 20 valores com variância 8,25 de uma 1. Use a Tabela A6 do Apêndice 5 para calcular a probabilidade 2 população normal, teste a hipóteses0 = 5,0 contra a alternativa de aceitação de lotes contendo as seguintes porcentagens de peças defeituosas: 14 %, 12 %, 1%, 2%, 5%, 10%. Represente graficamente s12 = 8,1, adotando a = 5%. a curva CO. (Utilize a aproximação de Poisson.) 38. Uma firma vende latas de 1 kg de tinta e está interessada em saber se o peso médio difere significativamente de 1 kg, caso em 44. Terá um cortador automático a tendência de cortar pedaços de arame cada vez maiores se os comprimentos dos pedaços sucessivos que a máquina de preenchimento deve ser ajustada. Formule uma [em polegadas] valem: 10,1, 9,8, 9,9, 10,2, 10,6, 10,5? hipótese e uma alternativa e faça o teste, supondo que haja normalidade e usando uma amostra de 20 preenchimentos com média de 45. Encontre a linha de regressão de mínimos quadrados para os dados 991 g e desvio-padrão de 8 g. (Adotea = 5%.) (–2, 1), (0, 1), (2, 3), (4, 4), (6, 5).

25

RESUMO DO CAPÍTULO

Estatística Matemática Recordemos do Capítulo 24 que, a um experimento onde se observa alguma quantidade (p. ex., número de defeitos, altura de pessoas etc.), associa-se uma variável aleatória X cuja distribuição de probabilidade é dada por uma função de distribuição (1)

F(x)

P(X

(Seção 24.5)

x)

que, para cada x, fornece a probabilidade de que X assuma qualquer valor não excedendo x. Em estatística, extraímos amostras aleatórias x1,   , xn de tamanho n realizando esse experimento n vezes (Seção 25.1) e então, a partir das propriedades das amostras, tiramos conclusões sobre as propriedades da distribuição dos X correspondentes. Fazemos isso calculando estimativas pontuais , ou intervalos de confiança , ou realizando um teste para os parâmetros (m e s2 na distribuição normal, p na distribuição binomial etc.) ou um teste para funções de distribuição. Uma estimativa pontual (Seção 25.2) é um valor aproximado e obtido da amostra para um parâmetro da distribuição de X. Particularmente, a média amostral (Seção 25.1) (2)

1

x

n

n

1

xj

n

j 1

(x1







xn)

é uma estimativa da média m de X e a variância amostral (Seção 25.1) (3)

s2

n

1

n

1

(xj j 1

x)2

1

n

1

[(x1

x)2







(xn

x)2]

Capítulo 25: Estatística Matemática

255

é uma estimativa da variância s2 de X. As estimativas pontuais podem ser feitas usando-se o fundamental método de máxima verossimilhança (Seção 25.2). Os intervalos de confiança (Seção 25.3) são intervalos u1  u  u2 cujas extremidades são calculadas a partir de uma amostra tal que, com uma probabilidade g elevada, obtemos um intervalo contendo o verdadeiro valor desconhecido do parâmetro u na distribuição de X. Aqui, g é escolhido no início, usualmente valendo 95% ou 99%. Denotamos esse intervalo por CONFg {u1  u  u2}. No teste de um parâmetro, testamos uma hipótese u = u0 contra uma alternativa u = u1 e então, baseando-nos numa amostra, aceitamos a hipótese, ou rejeitamo-la em favor da alternativa (Seção 25.4). Como qualquer conclusão que fazemos acerca de X com base em amostras, isso pode envolver erros que conduzem a decisões falsas. Há uma pequena probabilidade a (cujo valor pode ser arbitrado, p. ex., 5% ou 1%) de que rejeitemos uma hipótese verdadeira, e existe uma probabilidade b (que podemos calcular e diminuir tomando amostras maiores) de que aceitemos uma hipótese falsa. a é o chamado nível de significância e 1 – b é o poder do teste. Entre um grande número de aplicações em engenharia, os testes são usados no controle de qualidade (Seção 25.5) e na amostragem de aceitação (Seção 25.6). Caso desconheçamos não apenas um parâmetro, mas o próprio tipo de distribuição de X, podemos então utilizar o teste do qui-quadrado (Seção 25.7) para testar a hipótese de que alguma função F(x) seja a função de distribuição desconhecida de X. Isso é feito pela determinação da discrepância entre F(x) e a função de distribuição F (x) de uma dada amostra. Os testes “independentes da distribuição”, ou testes não-paramétricos, são os que se aplicam a qualquer distribuição, uma vez que se baseiam em idéias combinatoriais. Esses testes são usualmente muito simples. Dois deles são discutidos na Seção 25.8. A última seção trata de amostras de pares de valores, que surgem em experimentos onde observamos simultaneamente duas quantidades. Na análise de regressão, uma das quantidades, x, é uma variável ordinária, e a outra, Y, é uma variável aleatória cuja média m depende de x, digamos, m(x) = k0 + k1x. Na análise de correlação, investiga-se a relação entre X e Y numa variável aleatória bidimensional (X, Y), notavelmente em termos do coeficiente de correlação r. 

APÊNDICE

1

Referências Referências Gerais [RG1] Abramowitz, M. and I.A. Stegun (eds.), Handbook of Mathe-

[E13] IMSL, C Library. Houston, TX: Visual Numerics, 2002. [E14] Kelley, C. T., Iterative Methods for Linear and Nonlinear

matical Functions. 10ª impressão, corrigida. Washington, DC: National Bureau of Standards. 1972 (também New York: Dover, 1965). [RG2] Cajori, F., History of Mathematics. 5th ed. Reprinted. Providence, RI: American Mathematical Society, 2002. [RG3] Courant, R. and D. Hilbert, Methods of Mathematical Physics. 2 vols. Hoboken, NJ: Wiley, 2003. [RG4] Courant, R., Differential and Integral Calculus. 2 vols. Hoboken, NJ: Wiley, 2003. [RG5] Graham, R. L. et al., Concrete Mathematics. 2nd ed. Reading, MA: Addison-Wesley, 1994. [RG6] Ito, K. (ed.), Encyclopedic Dictionary of Mathematics. 4 vols. 2nd ed. Cambridge, MA: MIT Press, 1993. [RG7] Kreyszig, E., Introductory Functional Analysis with Applications. New York: Wiley, 1989. [RG8] Kreyszig, E., Differential Geometry. Mineola, NY: Dover, 1991. [RG9] Kreyszig, E. Introduction to Differential Geometry and Riemannian Geometry. Toronto: University of Toronto Press, 1975. [RG10] Szegö, G., Orthogonal Polynomials. 4th ed. Reprinted. New

Equations. Philadelphia: SIAM, 1995. [E15] Knabner, P. and L. Angerman, Numerical Methods for Partial Differential Equations. New York: Springer, 2003. [E16] Knuth, D. E., The Art of Computer Programming. 3 vols. 3rd ed. Reading, MA: Addison-Wesley, 2005. [E17] Kreyszig, E., Introductory Functional Analysis with Applications. New York: Wiley, 1989. [E18] Kreyszig, E., On methods of Fourier analysis in multigrid theory. Lecture Notes in Pure and Applied Mathematics 157. New York: Dekker, 1994, pp. 225–242. [E19] Kreyszig, E., Basic ideas in modern numerical analysis and their srcins. Proceedings of the Annual Conference of the Canadian Society for the History and Philosophy of Mathematics. 1997, pp. 34–45. [E20] Kreyszig, E., and J. Todd, QR in two dimensions. Elemente der Mathematik 31 (1976), pp. 109–114. [E21] Mortensen, M. E., Geometric Modeling. 2nd ed. New York: Wiley, 1997. [E22] Morton, K. W., and D. F. Mayers, Numerical Solution of Partial Differential Equations: An Introduction. New York: Cambridge

York: American Mathematical Society, 2003. University Press, 1994. [RG11] Thomas, G. et al., Thomas’ Calculus, Early Transcendentals [E23] Ortega, J. M., Introduction to Parallel and Vector Solution of Linear Systems. New York: Plenum Press, 1988. Update. 10th ed. Reading, MA: Addison-Wesley, 2003. [E24] Overton, M. L., Numerical Computing with IEEE Floating Parte E. Análise Numérica (Capítulos 19–21) Point Arithmetic. Philadelphia: SIAM, 2001. [E1] Ames, W. F., Numerical Methods for Partial Differential Equa- [E25] Press, W. H. et al., Numerical Recipes in C: The Art of Scientions. 3rd ed. New York: Academic Press, 1992. tific Computing. 2nd ed. New York: Cambridge University Press, [E2] Anderson, E., et al., LAPACK User’s Guide. 3rd ed. Philadel1992. phia: SIAM, 1999. [E26] Shampine, L. F., Numerical Solutions of Ordinary Differential [E3] Bank, R. E., PLTMG. A Software Package for Solving Elliptic Equations. New York: Chapman and Hall, 1994. Partial Differential Equations: Users’ Guide 7.0. Philadelphia: [E27] Varga, R. S., Matrix Iterative Analysis. 2nd ed. New York: SIAM, 1994. Springer, 2000. [E4] Constanda, C., Solution Techniques for Elementary Partial [E28] Varga, R. S., Gers gorin and His Circles. New York: Springer, Differential Equations. Boca Raton, FL: CRC Press, 2002. 2004. [E5] Dahlquist, G. and A. Björck, Numerical Methods. Mineola, [E29] Wilkinson, J. H., The Algebraic Eigenvalue Problem. Oxford: NY: Dover, 2003. Oxford University Press, 1988. [E6] DeBoor, C., A Practical Guide to Splines. Reimpressão. New Parte F. Otimização, Grafos (Capítulos 22–23) York: Springer, 1991. [F1] Bondy, J. A., Graph Theory with Applications. Hoboken, NJ: [E7] Dongarra, J. J. et al., LINPACK Users Guide. Philadelphia: Wiley-Interscience, 2003. SIAM, 1978. (Veja também o início do Capítulo 19.) ˇ

[E8] Garbow, B. S. et al., Matrix Eigensystem Routines: EISPACK Guide Extension. Reprinted. New York: Springer, 1990. [E9] Golub, G. H. and C. F. Van Loan, Matrix Computations. 3rd ed. Baltimore, MD: Johns Hopkins University Press, 1996. [E10] Higham, N. J., Accuracy and Stability of Numerical Algorithms. 2nd ed. Philadelphia: SIAM, 2002. [E11] IMSL (International Mathematical and Statistical Libraries), FORTRAN Numerical Library. Houston, TX: Visual Numerics, 2002. (Veja também o início do Capítulo 19.) [E12] IMSL, IMSL for Java. Houston, TX: Visual Numerics, 2002.

[F2] Cook, W. J. et al., Combinatorial Optimization. New York: Wiley, 1993. [F3] Diestel, R., Graph Theory. 2nd ed. New York: Springer, 2000. [F4] Diwekar, U. M., Introduction to Applied Optimization. Boston: Kluwer, 2003. [F5] Gass, S. L., Linear Programming. Method and Applications. 3rd ed. New York: McGraw-Hill, 1969. [F6] Gross, J. T., Handbook of Graph Theory and Applications. Boca Raton, FL: CRC Press, 1999.

Referências

257

Algorithm Design: Founda[F7] Goodrich, M. T., and R. Tamassia, tions, Analysis, and Internet Examples. Hoboken, NJ: Wiley, 2002. [F8] Harary, F., Graph Theory. Reimpressão. Reading, MA: Addison-Wesley, 2000. [F9] Merris, R., Graph Theory. Hoboken, NJ: Wiley-Interscience, 2000. [F10] Ralston, A., and P. Rabinowitz, A First Course in Numerical Analysis. 2nd ed. Mineola, NY: Dover, 2001. [F11] Thulasiraman, K., and M. N. S. Swamy, Graph Theory and Algorithms. New York: Wiley-Interscience, 1992. [F12] Tucker, A., Applied Combinatorics. 4th ed. Hoboken, NJ: Wiley, 2001.

[G3] Cramér, H., Mathematical Methods of Statistics. Reprinted. Princeton, NJ: Princeton University Press, 1999. [G4] Dodge, Y., The Oxford Dictionary of Statistical Terms. 6th ed. Oxford: Oxford University Press, 2003. [G5] Gibbons, J. D., Nonparametric Statistical Inference. 4th ed. New York: Dekker, 2003. [G6] Grant, E. L. and R. S. Leavenworth, Statistical Quality Control. 7th ed. New York: McGraw-Hill, 1996. [G7] IMSL, Fortran Numerical Library. Houston, TX: Visual Numerics, 2002. [G8] Kreyszig, E., Introductory Mathematical Statistics. Principles and Methods. New York: Wiley, 1970. [G9] O’Hagan, T. et al., Kendall’s Advanced Theory of Statistics

Parte G. Probabilidade e Estatística (Capítulos Manual on24–25) Presen[G1] American Society for Testing Materials,

3-Volume Set. Kent, U.K.: Hodder Arnold, 2004. [G10] Rohatgi, V. K. and A. K. MD. E. Saleh, An Introduction to Probability and Statistics. 2nd ed. Hoboken, NJ: Wiley-Interscience, 2001.

tation of Data and Control Chart Analysis. 7th ed. Philadelphia: ASTM, 2002. [G2] Anderson, T. W., An Introduction to Multivariate Statistical Analysis. 3rd ed. Hoboken, NJ: Wiley, 2003.

2

APÊNDICE

Respostas dos Problemas de Número Ímpar Problemas Propostos 19.1 1. 0,9817 10 2, 0,1010 10 3, 0,5787 10 2, 0,1360 10 5 







3. 0,36443/(17,862  17,798)  0,36443/0,064  5,6942, 0,3644/(17,86  17,80)  0,3644/0,06  6,073,

0,364/(17,9  17,8)  3,64, impossível 12,996 0,36443(17,862  17,798) 0,36443 35,660    5,7000, 2,28 17,8622  17,7982 319,05  316,77 13,00 13,0 13 10   5,702,   5,70,  = 5,7,   5 2,28 2,28 2,3 2 7. 19,95; 0,049; 0,05013; 20, 0, 0,05 9. Neste cálculo, (b) é mais preciso que (a). 11. 0,126 10 2, 0,402 10 3; 0,267 10 6, 0,847 10 7 13. Adicione primeiro, então arredonde. 5.

   







 



a1 a 1  e1 a 1  e1 e2 e22 15.    1   a2 a 2  e2 a2 a2 a22 

 a1









a1



a1

   a1



e1



e2



portanto,          a2 a1 a2 a2 a2 









a2





e

e

a



1 2 1   ,

a2



a2





a2



 er1  er2  br1  br2

19. (a) 19/21  0,904761905, ecorte  earred.  0,1905 10 5, er,corte  er,arred.  0,2106 10 5, etc. 



Problemas Propostos 19.2 1. g  1,4 sen x, 1.37263 ( x5) 5. g  x 4  0,2; 0,20165 ( x3) 7. 2,403 ( x5, exato até 3S) 9. 0,904557 ( x3) 11. 1,834243 ( x4) 13. x0  4,5, x4  4,73004 (6S exato)   0,377964 473 15. (a) 0,5; 0,375; 0,377968; 0,377964; (b) 1/7 17. xn1  (2 xn  7/ xn2)/3, 1,912931 (  x3) 19. (a) Algoritmo de Bissecção (ƒ, a0, b0, N) Método da Bissecção Este algoritmo calcula um intervalo [ an, bn] contendo uma solução de ƒ(x)  0 (ƒ contínua) ou calcula uma solução cn, dado um intervalo inicial [ a0, b0] tal que ƒ(a0)ƒ(b0)  0. Aqui, N é determinado por (b  a)/2N  b, sendo b a precisão requerida. ENTRADA: Intervalo inicial [ a0, b0], número máximo de iterações N. SAÍDA: Intervalo [ aN, bN] contendo uma solução ou uma solução cn. Para n  0, 1, , N  1 faça:  Calcule cn  12 (an  bn).  Se ƒ(cn)  0 então SAÍDA cn. Pare. [Procedimento completo]  Senão continue.  Se ƒ(an)ƒ(cn)  0 então an1  an e bn1  cn. Senão faça a   c e b   b . n 1 n n 1 n Fim  SAÍDA [ aN, bN]. Pare. [Procedimento completo] Fim BISSECÇÃO Note que [aN, bN] fornece (aN  bN)/2 como uma aproximação do zero e (bN  aN)/2 como um limite de erro correspondente. (b) 0,739085; (c) 1,30980, 0,429494 21. 1,834243 23. 0,904557 •





Respostas dos Problemas de Número Ímpar

259

Problemas Propostos 19.3 1. L0(x)  2x  19, L1(x)  2 x  18, p1(x)  0,1082x  1,2234, p1(9,4)  2,2405 3. 0,9971, 0,9943, 0,9915 (0,9916 4D), 0,9861 (0,9862 4D), 0,9835, 0,9809 5. p2(x)  0,44304 x 2  1,30906 x  0,02322, p2(0,75)  0,70929 7. p2(x)  0,1434x 2  1,0895x, p2(0,5)  0,5089, p2(1,5)  1,3116 9. L0  16 (x  1)(x  2)(x  3), L1  12 x(x  2)(x  3), L2  12 x(x  1)(x  3), L3  16 x(x  1)(x  2); p3(x)  1  0,039740x  0,335187x 2  0,060645x 3; p3(1,5)  0,510116 (0,511828),

p3(0,5)  0,943654 (6S-exato 0,938470),

p3(2,5)  0,047993 (0,048384)

13. p2(x)  0,9461x  0,2868x(x  1)/2  0,1434x 2  1,0895x 15. 0,722, 0,786 



17. dƒ1/2

0,057 839, dƒ3/2 0,069 704, etc. Problemas Propostos 19.4 9. [ 1,39( x  5) 2  0,58( x  5) 3]   0,004 em x  5,8 (devido ao erro de arredondamento; deveria ser 0). 11. 1  54 x 2  14 x 4 13. 4  12 x 2  8 x 3, 4  12 x 2  8 x 3. Sim 15. 1  x 2, 2(x  1)  ( x  1) 2  2( x  1) 3, 1  2( x  2)  5( x  2) 2  6( x  2) 3 17. Curvatura ƒ/(1  ƒ 2)3/2  ƒ  se ƒ for pequeno 19. Use o fato de que a terceira derivada de um polinômio cúbico é constante, de modo que g  é constante por intervalos, portanto, constante por todos os lugares sob a hipótese presente. Agora integre três vezes. Problemas Propostos 19.5 1. 0,747131 3. 0,69377 (5S-exato 0,69315) 5. 1,566 (4S-exato 1,557) 7. 0,894 (3S-exato 0,908) 9. Jh/2  eh/2  1,55963  0,00221  1,55742 (6S-exato 1,55741) 11. Jh/2  eh/2  0,90491  0,00349  0,90840 (5S-exato 0,90842) 13. 0,94508, 0,94583 (5S-exato 0,94608) 15. 0,94614588, 0,94608693 (8S-exato 0,94608307) 17. 0,946083 (6S-exato) 19. 0,9774586 (7S-exato 0,9774377) 21. x  2  t, 1,098609 (7S-exato 1,098612) 23. x  12 (t  1), 0,7468241268 (10S-exato 0,7468241330) 25. (a) M2  2, M2*  14 , KM2  2/(12n2), n  183, (b) ƒ (iv)  24/ x 5, 2 m  14 27. 0,08, 0,32, 0,176, 0,256 (exato) 29. 5(0,1040  12 0,1760  13 0,1344  14 0,0384)  0,256 





Questões e Problemas de Revisão do Capítulo 19 17. 4,266, 4,38, 6,0, impossível 19. 49,980, 0,020; 49,980, 0,020008 21. 17,5565  s  17,5675 23. O mesmo de a . 25. 0,2, 0,20032, 0,200323 27. 3, 2,822785, 2,801665, 2,801386, 2,801386 29. 2,95647, 2,96087 31. 0,26, M2  6, M2*  0, 0,02  e  0, 0,24  a  0,26 33. 1,001005, 0,001476  e  0 Problemas Propostos 20.1 1. x1  2,4, x2  5,3 3. Sem solução 5. x1  2, x2  1 7. x1  6,78, x2  11,3, x3  15,82 9. x1  0, x2  t1 arbitrário, x3  5 t1  10 11. x1  t1, x2  t2, ambos arbitrários, x3  1,25t1  2,25t2 13. x1  1,5, x2  3,5, x3  4,5, x4  2,5

260

Apêndice Dois

Problemas Propostos 20.2 1 0 3 2 x1  4,2 , 1. 5 1 0 1 x2  1,3







3.

   1

0

0

6

4

3

x1 

0,5

2 3

1

0

0

1 3

0 , x2 

2,5

1 2

6

1

0

0

1 2

x3 

3,0

1

0

0

3

9

7. 6

1

0

0

–6

5.

    

6

3 , x2 

 

1

0

0

–3

3

0

0

3

2

4

9. 2

3

0

0

3

1 , x2  6

4

1

3

0

0

3

x3  2

0

0

2

3

4

x1 

4

5

0

0

5

8 , x2 

0

4

8

7

0

0

7

2

0

0

0

2

1

2

0

1

1

0

0

0

1

1

2

2

1

1

0

0

0

1

1

0

0

0

2



1

2



4

1

17. 2

3

0

7

12

2



4

6

0

5



,

x1  4 x2 

3

x1  3

2

2

1

1/5

x3 

11. 3

2

0

2

2/15

9

0

1

x1  1/30

3

13.



x3  2

6

x1 

,

x2   2

0

x3 



x4  14

19.



341 6

10

7 6

 15

4 3

1

17

3

1

2

6

3



Problemas Propostos 20.3 3. Exato 21,5, 0, 13,8 5. Exato 2, 1, 4 7. Exato 0,5, 0,5, 0,5 9. (a) x(3) [0,49982 0,50001 0,50002], (b) x(3) [0,50333 0,49985 0,49968] 11. 6, 15, 46, 96 passos; raio espectral 0,09, 0,35, 0,72, 0,85, aproximadamente 13.[1,99934 1,00043 3,99684] (Jacobi, passo 5); [2,00004 0,998059 4,00072] (Gauss-Seidel) 306  17,49, 12, 12 18k 2  4,24k, 4 k, 4 k 17.  19.  T

T

T

T

Problemas Propostos 20.4 1. 12,  62  7,87, 6, [ 16 1 56 ] 3. 14, 50   7,07, 4, [1 1 34  34 ] 5. 1,9, 1,35   1,16, 1, [0,3 0,1 0,5 1,0] 7. 6,  6, 1, [1 1 1 1 1 1] 11. A  17, A1  17, k  289 1 1 13. k  100 100 15. k  1,2 120  1,469 98 17. 46  6 17 ou 7 17 19.[0 1] , [1 0,4] , 289 21. [ 0,6 2,8] 23. 27, 748, 28375, 943656, 29070279 







T

T

T

Problemas Propostos 20.5 1. 11,4  5,4 x 5. s  675  90 t, vméd  90 km/h

3. 8,95  0,388x 9. 4  0,75 x  0,125 x 2

Respostas dos Problemas de Número Ímpar

11. 5,248  1,543 x, 3,900  0,5321x  2,021x 2 13. 2,448  16,23 x, 9,114  13,73 x  2,500 x 2, 2,270  1,466 x 1,778x 2  2,852x 3

Problemas Propostos 20.7 1. 5  l  9 3. 5, 0, 7; raios 4, 6, 6 5. l  4 i  2   0,1, l  0,1, l  9 i  2 7. t11  100, t22  t33  1 9. Ficam nos intervalos com as extremidades ajj  ( n  1)106. (Por quê?) 11. 0 não fica em nenhum disco de Gerschgorin, por (3) com >; logo, det A  l1







ln  0.

13. r(A)  Norma da soma em linha  A   max  ajk  max ( ajj  raio de Gerschgorin) j

15.

 153  12,37

17.

 122  11,05

j

k

19. 6  l  10, 8  l  8

Problemas Propostos 20.8 1. q  4, 4,493, 4,4999; e  1,5, 0,1849, 0,0206 3. q  8, 8,1846, 8,2252; e  1, 0,4769, 0,2200 5. q  4, 4,786, 4,917; e  1,63, 0,619, 0,399 7. q  5,5, 5,5738, 5,6018; e  0,5, 0,3115, 0,1899; autovalores (4S) 1,697, 3,382, 5,303, 5,618 9. y  Ax  lx, y x  lx x, y y  l2x x, e2  y y/x x  ( y x/x x)2  l2  l2  0 , 2,8993 aproxima-se de 3 (0 da matriz dada), e  1,633, , 0,7024 (Passo 8) 11. q  1, T





T

T

T

T

T

T

T









Problemas Propostos 20.9 3,500000

1,802776

1. 1,802776

6,730769

1,846154 3.

1,846154

1,769230



0

0



0,980000

0,441814

0

0,441814

0,870164

0,371803

0

0,371803

0,489836



5. Autovalores 8, 3, 1

7.

   

5,64516

2,50867

2,50867

5,307219

   

0 0,374953 ,

0 7,91494

0,374953 0,646602

0,646602

3,08458

0 18,3171

0,0312469 1,000482 0,881767 0

0,881767

0 18,3910

1,56325

3,544142

0 0,0983071 ,

0

0,0983071

1,00446

1,04762 0

0,0312469

0,396511

0

8,29042

0,360275 ,

18,3786 0,396511

8,24727

0,0600924 ,

0,360275

1,39250

0

0,0600924

1,37414

0,177669

0

8,23540

0,0100214

0,0100214 0,0571287

1,37363 0

0 7,00322

4,00088 0,0249333 0,0186419

0,0249333 , 0,0326363 0,996875 0 0

0,0186419

4,00011

0,00154782

0

0,00154782

0,996669

0,177669

0 7,00224

 

9. 0,0571287



7,45139

1,56325

7,00298

 

0,0326363 4,00034 0,00621221



0



0,00621221 , 0,996681

261

262

Apêndice Dois

Questões e Problemas de Revisão do Capítulo 20 17. [4 1 2] 19. [6 3 1] 21. Todos os elementos não-nulos dos fatores são 1. 2,8193 1,5904 0,0482 T



T

23. 1,5904

1,2048

0,0241

0,0482

0,0241

0,1205

27. 15, 89 , 8 33. 6 39. y  1,98  0,98x



(valores 4D)

29. 7, 35. 9

25. Exato [2

21 , 4

1 2]

T

31. 14, 78 , 7 37. 11,5 4,4578  51,2651 





i, 3D) 41. 2,944,6,4707, 0,028 8,3429, 0,2905S) 5, 1, 6, 1, 8; raios 2,5, 2, 1,1,1,2,5 ( l (l 4,1864, 43. Centros 1,



1,5

2,23607

0

45. 2,23607

5,8

3,1

0

3,1

6,7

  , Passo 3:

9,44973

1,06216

1,06216

4,28682

0,00308

0,00308

0,26345

0

0



Problemas Propostos 21.1 1. y  e x, 0,0382, 0,1245 (erro de x5, x10) 3. y  x  tanh x (faça y  x  u), 0,009292, 0,0188465 (erro de x5, x10) 5. y  e x, 0,001275, 0,004200 (erro de x5, x10) 7. y  1/(1  x 2/2), 0,00029, 0,01187 (erro de x5, x10) 9. y  1/(1  x 2/2), 0,03547, 0,28715 (erro de x5, x10) 11. y  1/(1  x 2/2); erro 108, 4 10 8, , 6 10 7, 105; aproximadamente 1,3 10 5 por (10) , 3) 19, 46, 85, 139, 213, 315, 454, 640, 889, 1219 13. y  xe x; erro 10 5 (para x  1, 15. y  3 cos x  2 cos2 x; erro 10 7: 0,18, 0,74, 1,73, 3,28, 5,59, 9,04, 14,33, 22,77, 36,80, 61,42 17. y  1/( x 5  1), 0,000307, 0,000259 (erro de x5, x10) 19. Os erros são para E.-C. 0,02000, 0,06287, 0,05076, E.-C. aperfeiçoado 0,000455, 0,012086, 0,009601, para RK 0,0000012, 0,000016, 0,000536. 





















Problemas Propostos 21.2 3. y  e0,1x ; erros 106 a 6 10 6 5. y  tan x; y4, , y10 (erro 10 5): 0,422798 (0,48), 0,546315 (1,2), 0,684161 (2,4), 0,842332 (4,4), 1,029714 (7,5), 1,260288 (13), 1,557626 (22) 7. RK erro menor, erro 10 5  0,4, 0,3, 0,2, 5,6 (para x  0,4, 0,6, 0,8, 1,0) 9. y4  4,229 690, y5  4,556 859, y6  5,360 657, y7  8,082 563 11. Erros entre 6 10 7 e 3 10 7. Solução e x  x  1 13. Erros 10 5 de x  0,3 a 0,7: 5, 11, 19, 31, 47 15. (a) 0, 0,02, 0,0884, 0,215 848, y4  0,417 818, y5  0,708 887 (ruim). (b) De 30–50% 2



















Problemas Propostos 21.3 3. y1  e x, y2  e x, erros variam de 0,02 a 0,23, monótona. 5. y 1  y2, y 2  4y1 , y  y1  1, 0,84, 0,52, 0,0656, 0,4720; y  cos 2x 7. y1  4 ex sen x, y2  4 ex cos x; erros de 0 até aproximadamente 0,1 9. Erros menores por um fator aproximado de 104 11. y  0,198669, 0,389494, 0,565220, 0,719632, 0,847790; y  0,980132, 0,922062, 0,830020, 0,709991, 0,568572 13. y1  e3x  e5x, y2  e3x  e5x; y1  0,1341, 0,1807, 0,1832, 0,1657, 0,1409; y2  1,348, 0,9170, 0,6300, 0,4368, 0,3054 17. Você obtém a solução exata, exceto por um erro de arredondamento [p. ex., y1  2,761 608, y(0,2)  2,7616 (exato), etc.]. Por quê? 19. y  0,198669, 0,389494, 0,565220, 0,719631, 0,847789; y  0,980132, 0,922061, 0,830019, 0,709988, 0,568568

Respostas dos Problemas de Número Ímpar

263

Problemas Propostos 21.4 3. 105, 155, 105, 115; Passo 5: 104,94, 154,97, 104,97, 114,98 5. 0,108253, 0,108253, 0,324760, 0,324760; Passo 10: 0,108538, 0,108396, 0,324902, 0,324831 7. 0, 0, 0, 0. Todas as linhas eqüipotenciais se encontram nos cantos (por quê?). Passo 5: 0,29298, 0,14649, 0,14649, 0,073245 9. 3u11  u12  200, u11  3 u12  100 11. u12  u32  31,25, u21  u23  18,75, ujk  25 nos outros 13. u21  u23  0,25, u12  u32  0,25, ujk  0 nos demais lugares 15. (a) u11  u12  66. (b) Reduza a 4 equações por simetria. u11  u31  u15  u35  92,92, u21  u25  87,45, u12  u32  u14  u34  64,22, u22  u24  53,98, 

17.

u13





u u 0 3, u11  u21  0,0849, u12  u22  0,3170, (0,1083, 0,3248 são valores 4S da solução do sistema linear 23

33

do problema.)

Problemas Propostos 21.5 5. u11  0,766, u21  1,109, u12  1,957, u22  3,293 7. A como no Exemplo 1, lados direitos2, 2, 2, 2. Solução u11  u21  1,14286, u12  u22  1,42857 11. 4u11  u21  u12  3, u11  4 u21  u22  12, u11  4 u12  u22  0, 2u21  2 u12  12 u22  14, u11  u22  2, u21  4, u12  1. Aqui, 14/3   43 (1  2,5) com 4/3 do estêncil. 13. b  [ 380 190, 190, 0] ; u11  140, u21  u12  90, u22  30 T

Problemas Propostos 21.6 5. 0,1636, 0,2545 (t  0,04, x  0,2, 0,4), 0,1074, 0,1752 ( t  0,08), 0,0735, 0,1187 (t  0,12), 0,0498, 0,0807 (t  0,16), 0,0339, 0,0548 (t  0,2; exato 0,0331, 0,0535) 7. Substancialmente menos preciso, 0,15, 0,25 ( t  0,04), 0,100, 0,163 ( t  0,08) 9. Passo 5 fornece 0, 0,06279, 0,09336, 0,08364, 0,04707, 0. 11. Passo 2: 0 (exato 0), 0,0453 (0,0422), 0,0672 (0,0658), 0,0671 (0,0628), 0,0394 (0,0373), 0 (0) ( t  0,20) 13. 0,1018, 0,1673, 0,1673, 0,1018 (t  0,04), 0,0219, 0,0355, 15. 0,3301, 0,5706, 0,4522, 0,2380 (t  0,04), 0,06538, 0,10604, 0,10565, 0,6543 (t  0,20) •





Problemas Propostos 21.7 1. Para x  0,2, 0,4 obtemos 0,012, 0,02 (t  0,2), 0,004, 0,008 (t  0,4), 0,004, 0,008 (t  0,6), etc. 3. u(x, 1)  0, 0,05, 0,10, 0,15, 0,075, 0 5. 0,190, 0,308, 0,308, 0,190 (0,178, 0,288, 0,288, 0,178 exato até 3D) ( t  0,1); 0, 0,575, 0,935, 1,135, 1,296, 1,357, ( t  0,2) 7. 0, 0,354, 0,766, 1,271, 1,679, 1,834, •











Questões e Problemas de Revisão do Capítulo 21 17. y  tan x; 0 (0), 0,10050 (0,00017), 0,20304 (0,00033), 0,30981 (0,00047), 0,42341 (0,00062), 0,54702 (0,00072) 19. 0,1003349 (0,8 10 7) 0,2027099 (1,6 10 7), 0,3093360 (2,1 10 7), 0,4227930 (2,3 10 7), 0,5463023 (1,8 10 7) 25. y(0,4)  1,822798, y(0,5)  2,046315, y(0,6)  2,284161, y(0,7)  2,542332, y(0,8)  2,829714, y(0,9)  3,160288, y(1,0)  3,557626 27. y1  3 e9x, y2  5e9x, [1,23251 2,05419], [0,506362 0,843937], , [0,035113 0,058522] 29. 1,96, 7,86, 29,46 















31. u(P11)  u(P31)  270, u(P21)  u(P13)  u(P23)  u(P33)  30, u(P12)  u(P32)  90, u(P22)  60 35. 0,06279, 0,09336, 0,08364, 0,04707 37. 0, 0,352, 0,153, 0,153, 0,352, 0 se t  0,12 e 0, 0,344, 0,166, 0,166, 0,344, 0 se t  0,24 39. 0,010956, 0,017720, 0,017747, 0,010964 se t  0,2

Problemas Propostos 22.1 3. ƒ  3( x1  2) 2  2( x2  4) 2  44. Passo 3: [2,0055 3,9975] 5. ƒ  0,5(x1  1) 2  0,7(x2  3) 2  5,8, Passo 3: [0,99406 3,0015] 7. ƒ  0,2(x1  0,2)2  x22  0,008. Passo 3: [0,493 0,011] , Passo 6: [0,203 0,004] T

T

T

T

264

Apêndice Dois

Problemas Propostos 22.2 1. x3, x4 tempo não usado em M1, M2, respectivamente 3. Não 11. ƒ máx  ƒ(0, 5)  10 13. ƒ máx  ƒ(9, 6)  36 15. ƒ mín  ƒ(3,5, 2,5)  30 17. x1/3  x2/2  100, x1 /3  x2 /6  80, ƒ  150 x1  100 x2, ƒ máx  ƒ(210, 60)  37500 19. 0,5 x1  0,75x2  45 (cobre), 0,5x1  0,25x2  30, ƒ  120 x1  100 x2, ƒ máx  ƒ(45, 30) Problemas Propostos 22.3 1. ƒ(120/11, 60/11)  480/11

3. ƒ

2100 200 ,   2/3 3



78000

5. Matrizes com Linhas 2 e 3 e Colunas 4 e 5 intercambiadas 7. ƒ(0,

5 10

)  10

9. ƒ(5, 4, 6)  478

Problemas Propostos 22.4 1. ƒ(4, 4)  72 3. ƒ(20, 30)  50 7. ƒ(1, 1, 0)  12 9. ƒ( 12 , 0, 12 )  3

5. ƒ(10, 5)  5500

Questões e Problemas de Revisão do Capítulo 22 11. Passo 5: [0,353 0,028] . Mais devagar 13. Claro! Passo 5: [1,003 1,897] 21. ƒ(2, 4)  100 23. ƒ(3, 6)  54 25. ƒ(50, 100)  150 T

T

Problemas Propostos 23.1

9.

0

0

1

1

0

0

0

1

1

0

1

15.

0

1



0

1

2

3

4



0 0



0

1

1

11. 0

0

1

1

1

0

15.

1

2

3

4

0

1

1

1

0

0

0

0

1

0

0

0

0

0

0

0

1

0

0

1

1

1

1

1

0

0

1

1

1

1



13.





Aresta

1 e 2 ic tr é 3 V

21.

4 Vértice 25. 1 2 3 4



e1

e2

e3

1

1

0

0

0

1

1

0

0

0

1

1



1

23.

e ic tr 2 é V

3

Arestas Incidentes e1, e2, e3, e4 e1 e2, e3 e4



0





8400

Respostas dos Problemas de Número Ímpar

265

Problemas Propostos 23.2 1. 4 3. 5 5. 4 9. A idéia é fazer o caminho inverso. Há um vk1 adjacente a vk e rotulado de k  1 etc. Ora, o único vértice rotulado de 0 é s. Logo, l(v0)  0 implica que v0  s, de modo que v0  v1   vk1  vk é um caminho s vk que possui um comprimento k. 15. Não; não existe modo algum de se passar por (3, 4) somente uma vez. 21. De m a 100 m, 10 m, 2,5 m, m  4,6 •







Problemas Propostos 23.3 1. (1, 2), (2, 4), (4, 3); L2  6, L3 3. (1, 2), (1, 4), (2, 3); L2  2, L3



18, L4  14 5

 5, L4 

5. (1, 4), (2, 4), (3, 4), (3, 5); L2  4, L3  3, L4  2, L5  8 7. (1, 5), (2, 3), (2, 6), (3, 4), (3, 5); L2  9, L3  7, L4  8, L5  4, L6  14

Problemas Propostos 23.4

2

1

1. 1

=3 L

12

8

3. 4 2 =

4

3

L

10

5

5. 1

2 3

5

5 6

L = 28

4

7 2

9. 1

3

4

L = 38

5

11. Sim

6,

15. G é conectado. Se G não fosse uma árvore, teria um ciclo, mas esse ciclo forneceria duas trajetórias entre

qualquer par de seus vértices, contradizendo a unicidade. 19. Se adicionarmos uma aresta ( u, v) a T, então, como T é conectado, há uma trajetória u com (u, v), forma um ciclo.



v

em T que junto

Problemas Propostos 23.5 1. (1, 2), (1, 4), (3, 4), (4, 5), L  12 3. (1, 2), (2, 8), (8, 7), (8, 6), (6, 5), (2, 4), (4, 3), L  40 5. (1, 4), (3, 4), (2, 4), (3, 5), L  20 7. (1, 2), (1, 3), (1, 4), (2, 6), (3, 5), L  32 11. Se G é uma árvore. 13. Uma arborescência mínima do máximo grafo conectado que contenha o vértice 1. Problemas Propostos 23.6 1. 1  2  5, ƒ  2; 1  4  2  5, ƒ  2, etc. 3. 1  2  4  6, ƒ  2; 1  2  3  5  6, ƒ  1, etc. 5. ƒ 12  4, ƒ13  1, ƒ14  4, ƒ42  4, ƒ43  0, ƒ25  8, ƒ35  1, ƒ  9 7. ƒ 12  4, ƒ13  3, ƒ24  4, ƒ35  3, ƒ54  2, ƒ46  6, ƒ56  1, ƒ  7 9. {4, 5, 6}, 28 11. {2, 4, 6}, 50 13. 1  2  3  7, ƒ  2; 1  4  5  6  7, ƒ  1; 1  2  3  6  7, ƒ  1; ƒmáx  14 15. {3, 5, 7}, 22 17. S  {1, 4}, cap (S, T)  6  8  14 19. Se ƒij  cij bem como ƒij  0

Problemas Propostos 23.7 3. (2, 3) e (5, 6) 5. 1  2  5, t 2; 1  4  2  5, t 1; ƒ  6  2  1  9 7. 1  2  4  6, t 2; 1  3  5  6, t 1; ƒ  4  2  1  7 9. Considerando somente as arestas com uma extremidade rotulada e a outra não. 17. S  {1, 2, 4, 5}, T  {3, 6}, cap (S, T)  14

266

Apêndice Dois

Problemas Propostos 23.8 1. Não 3. Não 5. Sim, S  {1, 4, 5, 8} 7. Sim; um gráfico não é bipartido se ele possui um subgrafo não-bipartido. 9. 1  2  3  5 11. (1, 5), (2, 3) por inspeção. A trajetória de aumento 1  2  3  5 fornece 1  2  3  5, ou seja, (1, 2), (3, 5). 13. (1, 4), (2, 3), (5, 7) por inspeção. Ou (1, 2), (3, 4), (5, 7) usando a trajetória 1  2  3  4. 15. 3 19. 3 23. Não; K5 não é planar. 25. K3

Questões e Problemas de Revisão do Capítulo 23





0

1

0

13. 0

0

1

1

0

0

0

1

0

1

0

0

1

0

17.



15.

1

0

0

1

0

0

0

0

Vértice 21.



1

0

1

1

0

1

0

0

1

0

1

1

0

1

0

1



2

19. 3

Arestas Incidentes

1 2 3



0

23. 4

e2, e3 e1, e3 ‘e1, e2

25. 4 29. 1  4  3  2, L  16

27. L2  10, L3  15, L4  13 33. ƒ  7

Problemas Propostos 24.1 1. qL  19, qM  20, qU  20,5 5. qL  69,7, qM  70,5, qU  71,2 9. qL  399, qM  401, qU  401 13. x  70,49, s  1,047, IQR  1,5 17.0 0 300

3. qL  38, qM  44, qU  54 7. qL  2,3, qM  2,4, qU  2,45 11. x  19,875, s  0,835, IQR  1,5 15. x  400,4, s  1,618, IQR  2 19. 3,54, 1,29

Problemas Propostos 24.2 1. 4 resultados: HH, HT, TH, TT (H  Cara, T  Coroa) , (6, 6) 3. 6 2  36 resultados (1, 1), (1, 2), 5. Número infinito de resultados. S, ScS, ScScS, ( S  “Seis”) 7. O espaço de trios ordenados de números não-negativos. 9. O espaço de pares ordenados. •







11. Sim 13. E  { S, ScS, ScScS}, Ec  { ScScScS, ScScScScS,

Problemas Propostos 24.3 90 1. (a) 0,93  72,9%, (b) 100 3.

490 500



5. 1 

489 499 1 25





488 498



0,96

487 497



486 496





89 99



88 98











} ( S  “Seis”)



72,65%

90,35% 7. 1  0,752  0,4375  0,5

9. P(MMM)  P(MMFM)  P(MFMM)  P(FMMM) 

1 8



3



1 16



5 16

Respostas dos Problemas de Número Ímpar

11.

6 36



27 36



3 36



30 36

pelo Teorema 3 ou contando os resultados

13. 0,08  0,04  0,08 0,04  11,68% 15. 0,954  81,5% 

Problemas Propostos 24.4 3. De 40320 maneiras 7. 210, 70, 112, 28 11. ( 52 13 )  635013559600 15. 676000

17. 1  0,974  11,5%

5. ( 203 )  1140 9. 9!/(2!3!4!)  1260. Resp. 1/1260 13. 1/84, 5/21

Problemas Propostos 24.5 1. k  1/55 por (6) 5. Não, por causa de (6) 9. P(X  1200) 



3. k  1/8 por (10) 7. 1  P(X  3)  0,5

2

6[0,25  ( x  1,5)2] dx  0,896. Resp. 0,8963  72%

1,2

11. k  2,5; 50% 17. X  b, X  b, X  c, X  c, etc.

13. k  1,1565; 26,9%

Problemas Propostos 24.6 1. 2/3, 1/18 5. 4, 16/3 9. m  1/ u  25; P  20,2%

3. 3,5, 2,917 7. $643,50 1 , ( X  1 )20  11. 12 , 20 2

13. 750, 1, 0,002

15. 15 c  500 c 3  0,97, c  0,0855

Problemas Propostos 24.7 1. 0,0625, 0,25, 0,9375, 0,9375 3. 64% 5. 0,265 7. ƒ( x)  0,5 xe0,5/x!, ƒ(0)  ƒ(1)  e0,5(1,0  0,5)  0,91. Resp. 9% 9. 1  e0,2  18% , 135 , 30 , 1 13. 120 286 286 286 286

Problemas Propostos 24.8 1. 0,1587, 0,6306, 0,5, 0,4950 5. 16% 9. Aproximadamente 23 13. t  1084 horas

11. 0,99100  36,6%

3. 17,29, 10,71, 19,152 7. 31,1%, 95,5% 11. Aproximadamente 58%

Problemas Propostos 24.9 1. 1/8, 3/16, 3/8 3. 2/9, 2/9, 1/2 5. ƒ 2( y)  1/( b2  a2) se a2  y  b2 e 0 em qualquer outro lugar 7. 27,45 mm, 0,38 mm 9. 25,26 cm, 0,0078 cm 13. Independente, ƒ1(x)  0,1 e0,1x se x  0, ƒ2( y)  0,1 e0,1y se y  0, 36,8% 15. 50% 17. Não Questões e Problemas de Revisão do Capítulo 24 21. Q1  22,3, Q2  23,3, Q3  23,5 23. x  22,89, s  1,028, s 2  1,056 25. CA, COCA, COCOCA, etc. 27. ƒ(0)  0,80816, ƒ(1)  0,18367, ƒ(2)  0,00816 29. Sempre B  A  B. Se também A  B, então B  A  B, etc. 31. 7/3, 8/9 33. 118,019, 1,98, 1,65% 35. 0, 2 37. m  100/30 39. 16%, 2.3% (veja Fig. 520 na Seção 24.8)

267

268

Apêndice Dois

Problemas Propostos 25.2 3. l  pk(1  p)nk, pˆ  k/n, k  número de sucessos em n tentativas 5. 11/20 7. l  ƒ( x), (ln l)/p  1/ p  ( x  1)/(1  p)  0, pˆ  1/ x ˆ  x 9. m 11. uˆ  n /  xj  1 / x 13. uˆ  1 15. Variabilidade maior do que talvez o esperado Problemas Propostos 25.3 1. CONF0,95 {37,47  m  43,87} 5. 4, 16 9. CONF0,99{20,07  m  20,33} 2

3. Menor por um fator 2  7. Cf. Exemplo 2. n  166 11. CONF0,99{63,71  m  66,29}



13. c  1,96, x  87, s  87 413/500  71,86, k  cs/n  CONF0,95 {86  m  88}, CONF0,95{0,17  p  0,18}  0,743, 2 15. CONF0,95{0,00045  s  0,00131} 17. CONF0,95{0,73  s2  5,19} 19. CONF0,95{23  s2  548}. Logo, seria desejável uma amostra maior. 21. Distribuições normais, médias 27, 81, 133; variâncias 16, 144, 400 23. Z  X  Y é normal com média 105 e variância 1,25. Resp. P(104  Z  106)  63%

Problemas Propostos 25.4 1. t   7 (0,286  0)/4,31  0,18  c  1,94; não rejeitar a hipótese. 3. c  6090  6019; não rejeitar a hipótese. 5. s2/n  1, c  28,36; não rejeitar a hipótese. 7. m  28,76 ou m  31,24 9. Alternativa m  1000, t   20 (996  1000)/5  3,58  c   2,09 (Tabela A9, 19 graus de liberdade). Rejeitar a hipótese m  1000 g. 11. Testar m  0 contra m  0, t  2,11  c  2,36 (7 graus de liberdade). Não rejeitar a hipótese. 13. a  5%, c  16,92  9 0,5 2/0,42  14,06; não rejeitar a hipótese. 15. t0  10 9 17/19 (21,8  20,2)/ 9 0,6 2 8  0,52  6,3  c  1,74

 











graus de liberdade). Rejeitar a hipótese e declarar que B é melhor. 17. (17 v0  50/30  1,67  c  2,59 [(9, 15) graus de liberdade]; não rejeitar a hipótese. Problemas Propostos 25.5 1. LIC  1  2,58 0,03/6   0,968, LSC  1,032 3. n  10 5. Escolher um tamanho amostral 4 vezes maior (por quê?). 0,024/2  0,283, LSC  27,783, LIC  27,217 7. 2,58 11. Em 30% (5%) dos casos, aproximadamente. 13. LSC  np  3 np(1  p), LC  np, LIC  np  3 np(1  p) 15. LC  m  2,5, LSC  m  3 m   7,2, LIC  m  3 m  é negativo em (b) e fazemos LIC 





Problemas Propostos 25.6 1. 0,9825, 0,9384, 0,4060 5. P(A; u)  e30u(1  30 u) 7. P(A; u)  e50u 11. (1  u)5, (1  u)5  5 u(1  u)4 





15. (1((9 17.  1 )312 3 2

1 



1 )2  0,12)) 1 )/(1 12(1 2 2

2 1 2

3. 0,8187, 0,6703, 0,1353 9. 19,5%, 14,7% 13. Porque n é finito 



0,22 (se c

9)

Problemas Propostos 25.7 1. x02  (30  50) 2/50  (70  50) 2/50  16  c  3,84; não 3. 41 5. x02  2,33  c  11,07. Sim 7. ej  npj  370/5  74, x02  984/74  13,3, c  9,49. Rejeitar a hipótese. 9. x02  1  3,84; sim

 0.

Respostas dos Problemas de Número Ímpar

269

13. Combinando os resultados para x  10, 11, 12, temos K  r  1  9 (r  1 visto que estimamos a média, 10094  3,87). x02  12,98  c  16,92. Não rejeitar. 2608 15. x02  49/20  49/60  3,27  c  3,84 (1 grau de liberdade, a  5%), o que corrobora o enunciado. 17. 42 dígitos pares, aceitar.

Problemas Propostos 25.8 3. ( 12 )18(1  18  153  816)  0,0038 5. Hipótese: A e B são igualmente bons. Então, a probabilidade de que pelo menos 7 tentativas sejam favoráveis a A é de 182  8 182  3,5%. Rejeitar a hipótese. 7. Hipótese m  0. Alternativa m  0, x  1,58, t   10 1,58/1,23  4,06  c  1,83 (a  5%). Hipótese rejeitada. 



9. x  9,67, s  11,87, ~t0  9,67/(11,87/15 )  3,15  c  1,76 (a  5%). Hipótese rejeitada. 11. Considere yj  xj  m 0. 13 P(T  2)  0,1% da Tabela A12. Rejeitar. 15. P(T  15)  10,8%. Não rejeitar. 17. P(T  2)  2,8%. Rejeitar. .

Problemas Propostos 25.9 1. y  1,9  x 3. y  6,7407  3,068 x 5. y  4  4,8 x, 172 ft 7. y  1146  4,32 x 9. y  0,5932  0,1138 x, R  1/0,1138 11. q0  76, K  2,36 76/(7  944)  0,253, CONF0,95{1,58  k1  1,06} 13. 3 sx2  500, 3sxy  33,5, k1  0,067, 3sy2  2,268, q0  0,023, K  0,021 CONF0,95{0,046  k1  0,088}





Questões e Problemas de Revisão do Capítulo 25 ~2  1,722 21. mˆ  5,33, s 23 . Dobrará. 25. CONF0,99{19,1  m  33,7} 27. CONF0,95{0,726  m  0,751} 29. CONF0,95{1,373  m  1,451} 31. CONF0,99{0,05  s2  10}

14,74  14,40 33. c  14,74  14,5; rejeitar m0. 35.  0,025 37. 30,14/3,8  7,93  8,25. Rejeitar. 39. v0  2,5  6,0 [(9, 4) graus de liberdade]; aceitar a hipótese. 41. Diminuir por um fator de 2 . Por um fator de 2,58/1,96  1,32. 43. 0,9953, 0,9825, 0,9384, etc. 45. y  1,70  0,55x

  



0,9842

5

APÊNDICE

Tabelas Para as Tabelas de Transformadas de Laplace, veja as Seções 6.8 e 6.9. Para as Tabelas de Transformadas de Fourier, veja a Seção 11.10. Se você dispõe de um Sistema de Álgebra Computacional (SAC), possívelmente não precisará das tabelas aqui mostradas, embora eventualmente elas possam lhe ser convenientes. Tabela A5 Distribuição Binomial Funções de Probabilidade ƒ(x) [veja (2), Seção 24.7] e a função de distribuição F(x) p n

x

ƒ(x)



F(x)

0,

1

2

3

4

5

6

7

8

p

0,1

ƒ(x)



p

0,2

F(x)

0,

ƒ(x)



p

0,3

F(x)

0,

ƒ(x)



p

0,4

F(x)

0,

ƒ(x)



0,5

F(x)

0,

0 1

9000 1000

0,9000 1,0000

8000 2000

0,8000 1,0000

7000 3000

0,7000 1,0000

6000 4000

0,6000 1,0000

5000 5000

0,5000 1,0000

0 1 2

8100 1800 0100

0,8100 0,9900 1,0000

6400 3200 0400

0,6400 0,9600 1,0000

4900 4200 0900

0,4900 0,9100 1,0000

3600 4800 1600

0,3600 0,8400 1,0000

2500 5000 2500

0,2500 0,7500 1,0000

0 1 2 3

7290 2430 0270 0010

0,7290 0,9720 0,9990 1,0000

5120 3840 0960 0080

0,5120 0,8960 0,9920 1,0000

3430 4410 1890 0270

0,3430 0,7840 0,9730 1,0000

2160 4320 2880 0640

0,2160 0,6480 0,9360 1,0000

1250 3750 3750 1250

0,1250 0,5000 0,8750 1,0000

0 1 2 3 4

6561 2916 0486 0036 0001

0,6561 0,9477 0,9963 0,9999 1,0000

4096 4096 1536 0256 0016

0,4096 0,8192 0,9728 0,9984 1,0000

2401 4116 2646 0756 0081

0,2401 0,6517 0,9163 0,9919 1,0000

1296 3456 3456 1536 0256

0,1296 0,4752 0,8208 0,9744 1,0000

0625 2500 3750 2500 0625

0,0625 0,3125 0,6875 0,9375 1,0000

0 1 2 3 4 5

5905 3281 0729 0081 0005 0000

0,5905 0,9185 0,9914 0,9995 1,0000 1,0000

3277 4096 2048 0512 0064 0003

0,3277 0,7373 0,9421 0,9933 0,9997 1,0000

1681 3602 3087 1323 0284 0024

0,1681 0,5282 0,8369 0,9692 0,9976 1,0000

0778 2592 3456 2304 0768 0102

0,0778 0,3370 0,6826 0,9130 0,9898 1,0000

0313 1563 3125 3125 1563 0313

0,0313 0,1875 0,5000 0,8125 0,9688 1,0000

0 1 2 3 4 5 6

5314 3543 0984 0146 0012 0001 0000

0,5314 0,8857 0,9841 0,9987 0,9999 1,0000 1,0000

2621 3932 2458 0819 0154 0015 0001

0,2621 0,6554 0,9011 0,9830 0,9984 0,9999 1,0000

1176 3025 3241 1852 0595 0102 0007

0,1176 0,4202 0,7443 0,9295 0,9891 0,9993 1,0000

0467 1866 3110 2765 1382 0369 0041

0,0467 0,2333 0,5443 0,8208 0,9590 0,9959 1,0000

0156 0938 2344 3125 2344 0938 0156

0,0156 0,1094 0,3438 0,6563 0,8906 0,9844 1,0000

0 1 2 3 4 5 6

4783 3720 1240 0230 0026 0002 0000

0,4783 0,8503 0,9743 0,9973 0,9998 1,0000 1,0000

2097 3670 2753 1147 0287 0043 0004

0,2097 0,5767 0,8520 0,9667 0,9953 0,9996 1,0000

0824 2471 3177 2269 0972 0250 0036

0,0824 0,3294 0,6471 0,8740 0,9712 0,9962 0,9998

0280 1306 2613 2903 1935 0774 0172

0,0280 0,1586 0,4199 0,7102 0,9037 0,9812 0,9984

0078 0547 1641 2734 2734 1641 0547

0,0078 0,0625 0,2266 0,5000 0,7734 0,9375 0,9922

7 0 1 2 3 4 5 6 7 8

0000 4305 3826 1488 0331 0046 0004 0000 0000 0000

1,0000 0,4305 0,8131 0,9619 0,9950 0,9996 1,0000 1,0000 1,0000 1,0000

0000 1678 3355 2936 1468 0459 0092 0011 0001 0000

1,0000 0,1678 0,5033 0,7969 0,9437 0,9896 0,9988 0,9999 1,0000 1,0000

0002 0576 1977 2965 2541 1361 0467 0100 0012 0001

1,0000 0,0576 0,2553 0,5518 0,8059 0,9420 0,9887 0,9987 0,9999 1,0000

0016 0168 0896 2090 2787 2322 1239 0413 0079 0007

1,0000 0,0168 0,1064 0,3154 0,5941 0,8263 0,9502 0,9915 0,9993 1,0000

0078 0039 0313 1094 2188 2734 2188 1094 0313 0039

1,0000 0,0039 0,0352 0,1445 0,3633 0,6367 0,8555 0,9648 0,9961 1,0000

271

Tabelas

Tabela A6 Distribuição de Poisson Função de Probabilidade ƒ(x) [veja (5), Seção 24.7] e a função de distribuição F(x) m 

x

ƒ(x)

m 

0,1

F(x)

0,

m 

0,2

ƒ(x)

F(x)

0,

m 

0,3

ƒ(x)

F(x)

0,

m 

0,4

ƒ(x)

F(x)

0,

0,5

ƒ(x)

F(x)

0,

0

9048

0,9048

8187

0,8187

7408

0,7408

6703

0,6703

6065

0,6065

1

0905

0,9953

1637

0,9825

2222

0,9631

2681

0,9384

3033

0,9098

2

0045

0,9998

0164

0,9989

0333

0,9964

0536

0,9921

0758

0,9856

3

0002

1,0000

0011

0,9999

0033

0,9997

0072

0,9992

0126

0,9982

4

0000

1,0000

0001

1,0000

0003

1,0000

0007

0,9999

0016

0,9998

0001

1,0000

0002

1,0000

5 m 

x

ƒ(x)

m 

0,6

F(x)

0,

m 

0,7

ƒ(x)

F(x)

0,

m 

0,8

ƒ(x)

F(x)

0,

m 

0,9

ƒ(x)

F(x)

0,

1

ƒ(x)

F(x)

0,

0

5488

0,5488

4966

0,4966

4493

0,4493

4066

0,4066

3679

0,3679

1

3293

0,8781

3476

0,8442

3595

0,8088

3659

0,7725

3679

0,7358

2

0988

0,9769

1217

0,9659

1438

0,9526

1647

0,9371

1839

0,9197

3

0198

0,9966

0284

0,9942

0383

0,9909

0494

0,9865

0613

0,9810

4

0030

0,9996

0050

0,9992

0077

0,9986

0111

0,9977

0153

0,9963

5

0004

1,0000

0007

0,9999

0012

0,9998

0020

0,9997

0031

0,9994

0001

1,0000

0002

1,0000

0003

1,0000

0005

0,9999

0001

1,0000

6 7

m 

x

ƒ(x)

m 

1,5

F(x)

0,

ƒ(x)

m 

2

F(x)

0,

ƒ(x)

m 

3

F(x)

0,

ƒ(x)

m 

4

F(x)

0,

ƒ(x)

5

F(x)

0,

0

2231

0,2231

1353

0,1353

0498

0,0498

0183

0,0183

0067

0,0067

1

3347

0,5578

2707

0,4060

1494

0,1991

0733

0,0916

0337

0,0404

2

2510

0,8088

2707

0,6767

2240

0,4232

1465

0,2381

0842

0,1247

3

1255

0,9344

1804

0,8571

2240

0,6472

1954

0,4335

1404

0,2650

4

0471

0,9814

0902

0,9473

1680

0,8153

1954

0,6288

1755

0,4405

5

0141

0,9955

0361

0,9834

1008

0,9161

1563

0,7851

1755

0,6160

6

0035

0,9991

0120

0,9955

0504

0,9665

1042

0,8893

1462

0,7622

7

0008

0,9998

0034

0,9989

0216

0,9881

0595

0,9489

1044

0,8666

8

0001

1,0000

0009

0,9998

0081

0,9962

0298

0,9786

0653

0,9319

0002

1,0000

0027

0,9989

0132

0,9919

0363

0,9682

9 10

0008

0,9997

0053

0,9972

0181

0,9863

11

0002

0,9999

0019

0,9991

0082

0,9945

12

0001

1,0000

0006

0,9997

0034

0,9980

13

0002

0,9999

0013

0,9993

14

0001

1,0000

0005

0,9998

15

0002

0,9999

16

0000

1,0000

272

Apêndice Cinco

Tabela A7 Distribuição Normal Valores da função de distribuição(z) [veja (3), Seção 24.8]. z

(z)

z

0,

(z)

z

0,

(z)

z

0,

(z)  (z)

1

 (z)

z

0,

(z)

z

(z)

0,

0,

0,01 0,02 0,03 0,04 0,05

5040 5080 5120 5160 5199

0,51 0,52 0,53 0,54 0,55

6950 6985 7019 7054 7088

1,01 1,02 1,03 1,04 1,05

8438 8461 8485 8508 8531

1,51 1,52 1,53 1,54 1,55

9345 9357 9370 9382 9394

2,01 2,02 2,03 2,04 2,05

9778 9783 9788 9793 9798

2,51 2,52 2,53 2,54 2,55

9940 9941 9943 9945 9946

0,06 0,07 0,08 0,09 0,10

5239 5279 5319 5359 5398

0,56 0,57 0,58 0,59 0,60

7123 7157 7190 7224 7257

1,06 1,07 1,08 1,09 1,10

8554 8577 8599 8621 8643

1,56 1,57 1,58 1,59 1,60

9406 9418 9429 9441 9452

2,06 2,07 2,08 2,09 2,10

9803 9808 9812 9817 9821

2,56 2,57 2,58 2,59 2,60

9948 9949 9951 9952 9953

0,11 0,12 0,13 0,14 0,15

5438 5478 5517 5557 5596

0,61 0,62 0,63 0,64 0,65

7291 7324 7357 7389 7422

1,11 1,12 1,13 1,14 1,15

8665 8686 8708 8729 8749

1,61 1,62 1,63 1,64 1,65

9463 9474 9484 9495 9505

2,11 2,12 2,13 2,14 2,15

9826 9830 9834 9838 9842

2,61 2,62 2,63 2,64 2,65

9955 9956 9957 9959 9960

0,16 0,17 0,18 0,19 0,20

5636 5675 5714 5753 5793

0,66 0,67 0,68 0,69 0,70

7454 7486 7517 7549 7580

1,16 1,17 1,18 1,19 1,20

8770 8790 8810 8830 8849

1,66 1,67 1,68 1,69 1,70

9515 9525 9535 9545 9554

2,16 2,17 2,18 2,19 2,20

9846 9850 9854 9857 9861

2,66 2,67 2,68 2,69 2,70

9961 9962 9963 9964 9965

0,21 0,22 0,23 0,24 0,25

5832 5871 5910 5948 5987

0,71 0,72 0,73 0,74 0,75

7611 7642 7673 7704 7734

1,21 1,22 1,23 1,24 1,25

8869 8888 8907 8925 8944

1,71 1,72 1,73 1,74 1,75

9564 9573 9582 9591 9599

2,21 2,22 2,23 2,24 2,25

9864 9868 9871 9875 9878

2,71 2,72 2,73 2,74 2,75

9966 9967 9968 9969 9970

0,26 0,27 0,28 0,29 0,30

6026 6064 6103 6141 6179

0,76 0,77 0,78 0,79 0,80

7764 7794 7823 7852 7881

1,26 1,27 1,28 1,29 1,30

8962 8980 8997 9015 9032

1,76 1,77 1,78 1,79 1,80

9608 9616 9625 9633 9641

2,26 2,27 2,28 2,29 2,30

9881 9884 9887 9890 9893

2,76 2,77 2,78 2,79 2,80

9971 9972 9973 9974 9974

0,31 0,32 0,33 0,34 0,35

6217 6255 6293 6331 6368

0,81 0,82 0,83 0,84 0,85

7910 7939 7967 7995 8023

1,31 1,32 1,33 1,34 1,35

9049 9066 9082 9099 9115

1,81 1,82 1,83 1,84 1,85

9649 9656 9664 9671 9678

2,31 2,32 2,33 2,34 2,35

9896 9898 9901 9904 9906

2,81 2,82 2,83 2,84 2,85

9975 9976 9977 9977 9978

0,36 0,37 0,38 0,39 0,40

6406 6443 6480 6517 6554

0,86 0,87 0,88 0,89 0,90

8051 8078 8106 8133 8159

1,36 1,37 1,38 1,39 1,40

9131 9147 9162 9177 9192

1,86 1,87 1,88 1,89 1,90

9686 9693 9699 9706 9713

2,36 2,37 2,38 2,39 2,40

9909 9911 9913 9916 9918

2,86 2,87 2,88 2,89 2,90

9979 9979 9980 9981 9981

0,41 0,42 0,43

6591 6628 6664

0,91 0,92 0,93

8186 8212 8238

1,41 1,42 1,43

9207 9222 9236

1,91 1,92 1,93

9719 9726 9732

2,41 2,42 2,43

9920 9922 9925

2,91 2,92 2,93

9982 9982 9983

0,44 0,45

6700 6736

0,94 0,95

8264 8289

1,44 1,45

9251 9265

1,94 1,95

9738 9744

2,44 2,45

9927 9929

2,94 2,95

9984 9984

0,46 0,47 0,48 0,49 0,50

6772 6808 6844 6879 6915

0,96 0,97 0,98 0,99 1,00

8315 8340 8365 8389 8413

1,46 1,47 1,48 1,49 1,50

9279 9292 9306 9319 9332

1,96 1,97 1,98 1,99 2,00

9750 9756 9761 9767 9772

2,46 2,47 2,48 2,49 2,50

9931 9932 9934 9936 9938

2,96 2,97 2,98 2,99 3,00

9985 9985 9986 9986 9987

273

Tabelas

Tabela A8 Distribuição Normal Valores dez para valores dados de(z) [veja (3), Seção 24.8] eD(z)  (z)  (z). Exemplo: z se (z)  61%; z  0,860 se D(z)  61%.



0,279

z()

z(D)

%

z()

z(D)

%

z()

z(D)

1

2,326

0,013

41

0,228

0,539

81

0,878

1,311

2

2,054

0,025

42

0,202

0,553

82

0,915

1,341

3

1,881

0,038

43

0,176

0,568

83

0,954

1,372

4

1,751

0,050

44

0,151

0,583

84

0,994

1,405

5

1,645

0,063

45

0,126

0,598

85

1,036

1,440

6

1,555

0,075

46

0,100

0,613

86

1,080

1,476

7

1,476

0,088

47

0,075

0,628

87

1,126

1,514

8

1,405

0,100

48

0,050

0,643

88

1,175

1,555

9

1,341

0,113

49

0,025

0,659

89

1,227

1,598

10

1,282

0,126

50

0,000

0,674

90

1,282

1,645

%

11

1,227

0,138

51

0,025

0,690

91

1,341

1,695

12

1,175

0,151

52

0,050

0,706

92

1,405

1,751

13

1,126

0,164

53

0,075

0,722

93

1,476

1,812

14

1,080

0,176

54

0,100

0,739

94

1,555

1,881

15

1,036

0,189

55

0,126

0,755

95

1,645

1,960

16

0,994

0,202

56

0,151

0,772

96

1,751

2,054

17

0,954

0,215

57

0,176

0,789

97

1,881

2,170

18

0,915

0,228

58

0,202

0,806

97,5

1,960

2,241

19

0,878

0,240

59

0,228

0,824

98

2,054

2,326

20

0,842

0,253

60

0,253

0,842

99

2,326

2,576

21

0,806

0,266

61

0,279

0,860

99,1

2,366

2,612

22

0,772

0,279

62

0,305

0,878

99,2

2,409

2,652

23

0,739

0,292

63

0,332

0,896

99,3

2,457

2,697

24

0,706

0,305

64

0,358

0,915

99,4

2,512

2,748

25

0,674

0,319

65

0,385

0,935

99,5

2,576

2,807

26

0,643

0,332

66

0,412

0,954

99,6

2,652

2,878

27

0,613

0,345

67

0,440

0,974

99,7

2,748

2,968

28

0,583

0,358

68

0,468

0,994

99,8

2,878

3,090

29

0,553

0,372

69

0,496

1,015

99,9

3,090

3,291

30

0,524

0,385

70

0,524

1,036

31

0,496

0,399

71

0,553

1,058

99,91

3,121

3,320

32

0,468

0,412

72

0,583

1,080

99,92

3,156

3,353

33

0,440

0,426

73

0,613

1,103

99,93

3,195

3,390

34

0,412

0,440

74

0,643

1,126

99,94

3,239

3,432

35

0,385

0,454

75

0,674

1,150

99,95

3,291

3,481

36

0,358

0,468

76

0,706

1,175

99,96

3,353

3,540

37

0,332

0,482

77

0,739

1,200

99,97

3,432

3,615

38

0,305

0,496

78

0,772

1,227

99,98

3,540

3,719

39

0,279

0,510

79

0,806

1,254

99,99

3,719

3,891

40

0,253

0,524

80

0,842

1,282

274

Apêndice Cinco

Tabela A9 Distribuição t Valores de z para valores dados da função de distribuição F(z) (veja (8) na Seção 25.3). Exemplo: para 9 graus de liberdade, z  1,83 quando F(z)  0,95. Número de Graus de Liberdade

F(z)

1

2

3

4

5

6

7

8

9

10

0,5

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,6

0,32

0,29

0,28

0,27

0,27

0,26

0,26

0,26

0,26

0,26

0,7

0,73

0,62

0,58

0,57

0,56

0,55

0,55

0,55

0,54

0,54

0,8

1,38

1,06

0,98

0,94

0,92

0,91

0,90

0,89

0,88

0,88

0,9

3,08

1,89

1,64

1,53

1,48

1,44

1,41

1,40

1,38

1,37

0,95

6,31

2,92

2,35

2,13

2,02

1,94

1,89

1,86

1,83

1,81

0,975

12,7

4,30

3,18

2,78

2,57

2,45

2,36

2,31

2,26

2,23

0,99

31,8

6,96

4,54

3,75

3,36

3,14

3,00

2,90

2,82

2,76

0,995

63,7

9,92

5,84

4,60

4,03

3,71

3,50

3,36

3,25

3,17

0,999

318,3

22,3

10,2

7,17

5,89

5,21

4,79

4,50

4,30

4,14

F(z)

11

12

13

14

15

16

17

18

19

20

0,5

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,6

0,26

0,26

0,26

0,26

0,26

0,26

0,26

0,26

0,26

0,26

0,7

0,54

0,54

0,54

0,54

0,54

0,54

0,53

0,53

0,53

0,53

0,8

0,88

0,87

0,87

0,87

0,87

0,86

0,86

0,86

0,86

0,86

0,9

1,36

1,36

1,35

1,35

1,34

1,34

1,33

1,33

1,33

1,33

0,95

1,80

1,78

1,77

1,76

1,75

1,75

1,74

1,73

1,73

1,72

0,975

2,20

2,18

2,16

2,14

2,13

2,12

2,11

2,10

2,09

2,09

0,99

2,72

2,68

2,65

2,62

2,60

2,58

2,57

2,55

2,54

2,53

0,995

3,11

3,05

3,01

2,98

2,95

2,92

2,90

2,88

2,86

2,85

0,999

4,02

3,93

3,85

3,79

3,73

3,69

3,65

3,61

3,58

3,55

F(z)

22

24

26

28

30

40

50

100

200



0,5

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,00

0,6

0,26

0,26

0,26

0,26

0,26

0,26

0,25

0,25

0,25

0,25

0,7

0,53

0,53

0,53

0,53

0,53

0,53

0,53

0,53

0,53

0,52

0,8

0,86

0,86

0,86

0,85

0,85

0,85

0,85

0,85

0,84

0,84

0,9

1,32

1,32

1,31

1,31

1,31

1,30

1,30

1,29

1,29

1,28

0,95

1,72

1,71

1,71

1,70

1,70

1,68

1,68

1,66

1,65

1,65

0,975

2,07

2,06

2,06

2,05

2,04

2,02

2,01

1,98

1,97

1,96

0,99

2,51

2,49

2,48

2,47

2,46

2,42

2,40

2,36

2,35

2,33

0,995

2,82

2,80

2,78

2,76

2,75

2,70

2,68

2,63

2,60

2,58

0,999

3,50

3,47

3,43

3,41

3,39

3,31

3,26

3,17

3,13

3,09

Número de Graus de Liberdade

Número de Graus de Liberdade

275

Tabelas

Tabela A10 Distribuição de Qui-quadrado Valores de x para valores dados da função de distribuição F(z) (veja a Seção 25.3 antes de (17)). Exemplo: para 3 graus de liberdade, z  11,34 se F(z)  0,99. Número de Graus de Liberdade

F(z)

1

2

3

4

5

6

7

8

0,005

0,00

0,01

0,07

0,21

0,41

0,68

0,99

1,34

1,73

91

2,16

0

0,01

0,00

0,02

0,11

0,30

0,55

0,87

1,24

1,65

2,09

2,56

0,025

0,00

0,05

0,22

0,48

0,83

1,24

1,69

2,18

2,70

3,25

0,05

0,00

0,10

0,35

0,71

1,15

1,64

2,17

2,73

3,33

3,94

0,95

3,84

5,99

7,81

9,49

11,07

12,59

14,07

15,51

16,92

18,31

0,975 0,99

5,02 6,63

7,38 9,21

9,35 11,34

11,14 13,28

12,83 15,09

14,45 16,81

16,01 18,48

17,53 20,09

19,02 21,67

20,48 23,21

0,995

7,88

10,60

12,84

14,86

16,75

18,55

20,28

21,95

23,59

25,19

11

12

13

14

15

16

17

18

19

20

0,005

2,60

3,07

3,57

4,07

4,60

5,14

5,70

6,26

6,84

7,43

0,01

3,05

3,57

4,11

4,66

5,23

5,81

6,41

7,01

7,63

8,26

0,025

3,82

4,40

5,01

5,63

6,26

6,91

7,56

8,23

8,91

9,59

0,05

4,57

5,23

5,89

6,57

7,26

7,96

8,67

9,39

10,12

10,85

0,95

19,68

21,03

22,36

23,68

25,00

26,30

27,59

28,87

30,14

31,41

0,975

21,92

23,34

24,74

26,12

27,49

28,85

30,19

31,53

32,85

34,17

0,99

24,72

26,22

27,69

29,14

30,58

32,00

33,41

34,81

36,19

37,57

0,995

26,76

28,30

29,82

31,32

32,80

34,27

35,72

37,16

38,58

40,00

21

22

23

24

Número de Graus de Liberdade

F(z)

Número de Graus de Liberdade

F(z)

8,6

10,5

29

10,3

11,0

11,7

12,4

13,1

13,8

14,6

15,3

16,0

16,8

0,05

11,6

12,3

13,1

13,8

14,6

15,4

16,2

16,9

17,7

18,5

0,95

32,7

33,9

35,2

36,4

37,7

38,9

40,1

41,3

42,6

43,8

0,975

35,5

36,8

38,1

39,4

40,6

41,9

43,2

44,5

45,7

47,0

0,99

38,9

40,3

41,6

43,0

44,3

45,6

47,0

48,3

49,6

50,9

0,995

41,4

42,8

44,2

45,6

46,9

48,3

49,6

51,0

52,3

53,7

40

50

60

70

80

90

100

0,005

20,7

28,0

35,5

43,3

51,2

59,2

67,3

1

0,01

22,2

29,7

37,5

45,4

53,5

61,8

70,1

1

0,025

24,4

32,4

40,5

48,8

57,2

65,6

74,2

1

0,05

26,5

34,8

43,2

51,7

60,4

69,1

77,9

12,2

12,9

12,5

30

8,9

11,5

11,8

28

0,025

10,9

11,2

27

0,01

10,2

9,9

26

8,0

9,5

9,3

25

0,005

13,6

13,1

13,8

14,3

15,0

Número de Graus de Liberdade

F(z)



100 (Aproximação) (h



2,58)2

(h



2,33)2

2

(h



1,96)2

1 2

(h



1,64)2

(h



1,64)2

(h



1,96)2

2

2

0,95

55,8

67,5

79,1

90,5

101,9

113,1

124,3

1

0,975

59,3

71,4

83,3

95,0

106,6

118,1

129,6

1

0,99

63,7

76,2

88,4

100,4

112,3

124,1

135,8

1

(h 2



2,33)2

0,995

66,8

79,5

92,0

104,2

116,3

128,3

140,2

1



2,58)2

Na última coluna, h



2 m  1 , onde m é o número de graus de liberdade.

2

2

2

(h

276

Apêndice Cinco

Tabela A11 Distribuição F com (m, n) Graus de Liberdade Valores de z para os quais a função de distribuição F(z) [veja (13), Seção 25.4] tem o valor 0,95. Exemplo: para (7,4) g.l., z  6,09 se F(z)  0,95. n 1

m



161

1

m



20 0

2

m



216

3

m



22 5

4

m



230

5

234

m



6

23 7

m



7

239

m



8

m



9

241

2

18,5

19,0

19,2

19,2

19,3

19,3

19,4

19,4

3

10,1

9,55

9,28

9,12

9,01

8,94

8,89

8,85

19,4 8,81

4

7,71

6,94

6,59

6,39

6,26

6,16

6,09

6,04

6,00

5

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,77

6

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

7 8

5,59 5,32

4,74 4,46

4,35 4,07

4,12 3,84

3,97 3,69

3,87 3,58

3,79 3,50

3,73 3,44

3,68 3,39

9

5,12

4,26

3,86

3,63

3,48

3,37

3,29

3,23

3,18

10

4,96

4,10

3,71

3,48

3,33

3,22

3,14

3,07

3,02

11

4,84

3,98

3,59

3,36

3,20

3,09

3,01

2,95

2,90

12

4,75

3,89

3,49

3,26

3,11

3,00

2,91

2,85

2,80

13

4,67

3,81

3,41

3,18

3,03

2,92

2,83

2,77

2,71

14

4,60

3,74

3,34

3,11

2,96

2,85

2,76

2,70

2,65

15

4,54

3,68

3,29

3,06

2,90

2,79

2,71

2,64

2,59

16

4,49

3,63

3,24

3,01

2,85

2,74

2,66

2,59

2,54

17

4,45

3,59

3,20

2,96

2,81

2,70

2,61

2,55

2,49

18

4,41

3,55

3,16

2,93

2,77

2,66

2,58

2,51

2,46

19

4,38

3,52

3,13

2,90

2,74

2,63

2,54

2,48

2,42

20

4,35

3,49

3,10

2,87

2,71

2,60

2,51

2,45

2,39

22

4,30

3,44

3,05

2,82

2,66

2,55

2,46

2,40

2,34

24

4,26

3,40

3,01

2,78

2,62

2,51

2,42

2,36

2,30

26

4,23

3,37

2,98

2,74

2,59

2,47

2,39

2,32

2,27

28

4,20

3,34

2,95

2,71

2,56

2,45

2,36

2,29

2,24

30

4,17

3,32

2,92

2,69

2,53

2,42

2,33

2,27

2,21

32

4,15

3,29

2,90

2,67

2,51

2,40

2,31

2,24

2,19

34

4,13

3,28

2,88

2,65

2,49

2,38

2,29

2,23

2,17

36

4,11

3,26

2,87

2,63

2,48

2,36

2,28

2,21

2,15

38

4,10

3,24

2,85

2,62

2,46

2,35

2,26

2,19

2,14

40

4,08

3,23

2,84

2,61

2,45

2,34

2,25

2,18

2,12

50

4,03

3,18

2,79

2,56

2,40

2,29

2,20

2,13

2,07

60

4,00

3,15

2,76

2,53

2,37

2,25

2,17

2,10

2,04

70

3,98

3,13

2,74

2,50

2,35

2,23

2,14

2,07

2,02

80

3,96

3,11

2,72

2,49

2,33

2,21

2,13

2,06

2,00

90

3,95

3,10

2,71

2,47

2,32

2,20

2,11

2,04

1,99

1

00

3,94

3,09

2,70

2,46

2,31

2,19

2,10

2,03

1,97

1

50

3,90

3,06

2,66

2,43

2,27

2,16

2,07

2,00

1,94

2 00 1000

3,89 3,85

3,04 3,00

2,65 2,61

2,42 2,38

2,26 2,22

2,14 2,11

2,06 2,02

1,98 1,95

1,93 1,89

3,84

3,00

2,60

2,37

2,21

2,10

2,01

1,94

1,88



277

Tabelas

Tabela A11 Distribuição F com (m, n) Graus de Liberdade ( continuação) Valores de z para os quais a função de distribuição F(z) [veja (13), Seção 25.4] tem o valor 0,95 n 1

m 242 2 3



10

m



2 46 19,4 8,79

15

m



248 19,4 8,70

20

250 19,4 8,66

m



30

2 51 19,5 8,62

m



40

252 19,5 8,59

m



50

2 53 19,5 8,58

m



100



2 54 19,5 8,55

19,5 8,53

4

5,96

5,86

5,80

5,75

5,72

5,70

5,66

5,63

5

4,74

4,62

4,56

4,50

4,46

4,44

4,41

4,37

6

4,06

3,94

3,87

3,81

3,77

3,75

3,71

3,67

7

3,64

3,51

3,44

3,38

3,34

3,32

3,27

3,23

8 9

3,35 3,14

3,22 3,01

3,15 2,94

3,08 2,86

3,04 2,83

3,02 2,80

2,97 2,76

2,93 2,71

1

0

11

2,98 2,85

2,85 2,72

2,77 2,65

2,70 2,57

2,66 2,53

2,64 2,51

2,59 2,46

2,54 2,40

1

2

2,75

2,62

2,54

2,47

2,43

2,40

2,35

2,30

1

3

2,67

2,53

2,46

2,38

2,34

2,31

2,26

2,21

1

4

2,60

2,46

2,39

2,31

2,27

2,24

2,19

2,13

1

5

2,54

2,40

2,33

2,25

2,20

2,18

2,12

2,07

1

6

2,49

2,35

2,28

2,19

2,15

2,12

2,07

2,01

1

7

2,45

2,31

2,23

2,15

2,10

2,08

2,02

1,96

1

8

2,41

2,27

2,19

2,11

2,06

2,04

1,98

1,92

1

9

2,38

2,23

2,16

2,07

2,03

2,00

1,94

1,88

2

0

2,35

2,20

2,12

2,04

1,99

1,97

1,91

1,84

2

2

2,30

2,15

2,07

1,98

1,94

1,91

1,85

1,78

2

4

2,25

2,11

2,03

1,94

1,89

1,86

1,80

1,73

2

6

2,22

2,07

1,99

1,90

1,85

1,82

1,76

1,69

2

8

2,19

2,04

1,96

1,87

1,82

1,79

1,73

1,65

3

0

2,16

2,01

1,93

1,84

1,79

1,76

1,70

1,62

3

2

2,14

1,99

1,91

1,82

1,77

1,74

1,67

1,59

3

4

2,12

1,97

1,89

1,80

1,75

1,71

1,65

1,57

3

6

2,11

1,95

1,87

1,78

1,73

1,69

1,62

1,55

3

8

2,09

1,94

1,85

1,76

1,71

1,68

1,61

1,53

4

0

2,08

1,92

1,84

1,74

1,69

1,66

1,59

1,51

5

0

2,03

1,87

1,78

1,69

1,63

1,60

1,52

1,44

6

0

1,99

1,84

1,75

1,65

1,59

1,56

1,48

1,39

7

0

1,97

1,81

1,72

1,62

1,57

1,53

1,45

1,35

8

0

1,95

1,79

1,70

1,60

1,54

1,51

1,43

1,32

9

0

1,94

1,78

1,69

1,59

1,53

1,49

1,41

1,30

1

00

1,93

1,77

1,68

1,57

1,52

1,48

1,39

1,28

1

50

1,89

1,73

1,64

1,54

1,48

1,44

1,34

1,22

2

00

1,88

1,72

1,62

1,52

1,46

1,41

1,32

1,19

1000

1,84

1,68

1,58

1,47

1,41

1,36

1,26

1,08



1,83

1,67

1,57

1,46

1,39

1,35

1,24

1,00

278

Apêndice Cinco

Tabela A11 Distribuição F com (m, n) Graus de Liberdade (continuação) Valores de z para os quais a função de distribuição F(z) [veja (13), Seção 25.4] tem o valor 0,99 n 1

m



4052

m

1



49 99

m

2



54 03

m

3

56 25



m

4

57 64



m

5

58 59



m

6

5928



m

7

59 81



m

8



2

98,5

99,0

99,2

99,2

99,3

99,3

99,4

99,4

99,4

3

34,1

30,8

29,5

28,7

28,2

27,9

27,7

27,5

27,3

4

21,2

18,0

16,7

16,0

15,5

15,2

15,0

14,8

14,7

5

16,3

13,3

12,1

11,4

11,0

10,7

10,5

10,3

6

13,7

10,9

9,78

9,15

8,75

8,47

8,26

10,2

8,10

7,98

7

12,2

9,55

8,45

7,85

7,46

7,19

6,99

6,84

6,72

8 9

11,3 10,6

8,65 8,02

7,59 6,99

7,01 6,42

6,63 6,06

6,37 5,80

6,18 5,61

6,03 5,47

5,91 5,35

10

10,0

7,56

6,55

5,99

5,64

5,39

5,20

9

60 22

5,06

4,94

11

9,65

7,21

6,22

5,67

5,32

5,07

4,89

4,74

4,63

12

9,33

6,93

5,95

5,41

5,06

4,82

4,64

4,50

4,39

13

9,07

6,70

5,74

5,21

4,86

4,62

4,44

4,30

4,19

14

8,86

6,51

5,56

5,04

4,69

4,46

4,28

4,14

4,03

15

8,68

6,36

5,42

4,89

4,56

4,32

4,14

4,00

3,89

16

8,53

6,23

5,29

4,77

4,44

4,20

4,03

3,89

3,78

17

8,40

6,11

5,18

4,67

4,34

4,10

3,93

3,79

3,68

18

8,29

6,01

5,09

4,58

4,25

4,01

3,84

3,71

3,60

19

8,18

5,93

5,01

4,50

4,17

3,94

3,77

3,63

3,52

20

8,10

5,85

4,94

4,43

4,10

3,87

3,70

3,56

3,46

22

7,95

5,72

4,82

4,31

3,99

3,76

3,59

3,45

3,35

24

7,82

5,61

4,72

4,22

3,90

3,67

3,50

3,36

3,26

26

7,72

5,53

4,64

4,14

3,82

3,59

3,42

3,29

3,18

28

7,64

5,45

4,57

4,07

3,75

3,53

3,36

3,23

3,12

30

7,56

5,39

4,51

4,02

3,70

3,47

3,30

3,17

3,07

32

7,50

5,34

4,46

3,97

3,65

3,43

3,26

3,13

3,02

34

7,44

5,29

4,42

3,93

3,61

3,39

3,22

3,09

2,98

36

7,40

5,25

4,38

3,89

3,57

3,35

3,18

3,05

2,95

38

7,35

5,21

4,34

3,86

3,54

3,32

3,15

3,02

2,92

40

7,31

5,18

4,31

3,83

3,51

3,29

3,12

2,99

2,89

50

7,17

5,06

4,20

3,72

3,41

3,19

3,02

2,89

2,78

60

7,08

4,98

4,13

3,65

3,34

3,12

2,95

2,82

2,72

70

7,01

4,92

4,07

3,60

3,29

3,07

2,91

2,78

2,67

80

6,96

4,88

4,04

3,56

3,26

3,04

2,87

2,74

2,64

90

6,93

4,85

4,01

3,54

3,23

3,01

2,84

2,72

2,61

1

00

6,90

4,82

3,98

3,51

3,21

2,99

2,82

2,69

2,59

1

50

6,81

4,75

3,91

3,45

3,14

2,92

2,76

2,63

2,53

2

00

6,76

4,71

3,88

3,41

3,11

2,89

2,73

2,60

2,50

1000

6,66

4,63

3,80

3,34

3,04

2,82

2,66

2,53

2,43



6,63

4,61

3,78

3,32

3,02

2,80

2,64

2,51

2,41

279

Tabelas

Tabela A11 Distribuição F com (m, n) Graus de Liberdade ( continuação) Valores de z para os quais a função de distribuição F(z) [veja (13), Seção 25.4] tem o valor 0,99 n

m

1



10

6056

m



6157

15

m



6209

20

m



6261

30

m



6287

40

m



6303

50

m



6334

100



6366

2

99,4

99,4

99,4

99,5

99,5

99,5

99,5

99,5

3

27,2

26,9

26,7

26,5

26,4

26,4

26,2

26,1

4

14,5

14,2

14,0

13,8

13,7

13,7

13,6

13,5

5

10,1

9,13

9,02

9,72

9,55

9,38

9,29

9,24

6

7,87

7,56

7,40

7,23

7,14

7,09

6,99

6,88

7

6,62

6,31

6,16

5,99

5,91

5,86

5,75

5,65

8 9

5,81 5,26

5,52 4,96

5,36 4,81

5,20 4,65

5,12 4,57

5,07 4,52

4,96 4,42

4,86 4,31

1

0

4,85

4,56

4,41

4,25

4,17

4,12

4,01

1

1

4,54

4,25

4,10

3,94

3,86

3,81

3,71

3,91 3,60

1

2

4,30

4,01

3,86

3,70

3,62

3,57

3,47

3,36

1

3

4,10

3,82

3,66

3,51

3,43

3,38

3,27

3,17

1

4

3,94

3,66

3,51

3,35

3,27

3,22

3,11

3,00

1

5

3,80

3,52

3,37

3,21

3,13

3,08

2,98

2,87

1

6

3,69

3,41

3,26

3,10

3,02

2,97

2,86

2,75

1

7

3,59

3,31

3,16

3,00

2,92

2,87

2,76

2,65

1

8

3,51

3,23

3,08

2,92

2,84

2,78

2,68

2,57

1

9

3,43

3,15

3,00

2,84

2,76

2,71

2,60

2,49

2

0

3,37

3,09

2,94

2,78

2,69

2,64

2,54

2,42

2

2

3,26

2,98

2,83

2,67

2,58

2,53

2,42

2,31

2

4

3,17

2,89

2,74

2,58

2,49

2,44

2,33

2,21

2

6

3,09

2,81

2,66

2,50

2,42

2,36

2,25

2,13

2

8

3,03

2,75

2,60

2,44

2,35

2,30

2,19

2,06

3

0

2,98

2,70

2,55

2,39

2,30

2,25

2,13

2,01

3

2

2,93

2,65

2,50

2,34

2,25

2,20

2,08

1,96

3

4

2,89

2,61

2,46

2,30

2,21

2,16

2,04

1,91

3

6

2,86

2,58

2,43

2,26

2,18

2,12

2,00

1,87

3

8

2,83

2,55

2,40

2,23

2,14

2,09

1,97

1,84

4

0

2,80

2,52

2,37

2,20

2,11

2,06

1,94

1,80

5

0

2,70

2,42

2,27

2,10

2,01

1,95

1,82

1,68

6

0

2,63

2,35

2,20

2,03

1,94

1,88

1,75

1,60

7

0

2,59

2,31

2,15

1,98

1,89

1,83

1,70

1,54

8

0

2,55

2,27

2,12

1,94

1,85

1,79

1,65

1,49

9

0

2,52

2,24

2,09

1,92

1,82

1,76

1,62

1,46

100

2,50

2,22

2,07

1,89

1,80

1,74

1,60

1,43

150

2,44

2,16

2,00

1,83

1,73

1,66

1,52

1,33

200

2,41

2,13

1,97

1,79

1,69

1,63

1,48

1,28

1000

2,34

2,06

1,90

1,72

1,61

1,54

1,38

1,11



2,32

2,04

1,88

1,70

1,59

1,52

1,36

1,00

280

Apêndice Cinco

Tabela A12 Função de Distribuição F(x) = P ( T x

n 3

0 1

167 500

x

20

x

0,

n 4

0,

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73

002 003 004 005 006 007 008 010 012 014 017 020 023 027 032 037 043 049 056 064 073 082

74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94

093 104 117 130 144 159 176 193 211 230 250 271 293 315 339 362 387 411 436 462 487

0 1 2 3 4

008 042 117 242 408

x

18

38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55

001 002 003 003 004 005 007 009 011 013 016 020 024 029 034 041 048 056

56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76

066 076 088 100 115 130 147 165 184 205 227 250 275 300 327 354 383 411 441 470 500

0,

0 042 1 167 2 375

n

50 001 51 002

x

n 5

19

43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85

001 002 002 003 003 004 005 006 008 010 012 014 017 021 025 029 034 040 047 054 062 072 082 093 105 119 133 149 166 184 203 223 245 267 290 314 339 365 391 418 445 473 500

0 1 2 3 4 5 6 7

001 008 028 068 136 235 360 500

0,

n x

x

n 6



x ) da Variável Aleatória T na Seção 25.8 n

x

0,

0,

7

0,

8

001 005 015 035 068 119 191 281 386

2 3 4 5 6 7 8 9 10

9

001 003 007 016 031 054 089 138 199

4 5 6 7 8 9 10 11 12

11 274 12 360 13 452

17

32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67

001 002 002 003 004 005 007 009 011 014 017 021 026 032 038 046 054 064 076 088 102 118 135 154 174 196 220 245 271 299 328 358 388 420 452 484

0,

16

27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59

001 002 002 003 004 006 008 010 013 016 021 026 032 039 048 058 070 083 097 114 133 153 175 199 225 253 282 313 345 378 412 447 482

0,

11

001 002 005 008 014 023 036 054 078

8 9 10 11 12 13 14 15 16

001 002 003 005 008 013 020 030 043

15 16 17 18 19 20 21 22

108 146 190 242 300 364 431 500

17 18 19 20 21 22 23 24 25 26 27

060 082 109 141 179 223 271 324 381 440 500

x

13

14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38

001 001 002 003 005 007 011 015 021 029 038 050 064 082 102 126 153 184 218 255 295 338 383 429 476

x

12

11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

001 002 003 004 007 010 016 022 031 043 058 076 098 125 155 190 230 273 319 369 420 473

10

001 003 006 012 022 038 060 090 130

6 7 8 9 10 11 12 13 14

13 14 15 16 17

179 238 306 381 460

x

14

18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

001 002 002 003 005 007 010 013 018 024 031 040 051 063 079 096 117 140 165 194 225 259 295 334 374 415 457 500

0,

n x

15

23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52

001 002 003 004 006 008 010 014 018 023 029 037 046 057 070 084 101 120 141 164 190 218 248 279 313 349 385 423 461 500

0,

0,

0,

n x

n x

x

0,

n x

n

n x

0,

1 2 3 4 5 6 7 8 9

10 500

n

n x

n 0,

n 0,

n 0,

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF