Inferencia Estadistica Unidad II

March 4, 2019 | Author: Estefaniia Seymour Mondragon | Category: Estimator, Sampling (Statistics), Estimation Theory, Mean, Confidence Interval
Share Embed Donate


Short Description

Download Inferencia Estadistica Unidad II...

Description

 Ingeniería en Gestión Gestión Empresarial  Empresarial 

 Luis Daniel Herrera Barrios Unidad II  “ 

INFERENCIA ESTADÍSTICA: ESTIMACIÓN ”  INFERENCIA ” 

 Blanca Estefanía Estefanía De la O Mondragón Mondragón  11570120

 Zihuatanejo Gro. A 24 de Febrero Febr ero Del 2013

1

CONTENIDO

UNIDAD II. INFERENCIA ESTADÍSTICA: ESTIMACIÓN  Introducción

3

2.1 Conceptos básicos.

4

2.2 Distribuciones de muestreo.

5

2.3 Estimación puntual.

6

2.4 Estimación de intervalo.

7

2.5 Intervalos de confianza para medias.

8

2.6 Intervalos de confianza para diferencia e ntre medias.

9

2.7 Intervalos de confianza para proporciones.

11

2.8 Intervalos de confianza para diferencias entre proporciones.

12

2.9 Intervalos de confianza para varianzas.

15

2.10 Intervalos de confianza para razones de dos varianzas.

16

Bibliografía

18

2

INTRODUCCIÓN

A la inferencia estadística le interesa sacar conclusiones de un gran número de acontecimientos (población), fundándose en las observaciones de una parte de los mismos (muestra). La estadística nos proporciona herramientas que formalizan y uniforman los procedimientos para sacar conclusiones siempre que las muestras seleccionadas sean representativas de la población que han sido extraídas. Esta representatividad permite extender los valores que describen a las muestras (estadísticos), tales como la media, la desviación típica, un coeficiente de correlación, a la población correspondiente, es decir, la media o la desviación típica (estadísticos) pueden tomarse como estimadores de los parámetros μ y σ, valores que caracterizan a la población. Los estadísticos, valores obtenidos en la muestra, son, pues, estimadores de los parámetros correspondientes (valores de la población).

3

2.1 Conceptos básicos. POBLACIÓN: Conjunto de elementos sobre los que se observa un carácter común. Se representa con la letra N. MUESTRA: Conjunto de unidades de una población. Cuanto más significativa sea, mejor será la muestra. Se representa con la letra n. UNIDAD DE MUESTREO: Está formada por uno o más elementos de la población. El total de unidades de muestreo constituyen la población. Estas unidades son disjuntas entre sí y cada elemento de la población pertenece a una unidad de muestreo.

PARÁMETRO: Es un resumen numérico de alguna variable observada de la población. Los parámetros normales que se estudian son: - La media poblacional:  x  - Total poblacional: X - Proporción: P *

ESTIMADOR: Un estimador θ de un parámetro θ, es un estadístico que se emplea para conocer el parámetro θ desconocido.

ESTADÍSTICO: Es una función de los valores de la muestra. Es una variable aleatoria, cuyos valores dependen de la muestra seleccionada. Su distribución de probabilidad, se conoce como “Distribución muestral del estadístico”.

ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra (un resumen estadístico con las medidas que conocemos de Descriptiva) se extrapola o generaliza dicho resultado muestral a la población total, de modo que lo estimado es el valor generalizado a la población. Consiste en la búsqueda del valor de los parámetros poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza:



Puntual: cuando buscamos un valor concreto.



Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se supone que va a estar el valor del parámetro que se busca con una cierta probabilidad.

4

CONTRATE DE HIPÓTESIS: Consiste en determinar si es aceptable, partiendo de datos muéstrales, que la característica o el parámetro poblacional estudiado tome un determinado valor o esté dentro de unos determinados valores.

NIVEL DE CONFIANZA: Indica la proporción de veces que acertaríamos al afirmar que el parámetro θ está dentro del intervalo al seleccionar muchas muestras.

2.2 Distribuciones de muestreo. La inferencia estadística es el proceso que permite hacer inferencias (predicciones, suposiciones, …) acerca de los parámetros de la población a partir de los estimadores obtenidos con una muestra. Utiliza como base el muestreo aleatorio simple. La distribución muestral de un estimador es la distribución de la probabilidad de la variable que recoge los distintos valores del estimador obtenidos al analizar diferentes muestras. Una población con cualquier distribución de frecuencias, que tiene una µ y σ concretas, tiene una distribución muestral de la dicha población):

 x 

(las medias de infinitas muestras obtenidas de



Con una media igual a la media de la población



Una desviación estándar, denominada error típico o estándar, igual a σ, desviación estándar de la población, dividida entre la raíz cuadrada del tamaño de la muestra, n:



y sigue una distribución normal (si n es suficientemente grande).

Ejemplo: Población:

Distribución muestral  x :

Histograma elementos.

de

 x 

en

1000

muestras

de

11

5

2.3 Estimación puntual. Con la estimación puntual se estima el valor del parámetro poblacional desconocido, a partir de una muestra. Para cada muestra se tendrá un valor que estima el parámetro. Esta estimación no es muy útil si desconocemos el grado de aproximación de la estimación al parámetro. Un estimador de un parámetro poblacional es una función de los datos muéstrales. En pocas palabras, es una fórmula que depende de los valores obtenidos de una muestra, para realizar estimaciones. Lo que se pretende obtener es el valor exacto de un parámetro. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla media de los individuos de la muestra. La media de la muestra puede ser un estimador de la media de la población, la cuasivarianza muestral es un buen estimador de la varianza poblacional y el total muestral es un buen estimador del total poblacional. Por tanto, una definición más matemática de un estimador y las propiedades que debe de cumplir un estimador para ser bueno. Sea X1......Xn, una m.a.s. de tamaño n, decimos que es un estimador θ* de un parámetro θ si el estadístico que se emplea para conocer dicho parámetro desconocido es este.

Propiedades deseables de un estimador  Las propiedades o criterios para seleccionar un buen estimador son los siguientes:

A) Insesgadez: Diremos que un estimador θ* de un parámetro θ es insesgado si su esperanza coincide con el verdadero valor del parámetro.

En el caso de que no coincidan, diremos que el es timador es sesgado.

B) Eficiencia: Dados dos estimadores θ1* y θ2* para un mismo parámetro θ, se dice que θ1* es más eficiente que θ2* si:

6

C) Suficiencia: Se dice que un estimador de un parámetro es suficiente cuando para su cálculo utiliza toda la información de la muestra.

D) Consistencia: Decimos que un estimador θ* de un parámetro θ es consistente si la distribución del estimador tiende a concentrarse en un cierto punto cuando el tamaño de la muestra tiende a infinito.

Métodos para obtener estimadores El demostrar que un cierto estimador cumple estas propiedades puede ser complicado en determinadas ocasiones. Existen varios métodos que nos van a permitir obtener los estimadores puntuales. Los más importantes son:

MÉTODO DE LOS MOMENTOS: se basa en que los momentos poblacionales y se estiman mediante los momentos muéstrales. Suelen dar estimadores consistentes.

MÉTODO DE MÍNIMOS CUADRADOS: consiste en obtener un estimador que hace mínima una determinada función.

MÉTODO DE MÁXIMA VEROSIMILITUD: consiste en tomar como parámetro poblacional el valor de la muestra que sea más probable, es decir, que tenga mayor probabilidad. Se suelen obtener estimadores consistentes y eficientes. Es el más utilizado. La probabilidad de que la media muestral sea igual a la media poblacional es cero, , es decir, que será bastante complicado obtener un estimador puntual, por ello se utiliza más el Intervalo de Confianza y e l Contraste de Hipótesis.

2.4 Estimación de intervalo. Es deseable conocer un método que nos permita saber donde se encuentra el parámetro con un cierto grado de certeza. Este método va a ser la determinación de un intervalo donde estará el parámetro con un nivel de confianza. Estimación de intervalo expresa la amplitud dentro de la cual probablemente se encuentra un parámetro poblacional.

7

El intervalo se construye a partir de una muestra, entonces, para cada muestra se tendrá un intervalo distinto. Llamaremos

al error que se permite al dar el intervalo y el nivel de

confianza será 1- . Un intervalo tiene un nivel de confianza 1- cuando el 100·(1- )% de los intervalos que se construyen para el parámetro lo contienen. Es deseable para un intervalo de confianza que tenga la menor amplitud posible, esta amplitud dependerá de: 

El tamaño de la muestra, mientras mayor sea el tamaño mejor será la estimación, aunque se incurre en un aumento de costes



Nivel de confianza, si se pide mayor nivel de confianza, el intervalo será mayor.

2.5 Intervalos de confianza para medias. En los capítulos anteriores se estudio el estadístico

         



Como estimador de la media poblacional , y si se considera una muestra grande , extraida de una población con conocida, entonces del teorema del limite central

  

y en consecuencia

Por lo que

donde



De donde el intervalo de confianza de dos lados para la media con un nivel de confianza de , cuando la muestra es grande es:

8

Y los límites son:

El valor



se obtiene de tablas de distribución normal estándar de forma que

Al denotar a z como



es una notación común en estadística, pero no esta

completamente generalizada. Cuando la muestra es pequeña (n < 30) y la población tiene una distribución normal con variancia conocida, entonces puede emplearse.

2.6 Intervalos de confianza para diferencia entre medias. Para construir intervalos de confianza para la diferencia de medias poblacionales se hace uso de la distribución en el muestreo de la diferencia de medias muéstrales. Se sabe que si entonces:

                          

Y por tanto, si las distribuciones de la variables

son variables aleatorias independientes,

son normales, cualesquiera que sean los

tamaños muéstrales, se verificara que

9

También se sabe que para muestras independientes se puede asegurar que la distribución de la diferencia de

medias muéstrales es

          

                                                                      

distribuciones de las variables

son normales.

si las

Si se conocen las varianzas poblacionales

Y a partir del intervalo de probabilidad con para la diferencia de medias muéstrales se construye el intervalo de confianza con coeficiente de confianza (1- ) para la diferencia de medias poblacionales:

Si no se conocen las varianzas poblacionales Siempre que

 pero se pueden suponer iguales

y las muestras sean independientes la distribución

de la diferencia de medias muéstrales es

.

                                     

Si las varianzas poblacionales se pueden suponer iguales se estima la varianza común por y en este caso la distribución del estadístico

es normal sino 1-

no

y por ello, el intervalo de confianza, con coeficiente de confianza

será en este caso

Si no se conocen las varianzas poblaciones

y no se pueden suponer iguales

10

Si las varianzas poblacionales no se pueden suponer iguales, se estiman por las cuasivarianzas de las muestras correspondientes, y es este caso el estadístico

     

sigue una distribución t  de Student con g grados de libertad, siendo el

numero natural mas próximo a

El intervalo de confianza será:

           





                 

.

2.7 Intervalos de confianza para proporciones.

 

Si se toma una muestra de tamaño n de una población muy grande (o infinita), y  X  observaciones pertenecen a la clase de interés, entonces

es un estimador puntual

de la proporción de la población que pertenece a la clase en cuestión, y la distribución de muestreo es

Donde

 

    

Y p y n son los parámetros de la distribución binomial.

              

Utilizando el estimador estimador puntual coeficiente

y aproximando la cantidad p(1-p) mediante su

se obtiene el intervalo de confianza de dos lados con un para la proporción p es

…..(3.7)

Ejemplo

11

En una muestra al azar de 60 secciones de tubo en una planta química, 8 de ellos mostraron señales de corrosión seria. Construir un intervalo de confianza del 95 % para la proporción de los tramos de tubo con corrosión seria.

Resolución

                   

Utilizando la formula (3.7), con tiene:

Finalmente:

de tablas, y recordando que

, se

2.8 Intervalos de confianza para diferencias entre proporciones. Si dos muestras independientes de tamaño

   

se extraen de poblaciones infinitas

con distribuciones binomiales,  X  representa el numero de observaciones de la primera muestra que corresponden a la clase en cuestión, entonces la distribución de muestreo para la diferencia de proporciones esta dada por

Donde

 

                

                   

De la definición se obtiene el intervalo de confianza de dos lados para la diferencia de proporciones, con un nivel de confianza de ( , el cual es

…(3.8)

Ejemplo Dos grupos de 80 pacientes tomaron parte en un experimento en el cual un grupo recibió píldoras que contenían un antialérgico, mientras que al otro grupo se le administro un placebo, es decir, una píldora sin droga alguna. En el grupo que recibió el medicamento 23 exhibieron síntomas alérgicos, mientras que en el otro grupo 41 los exhibieron. Obtener un intervalo de confianza del 99% para la diferencia entre las proporciones.

12

Tópicos especiales: Intervalo de confianza para la diferencia de medias, casos especiales. Existen algunos casos especiales para los intervalos de confianza de diferencia de medias. El primero de ellos es cuando se tienen datos apareados, o en pares, es decir, las muestras aleatorias no son independientes y tienen el mismo tamaño. El segundo de ellos, que queda un poco más allá del objetivo del presente curso, se tiene cuando las muestras son pequeñas, independientes, con distribuciones aproximadamente normales con varianzas desconocidas y diferentes.

Datos en pares Cuando se observan datos en pares y se espera que exista una fuerte correlación entre cada pareja de datos, se debe generar una nueva variable aleatoria para construir el intervalo de confianza. Sea la variable aleatoria , donde i =1, 2, … , n, entonces:

  

13

Y el intervalo se puede generar mediante:

Variancias diferentes muestras pequeñas

 

Cuando el problema consiste en encontrar una estimación por intervalos para diferencia de medias , las muestras son pequeñas, las poblaciones son aproximadamente normales y las varianzas desconocidas no pueden considerarse iguales, entonces no existe un estadístico exacto para el problema; sin embargo, algunos autores han encontrado muy buenas aproximaciones utilizando el estadístico:

el cual tiene una distribución aproximadamente t , con v grados de libertad, los cuales se aproximan mediante:

O bien mediante

Puesto que v difícilmente es entero se aproxima al entero más cercano. 14

El intervalo de confianza de dos lados queda entonces:

2.9 Intervalos de confianza para varianzas.

el estadístico empleado es Donde



                      

Si X es una v.a. con distribución normal con media

Utilizando el estadístico

coeficiente de confianza de

y varianza



desconocidas, entonces

se obtiene el intervalo de confianza de dos lados con un para

, el cual es

Ejemplo: Considerese los siguientes datos: 8.2 8.23 8.24 8.25 8.19

8.28 8.21 8.23 8.2 8.23

8.24 8.25 8.24 8.26 8.26

  

Obtener: a) Un intervalo de confianza de dos lados del 95% para b) Un intervalo de confianza inferior del 95% para c) Un intervalo de confianza superior de 95% para

.

15

Resolución

                                                             

De los datos de la tabla se obtiene

a) Sustituyendo en

De tablas

Por lo que

b) Para un intervalo inferior

De tablas

Entonces

c) Para un intervalo superior

De tablas Entonces

2.10 Intervalos de confianza para razones de dos varianzas.

  

  

Si  X  y Y  son vv.aa. independientes con distribuciones normales con medidas desconocidas y variancias desconocidas, respectivamente, entonces el estadístico empleado es

    

16

Donde



Utilizando el estadístico



coeficiente de confianza de

se obtiene el intervalo de confianza de dos lados con un



para la relación de las variancias



, el cual es

17

BIBLIOGRAFÍA



Hines, William W. y Montgomery, Douglas C., et al.- Probabilidad y Estadística para Ingeniería y Administración, Cuarta Edición..-CECSA.- México, 2004.



María Teresa González.- Estadística Aplicada una Visión Instrumental, Díaz de Santos.- España, 2009.



Scheaffer, Richard L y McClave, James T. P robabilidad y Estadística para Ingeniería.Grupo Editorial Iberoamérica.- México 1993.



Canavos, George C.- Probabilidad y Estadística Aplicaciones Y Métodos.- McGrawHill.- México, 1988.

18

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF