Intervalos de Confianza

September 21, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Intervalos de Confianza...

Description

 

“INTERVALOS DE CONFIANZA”  Un intervalo de confianza es una técnica de estimación utilizada en estadística inferencial que permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada (con una determinada probabilidad). Un in inte terv rval alo o de co conf nfia ianz nza a no nos s va a pe perm rmit itir ir ca calc lcul ular ar do dos s va valo lore res s alrededor de una media muestral (uno superior y otro inferior). Estos valores van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el parámetro poblacional.

Intervalo de confianza = media +- margen de error  Factores de los que depende un intervalo de confianza El cálculo de un intervalo de confianza depende principalmente de los siguientes factores: 

Tamaño de la muestra seleccionada: Dependiendo de la cantidad de datos que se hayan utilizado para calcular el valor muestral, este es te se ac acer erc cará ará má más s o men eno os al ve verd rda ade dero ro pará ráme metr tro o poblacional.



Nivel de confianza: Nos va a informar en qué porcentaje de casos nuestra estimación acierta. Los niveles habituales son el 95% y el 99%.



Margen de error de nuestra estimación: Este se denomina como alfa y nos informa de la probabilidad que existe de que el valor  poblacional esté fuera de nuestro intervalo.



Lo es estim timad ado o en la mu mues estr tra a (m (med edia ia,, va vari rian anza za,, di dife fere renc ncia ia de medias…): De esto va a depender el estadístico pivote para el cálculo del intervalo.

Cálculo de intervalos de confianza En una estimación paramétrica, el intervalo de confianza [a, b] debe contener en su interior a la media de la población m con

 

una probabilidad igual a 1 - a, expresión que se conoce como nivel de confianza.. Es decir: confianza

En una distribución muestral de las medias con medias  con media poblacional m, desv de svia iaci ción ón tí típi pica ca po pobl blac acio iona nall s, ta tama maño ño de la mu mues estr tra a n, me medi dia a muestral e intervalo de confianza predeterminado 1 - a (expresado en porc po rcen enta taje je;; po porr ejem ejempl plo, o, 95 95%) %),, es po posi sibl ble e ca calc lcul ular ar el in inte terv rval alo o de confianza a partir de la expresión:

El intervalo de confianza de la distribución de la figura para un nivel de confianza 1 - es el formado por[-z/2, +z/2]. En una distribución muestral de las proporciones de proporciones  de tipo N (p, ), puede determinarse el intervalo de confianza, para el cual existe una proporción p de elementos que poseen una cierta característica, a partir  de una muestra representativa, donde la proporción es p¿, por medio de la siguiente expresión:

Contraste de hipótesis Otra operación común en el manejo de distribuciones muestrales es la que qu e con consis siste te en con contra trasta starr una hipótesis hipótesis   de partida a través de los resultados de una muestra obtenida de una población estadística. El procedimiento que se sigue consta de los pasos siguientes: 

Prop roponer

una

llamada hi hipó póte tesi sis s

hipó ipótesis nu nula la..La

que

se

inversa

consid ide era de

la

como hipótesis

verdadera, ra, nula

llama hipótesis alternativa. alternativa. 

Definir las leyes de probabilidad de la población y de la muestra (en general, se considera una distribución normal). normal).

se

 



Determ Det ermina inarr la zo zona na de ac acep epta taci ción ón  de la hi hipó póte tesi sis s nu nula la,, me medi dian ante te intervalos de confianza.



Fijar posibles zonas de rechazo, donde no se admite la hipótesis nula, que se conocen genéricamente como región crítica. crítica. Cuando la región crítica está situada a los dos lados de la zona de aceptación de la hipótesis nula, el contraste se denomina bilateral bilateral o  o de dos colas; si está sólo a un lado de la región crítica, se llama unilateral unilateral o  o de una cola.

Regiones críticas y de aceptación en contraste de hipótesis bilateral (arriba) y unilateral (abajo), en el caso de la media. Nivel de significación En la contrastación de hipótesis puede producirse un riesgo de rechazo de la hip hipóte ótesis sis par para a alg algún ún va valor lor con concre creto to de dell interv intervalo alo de con confia fianza nza aunque la hipótesis sea válida en el resto del intervalo. Esta probabilidad se deno denomina mina rie riesgo sgo de er error  ror   o o nivel de signi significac ficación ión,, y se denota por a. 

Si se acepta la hipótesis, se considera que la diferencia entre el valor del parámetro contemplado en la hipótesis nula y el que le corresponde según la muestra es no significativa. significativa.



Cuan Cu ando do se rech rechaz aza a la hipó hipóte tesi sis s nu nula la para para un va valo lorr de a = 5% 5%,, la diferencia se dice que es significativa. significativa.



Si la hipótesis nula se rechaza con un valor de a = 10%, se dice que la diferencia es muy significativa. significativa.

Tipos de intervalo de confianza a) Inter Intervalos valos de c confia onfianza nza para la m media edia

 

Supong Supo ngam amos os un una a v. a. x co con n dist distri ribu buci ción ón N(µ ; ) en do dond nde e la me medi dia a µ es desconocida y la v varianza arianza , la s suponemos uponemos por ahora conocida. Con el fin de esti es tima marr µ (c (col oles este tero roll me medi dio, o, nive nivell me medi dio o de gl gluc ucos osa, a, al altu tura ra me medi dia a de lo los s varones mayores de edad, etc.) se va a tomar una muestra aleatoria  x 1 , x 2 ,..., x n qu que e prop propor orci cion ona a un una a me medi dia a qu que e se será rá un una a es estim timac ació ión n puntual de µ. Aceptaremos sin demostrarlo que:

 (4.1) con probabilidad del 95%, y así tenemos el intervalo buscado. Esta expresión debe interpretarse adecuadamente. Ella indica que el 95% de las muestras de tamaño n tendrán una media que, al sustituirla en la expresión, da lugar a un intervalo que contiene en su interior a µ, en tanto que otro 5% no sucederá esto. Nótese que se ha dicho que "el intervalo contiene en su interior a µ, y no que "µ cae en el interior del intervalo"; la primera afirmación es cierta pues los extremos extrem os d del el iinte nterva rvalo lo s son on v v.. a. por dep depend ender er d de e que tam tambié bién n lo es; la segu se gund nda a af afirm irmac ació ión n es fa fals lsa a pu pues es µ es un pa pará ráme metr tro o (val (valor or fi fijo jo au aunq nque ue desconocido), no una v.a., no pudiendo variar. Así pues debe decirse que hay una probabilidad del 95% de que el intervalo contenga al parámetro. En el ejem jemplo de la es esta tatu tura ra me medi dia a µ de lo los s esp spa año ñolles es,, si se ti tien ene e que , dado que el 95% de los inter intervalos valos cont contiene ienen n a µ, diremos diremos que "tenemos la esperanza de que este sea uno de los 95 intervalos de cada 100 que dejan en su interior a µ, esperando no haber tenido la mala suerte de que el intervalo obtenido sea uno de los 5 de cada 100 intervalos erróneos". Más abreviadamente, diremos que µ está entre (169 ; 172) "con una confianza del 95%"; de ahí el nombre de intervalo de confianza. Conviene notar que ahora se habla de "confianza" , y no de "probabilidad" como antes, pues los extremos del intervalo ya son números fijos y µ o está o no está dentro.

El inter intervalo valo (4.1) pode podemos mos expr expresarl esarlo o abrev abreviadam iadamente ente como

,

debiéndose el valor 1,96 al 5% de error z 0,05 = la tabla de la Distribución Normal.. De un modotomado, general,essidecir en lugar de1,96 una en confianza del 95% 95% tomam tomamos os un una a de (1 - ), (o en llugar ugar d de e un err error or del 5 5% % se to toma ma uno de ), entonces el intervalo será:

 (4.2) con

,en la tabla de la D. N.. Ejemplo 1: Para determinar la estatura media de los varones adultos españoles, se tomó una muestra al azar de 10 de ellos en la que se obtuvo los valores 162, 176, 169, 165, 171, 169, 172, 168, 167 y 175 cm. Determinar el valor de la estatura media, suponiendo que = 16.

 

Un estimador puntual para la estatura media µ es la que en este caso es 169,4. Para dar un intervalo de confianza hemos de suponer que es una v. a. norma normal. l. Como n=10 n=10,, confianza al 95%,

= 169,4 y = 4, para el interv intervalo alo de la expresión (4.1) indica

que  Así pues, esperamos que este intervalo sea un de los 95 de cada 100 que qu e co cont ntie iene nen n a µ, o, má más s brev brevem emen ente te,, la es esta tatu tura ra me medi dia a de lo los s españoles varones adultos es algún valor entre 166,92 cm y 171,88 cm con una confianza del 95%. Es evide evidente nte qu que e un int interv ervalo alo d de e con confia fianza nza p para ara un dad dado o será ttant anto o más preciso cuanto más estrecho sea. Así, será preferible afirmar que la estatura media está entre 170 y 171 cm al 95% de confianza, que afirmar que la esta es tatu tura ra es está tá en entr tre e 16 165 5 y 17 175 5 co con n igua iguall co conf nfia ianz nza. a. Co Como mo la lo long ngit itud ud de dell intervalo es dos veces su radio, el mismo puede disminuirse aumentando el valor del tamaño de la muestra (pues n aparece dividiendo). Ello responde a una regla que será general en toda la Estadística: cuanto más grande sea una muestra, más información da y más precisas son las conclusiones que se obtengan a partir de ella. La otra forma de estrechar el intervalo es disminuyendo la confianza ( es decir, aumentando el error). Así z 0,05 = 1,96, pero z0,15 = 1,44, que por ser menor da un inte interv rval alo o má más s es estre trech cho. o. Sin Sin em emba barg rgo o ah ahor ora a la an anch chur ura a de dell in inte terv rval alo o ha dism dismin inui uido do a co cost sta a de la se segu gurid ridad ad (c (con onfi fian anza za)) de dell mi mism smo, o, y el ello lo no es deseable dese able.. Lo usua usuall es c consid onsiderar erar e errores rrores del 5 5%, %, au aunque nque en o ocasio casiones nes s se e utilizan otros como los del 1% o del 10%. Nos podemos preguntar ¿se puede dar un intervalo al 100% de confianza?; la respuesta es que esto exigiría una z0,00 = , c con on lo qu que e el int interv ervalo alo ser sería ía ( - , ) q que ue en el cas caso o d del el eje ejempl mplo o d darí aría a lugar lug ar a la a afirm firmaci ación ón ""la la e esta statur tura a m medi edia a de los esp españo añoles les est está á en entre tre - y ", que es absolutamente cierta y absolutamente inútil también. Hasta este momento hemos supuesto que la varianza de la población era conoc co nocida ida,, lo que no suel suele e ser rea real. l. Cua Cuando ndo es des desco conoc nocida ida,, lo lógic lógico o es sustituirla por su estimador s, obteniendo así que .Sin embargo s es una v. a. y unas veces será m más ás g grande rande que y otra otras s más pequeña, lo que da una cierta imprecisión al intervalo. Conviene ensanchar un poco el intervalo para que la confianza del mismo permanezca. El modo de hacerlo consiste en aumentar el valor de , localizándolo en una tabla distinta. Ahora tendremos:

(4.3) con co n t

en la ta tabl bla a de la dis distr trib ibuc ució ión n t de Stu Stude dent nt con (n(n-1) 1) gra grado dos s de

libert libertad ad,, tabl tabla a que pr prese esenta nta lo los s valo valores res de t

en un fo forma rmato to sim simila ilarr al de

 

la distribución normal, excepto en que la nueva variable depende de un nuevo parámetro llamado grados de libertad. Ejemplo 2: Resolver el ejemplo anterior sin suponer conocido el valor  de . De antes se conoce que n =10 y = 169,4. Ahora es preciso calcular la varianza muestral por la fórmula correspondiente lo que da s = 4,3. Como t 0,05 (9 g.l.)= 2,262 en la tabla, entonces es el intervalo de confianza para µ al 95% de confianza. La interpretación del nuevo intervalo es idéntica del que resultaba cuando la varianza era conocida, la única diferencia es que ahora no sólo el centro del intervalo es variable, sino que también lo es su radio. Tamaño de la muestra. En la fase de diseño de una experiencia suele plantearse cuál debe ser el tamaño mínimo de la muestra para lograr una precisión dada en la estimación de la media. Así, ¿cuántos españoles debo tomar para determinar su estatura media con una precisión de 1 cm? Con ello se quiere indicar que si concluyo que debo tomar n = 100 españoles y tomo una muestra de 100 de ellos, la esta es tatu tura ra me medi dia a en la mu mues estr tra a ( ) dis dista tará rá de la me medi dia a de la po pobl blac ació ión n (µ) en meno me nos s de 1 cm (en (en ge gene nera rall d cm cm), ), es de deci cirr qu que e

co con n un una a cier cierta ta

confianz confi anza. a. Ot Otro ro mo modo do de d deci ecirr lo mis mismo mo es a afirm firmar ar qu que e si es =17 =170 0 en la muestra de 100 que se ha decidido como idónea, entonces sé que ( va a estar  entre 16 169 9 y 171 ( es de dec cir entre

-d y

tiene

, y despejando n queda:

habrá de ser

+d). . Como ad ade emás se

(4.4) La expresi expresión ón (4. (4.4) 4) tie tiene ne la d desve esventaja ntaja de de depend pender er de usualmente.

, valo valorr des descono conocido cido

Tenemos varias alternativas para resolver este inconveniente: 1º )Sustituir por el valor máximo que se piense pueda tomar, según nuestras experiencias previas. En el peor de los casos n será mayor de lo necesario. Quedaría:

(4.5) 2º) Tomar una muestra piloto de tamaño n´ pequeño, obtener en ella su varianza y entonces:

 

(4.6) con co nt

en la Tab Tabla la d de e la t d de e St Stude udent nt c con on n n´-1 ´-1 g g.l. .l.

3º) Enunci Enunciar ar la pre precis cisión ión en térm término inos s de fra fracci ccion ones es de ocurra q qu ue (4.4) queda:

. Así Así,, si de desea seamos mos

con u un na c co onfianza 1 1-- , c ca ambiando d2 p  por or K2

 en la

(4.7) Ejemplo : Determinar el tamaño de muestra requerido para obtener la estatura media de la población, con una precisión de 1 cm, si la varianza poblacional es = 25. Tomando n=97 individuos, según la fórmula (4.4) la media de ellos estará en el interv int ervalo alo x 1al 95% de confi confianz anza. a. El red redond ondeo eo se ha hace ce siem siempre pre por exce exceso so pasa asegurar la precisión. Ejemplo 4: Determinar el tamaño de la muestra para obtener la estatura media de una una po pobla blació ción n co con n una p prec recisi isión ón de 0,3 .  Ahora n=43, según la expresión (4.7),y, entonce entonces s la media está en

0,3

Ejemplo 5: Con datos del Ejemplo 1 como muestra piloto, determinar n con precisión d=4cm

 Ahora n´=10 y . Como 6 < 10 = n´, ello indica que con la muestra piloto nos basta para la precisión deseada. Ejemplo 6: Igual que el anterior pero exigiendo un d = 1 cm.

De nuev nuevo o n´= 10 y ahora 85 individuos más que antes.

, con lo que son prec precisos isos

 

Intervalo de confianza para una proporción. Vamos a empezar este apartado planteando un ejemplo. Ejemplo 7: Si de 100 personas encuestadas, 30 se manifiestan a favor de un determinado partido político, ¿qué porcentaje de votos obtendría dicho partido de celebrarse en ese momento las elecciones? (confianza del 95%) Obsérvese que x="nº de individuos, entre los 100 encuestados, que votarán al candidato" es una Binomial de parámetro n = 100 y p desconocido. El objetivo es determinar p teniendo en cuenta que x sigue una B(n,p), con n = 100 y x = 30 el valor obtenido experimentalmente de esa Binomial. Conviene expresar  que todo lo que sigue contiene las fórmulas para p expresadas en tantos por  uno, no en %. Intervalo. La distribución Binomial, bajo ciertas circunstancias, se aproxima a una Normal. Los resultados siguientes se basan en esta aproximación. La expresión más tradicional del intervalo de confianza para una proporción p es la siguiente:

(4.8) Esta expresión es válida si x > 20 y n-x >20.Tiene la ventaja de ser cómoda, pero a cambio es más imprecisa y tiene unas condiciones de validez más exigentes. La siguiente expresión es más exacta (pero más incómoda) y para su validez basta con que sean x > 5 y n - x > 5:

(4.9) Ejemplo (continuación):  Aquí n = 100 y x = 30. Como x > 20 y n - x = 70 > 20, se puede utiliza utilizarr (4.8):

 

, es decir que piensan votar al partido entre un 20,52% y un 39,48% de la población. Si usamos la (4.9) que es más exacta:

=

(0,2145

;

0,4011) para obtener este intervalo, se han considerado en primer lugar todos los signos (-) y después todos los signos (+). Tamaño de la muestra Ejemplo 8: En relación con el ejemplo anterior, el partido político desea realizar  una encuest encuesta a co con n el fin de det determ ermina inarr el por porcen centaj taje e de votant votantes es con una precisión del 3% ¿A cuántos individuos hay que encuestar (confianza del 95%). El objetivo es decidir a qué número n de individuos hay que preguntar para que el porcentaje de votos favorables entre ellos difiera del porcentaje nacional en menos de d = 3%. Esto garantiza que, tomada la muestra, si el porcentaje en ella es de 30% el porcentaje nacional será 27 27% % < p < 33%, e es s dec decir ir que p está en 3 30% 0% 3% co con n una confianza del 95% De un modo gener general, al, si d es la precisió precisión n (máxima diferen diferencia cia a admit admitir ir entre la estimación y p), hay una fórmula paralela a la (4.4):

(4.10) La idea es tener garantías de que tomando una muestra de tamaño n, la proporción poblacional p de individuos que verifican la característica es, con una confianza de (1 - ), alg alguno uno de los valores entre p 1 d, con p1 la proporción en la muestra y d un número dado de antemano. El problema, una vez más, es que la expresión anterior depende de p ( que es descon des conoc ocido ido). ). Pue Puede de de demos mostra trarse rse que pq es tan tanto to mayor mayor cu cuant anto o más se aproxime p a 0,5 alcanzando el máximo cuando p = 0,5, o sea,

(4.11). Como sucede en todas las fórmulas de tamaño de muestra, n es tanto más grande cuanto mayor sea la confianza del intervalo y cuanto menor  sea se a d (c (cua uant nta a ma mayo yorr prec precis isió ión n se de dese see) e).. La (4 (4.1 .11) 1) ap apor orta ta un una a

 

novedad: el tamaño de la muestra es más grande cuanto más se aproxime p al valo va lorr 0, 0,5, 5, dism dismin inuy uyen endo do cu cuan ando do no nos s en enfr fren ente temo mos s a ca cara ract cter eres es ra raro ros s (p pequeño) o muy frecuentes (p grande). Igual sucede con la anchura de los intervalos de confianza para p: son más anchos cuanto más se acerque p a 0,5. Volviendo al problema del desconocimiento de p, la aplicación de (4.10) puede hacerse de dos modos: 1º) Si no se tiene idea alguna acerca de su posible valor, sustituir pq por 1/4, quedando:

(4.12) 2º) Si se tiene alguna información, sustituir p por el valor más cercano posible ( y compatible con la información) a 0,5. Ejemplo 8 (continuación): Si el partido es nuevo y no se tiene idea acerca del porcentaje posible de votos

favorables, sería

.

Si el partido sabe que nunca en elecciones anteriores ha obtenido más del 30% de los votos y le sorprendería que esto no siguiera siendo así, sería 

 

Bibliografía https://thales.cica.es/rd/Recursos/rd97/Unidades rsos/rd97/UnidadesDidacticas/28-1-u-i.html Didacticas/28-1-u-i.html https://thales.cica.es/rd/Recu

https://es.wikipedia.org/wiki/Intervalo_de_confianza

http://www.geociencias.unam.mx/~ramon/EstInf/Clase6.pdf 

 

INSTITUTO TECNOLÓGICO SUPERIOR DEL SUR DEL ESTADO DE YUCATÁN

“Probabilidad y estadística descriptiva”

Alumno: Chuc Chan Deysi Carolina (171T0248)

DOCENTE:

Jorge Manuel Dzul Huchim

INGENIERIA EN GESTIÓN EMPRESARIAL

 

3° “C” semestre 2018-A

 

 

Oxcutzcab, Yucatán, México

INSTITUTO TECNOLÓGICO SUPERIOR DEL SUR DEL ESTADO DE YUCATÁN

“Probabilidad y estadística descriptiva” “Intervalos de Confianza”

Alumno: Chuc Chan Deysi Carolina (171T0248) DOCENTE: Jorge Manuel Dzul Huchim INGENIERIA EN GESTIÓN EMPRESARIAL

 

3° “C” semestre 2018-A

  5 de diciembre de 2018: Oxcutzcab, Yucatán, México

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF