Cap 6 - Muestreo y Distribuciones Muestrales

October 14, 2017 | Author: DAVIDBROS64 | Category: Sampling (Statistics), Random Variable, Variance, Probability, Probability And Statistics
Share Embed Donate


Short Description

Download Cap 6 - Muestreo y Distribuciones Muestrales...

Description

MUESTREO Y DlSTRlBUClONES MUESTRALES

6.1 MUESTREO DE UNA POBLACI~N En lo que resta de este volumen, dedicaremos gran parte de nuestra atenci6n a analizar problemas que tienen por objeto averiguar algo acerca de las propiedades de un grupo grande de observaciones, a partir de la informaci6n proporcionada por un subconjunto del mismo relativamente pequefio. Llamaremos poblaci6n a1 grupo grande del que deseamos obtener informaci6n y muestra a1 subconjunto de individuos de la poblaci6n cuyas caractensticas han sido observadas. Citamos a continuaci6n algunos ejemplos de poblaciones que podn'an resultar de inter&: 1. 2. 3. 4. 5.

La renta de todas las familias que viven en la ciudad de Chicago. Los dividendos anuales de cada uno de 10s valores negociados en la bolsa de Nueva York. El coste de todas las reclamaciones que recibe una compaiiia de seguros por accidentes de coche. El coste anual de reparaci6n de todos 10s coches de un deterrninado modelo. Los erryes que aparecen en una lista de facturas cobradas.

En particular, podriamos estar interesados en averiguar algo acerca de alguna caracteristica particular, o atributo, de estas poblaciones. Por ejemplo, podriamos tener interCs en realizar inferencias acerca de la media o la varianza de la distribuci6n poblacional de las rentas familiares en Chicago, o sobre la proporcion de familias de esta ciudad que tienen una renta anual inferior a 15.000 d6lares. La principal raz6n para observar una muCstra en lugar de la poblaci6n completa es el hecho de que la recogida de toda la informaci6n ser8, en la mayonla de las ocasiones, exageradamente cara. Incluso en 10s casos en que se dispone de recursos suficientes para analizar la poblaci6n completa, puede resultar preferible dedicar esos recursos a un subconjunto pequefio de la poblaci6n, con la esperanza de que tal concentraci6n de esfuerzo produzca medidas m8s precisas. Asi, por ejemplo, es sabido que en

el censo de poblacidn por decenios de Estados Unidos, algunos grupos aparecen representados en una proporci6n mucho menor de la que les corresponderia'. El objetivo de extraer una mueitra de una poblaci6n serh, en general, poder hacer afirmaciones que tengan cierta validez sobre la poblaci6n completa. Por tanto, es importante que la muestra sea representativa de la poblaci6n. Supongamos, por ejemplo, que el director de una agencia de publicidad quiere analizar la respuesta de 10s consurnidores ante un nuevo prducto alimenticio. Resultaria poco aconsejable que se limitase a consultar a su circulo de amigos o a sus vecinos m L pr6ximos. Es muy poco probable que tales grupos reflejen adecuadarnente el espechu de opiniones de la poblaci6n completa, y puede ocunir incluso que se encuentren en uno de 10s extremos de tal espectro. Para evitar este t i p de problemas, y lograr mferencias vilidas acerca la poblaci6n, es importante que el proceso de selecci6n de la muestra est6 basado en el principio de aleatorizaci6n. La forma m k sencilla para conseguir esto es diseiiar un mecanismo de selecdi6n en el cud todas las muestras de un tamaiio dado tengan la misma probabilidad de ser elegidas.

Muestreo aleatoriosimple Supongamos que se ha de seleccionar una muestra de n objetos de una poblaci6n de N objetos. Un procedimiento de muestreo aleatorio simple es aquel en el que todas las posibles muestras de n objetos tienen la misma probabilidad de ser escogidas. Este mCtodo se usa con tanta frecuencia que, en muchos casos, el adjetivo simple se elimina, y a las muestras obtenidas por procedimientos de este tip0 se las denomina muestras aleatorias. Puede pensarse en el proceso de muestreo aleatorio simple de la forma siguiente: supongamos que 10s N miembros de la poblaci6n se introducen en un enorme sombrero y se mezclan concienzudamente. Una muestra aleatoria se obtiene extrayendo n de ellos. En la prhctica, no es necesario hacerlo de este m d o ; pueden usarse tablas de numeros aleatorios, como las que aparecen en la Tabla 4 del A@ndice, para conseguir el mismo resultado. Si etiquetamos a 10s N miembros de la poblaci6n con ndmeros desde 1 hash N, podemos comenzar desde un n h e r o arbitrario de la tabla y seleccionar 10s individuos cuyas etiquetas corresponden a 10s nlimeros que siguen hasta que se haya completado una muestra de n miembros. Las tablas e s t h construidas de forma que este proceso tiene las mismas propiedades que el muesmo aleatorio simple. Una de las posibles formas de construir una tabla de niuneros aleatorios consistiria en meter en una urna 10 bolas numeradas de 0 a 9. DespuCs de haberlas mezclado bien, se extrae una de las bolas y se anota su nbmero. A continuaci6n, se devuelve esta bola a la urna y se repite el proceso. Puede repethe el procedimiento para obtener niuneros con tantas cifras como se precisen. Este proceso tiene la propiedad de que cada uno de 10s posibles niuneros tiene la misma probabilidad de ser elegido, y las elecciones sucesivas son independientes unas de otras; el problema es que resulta extremadamente tedioso. En la prictica, pueden generarse niuneros aleatorios de manera mucho m k dpida con la ayuda de un ordenador, ya que existen mecanismos que imitan de forma efectiva el procedimiento que acabamos de describir. En este capitulo y en 10s que siguen, nos centraremos en mktodos para analizar 10s resultados muestrales con el fin de obtener informaci6n acerca de la poblaci6n. Por el momento nos limitaremos a muestras que hayan sido seleccionadas mediante esquemas de muestreo aleatorio simple. Sin embargo, debemos aclarar que este no es el h i c o procedimiento que existe para elegir individuos de la poblacibn, y que, en determinadas circunstancias, pueden resultar preferibles esquemas de muestreo altemativos. Posponemos la discusi6n acerca de 10s mCtodos de selecci6n de muestras hasta el Capitulo 18, en el que ademhs describiremos de forma mis completa el uso de las tablas de ndmeros aleatorios. El principio de aleatorizacidn en la selecci6n de 10s miembros de la muestra proporciona cierta protecci6n contra la presencia en la muestra de individuos no representativos de la poblacibn, en el Ver, por ejemplo, H.Hogan, "The 1990 post-enumeration survey: An overview, "American Statistician, 46 (1992),261-269

sentido de que, en media, si se extraen repetidas muestras de la poblaci6n seg6n este mecanismo, ning6n subgrupo particular deberia estar mBs representado en la muestra. AdemBs, el concepto de distribucidn muestral nos permite determinar la probabilidad de que la muestra particular que se ha obtenido no sea representativa en un determinado grado. Sobre la base de la informaci6n muestral, nuestro objetivo serB hacer inferencias acerca de la poblaci6n de la que procede la muestra. La distribucidn de todos 10s valores de inter& de esta poblaci6n puede ser representada a travCs de una variable aleatoria. Seria demasiado ambicioso pretender describir completarnente la distribuci6n poblacional bashdonos en una pequeiia muestra aleatoria de observaciones. Sin embargo, si seremos capaces de hacer inferencias bastante firmes sobre algunas de las caracteristicas m b importantes de la distribuci6n poblacional. Por ejemplo, podemos estar interesados en hacer afirmaciones acerca de su media y su varianza. Asi, por ejemplo, dada una muestra aleatoria de consumo de combustible de 20 coches de un determinado modelo, se puede hacer inferencia sobre la media y la varianza del consumo de combustible de todos 10s coches de ese modelo. Tal inferencia estarh basada en la informaci6n muestral, y serB natural planteamos cuestiones del tipo: "Si el consumo de combustible de todos 10s coches de un determinado modelo, medido en kil6metros por litro, tiene una media de 10 y una desviaci6n tipica de 2, ~cuAIes la probabilidad de que para una muestra aleatoria de 18 coches de este tipo, el consumo medio de combustible sea menor de 8 kil6metros por litro?'. Al planteamos la pregunta de este modo, estamos asumiendo implicitamente que las inferencias sobre la media poblacional estarh basadas en la media o promedio muestral. Es importante distinguir entre las caracteristicas poblacionales y sus correspondientes cantidades muestrales. En el ejemplo del p h a f o anterior, el consumo de combustible de todos 10s autom6viles de ese modelo tendrii una distribuci6n con una determinada media. Esta media, que es un atributo de la poblaci6n, es un n6mero fijo pero desconocido. Para hacer inferencia sobre tal atributo, se extrae una muestra de la poblaci6n y se calcula su media muestral. Puesto que para cada muestra que se extraiga se obtendri un valor diferente de la media muestral, podemos pensar en esta cantidad como en una variable aleatoria con una cierta distribuci6n de probabilidad. La distribuci6n de probabilidades de 10s posibles resultados muestrales proporciona una base para realizar inferencias sobre la poblaci6n. Nuestro objetivo en este capitulo serB examinar las propiedades de distribuciones muestrales de este tipo.

Estadisticos y distribuciones muestrales Supongamos que se ha extraido una muestra aleatoria de una poblaci6n y que se desea hacer inferencia sobre ciertas caracteristicas de la distribuci6n de la poblaci6n. Esta inferencia estarB basada en alg6n estadistico, es decir, en alguna funci6n particular de la informaci6n muestral. La distribucion muestral, o distribucidn en el muestreo, de este estadistico es la distribuci6n de probabilidades de 10s valores que puede tomar el estadistico a lo largo de todas las posibles muestras con el mismo n6mero de observaciones que pueden ser extraidas de la poblaci6n.

(

Para ilustrar la importancia del concepto de distribuci6n muestral, consideremos el caso de un supervisor con seis empleados, cuyas experiencias (medidas en aiios de trabajo) son Se eligen a1 azar cuatro de estos empleados y se les asigna una nueva tarea. El n6mero medio de aiios de experiencia para 10s seis empleados es

Estamos interesados en el n6mero medio de aiios de experiencia para 10s cuatro empleados concretos a 10s que les ha sido asignado el cambio de tarea. Podemos pensar en este ejemplo como en

una muestra aleatoria simple de cuatro valores extraidos de una poblaci6n de seis. El numero de muestras diferentes que pueden ser seleccionadas es quince. En la Tabla 6.1 aparece cada una de las posibles muestras con su correspondientemedia muestral. Las muestras como (2,4,6,7) aparecen dos veces porque hay dos empleados en la poblaci6n con seis aiios de experiencia de trabajo.

TABLA 6.1 Posibles muestras de cuatro observaciones con sus correspondientes medias muestrales, para la poblaci6n 2,4,6,6,7,8 MUESTRA

MEDIA MUESTRAL

MUESTRA

MEDIA MUESTRAL

Puesto que todas las posibles muestras tienen la misma probabilidad de ser seleccionadas, la probabilidad que tiene cada una de las muestras de ser elegida es 1/15. Usando esta informaci6n, podemos determinar la probabilidad de cada uno de 10s valores de la media muestral. Por ejemplo, en la Tabla 6.1 vemos que tres de las posibles muestras tienen media 5,75. Por tanto, la probabilidad de que 10s cuatro empleados seleccionados para la nueva tarea tengan una experiencia media de 5,75 aiios es de 3/15. De la misma forma podemos encontrar la probabilidad de cada una de las posibles medias muestrales. La colecci6n de todas estas probabilidades constituye la distribucibn en el muestreo de la media muestral. La forma m8s simple de describir esta distribucibn muestril es, posiblemente, a travCs de su funci6n de probabilidad. Si representamos la media muestral por X, tenemos

El gr8fico de esta funci6n de probabilidad aparece en la Figura 6.1. N6tese que, mientras que el nlimero de aiios de trabajo de 10s seis trabajadores se mueve entre dos y ocho, 10s valores posibles de la media muestral tienen un rango mucho m8s restringido: de 4,5 a 6,75. Ademis, la mayor parte de la masa de probabilidad se sitlia en la zona central de este rango. En la siguiente seccibn, analizaremos la distribuci6n en el muestreo de la media muestral para poblaciones m8s generales.

DISTRIBUCI~N EN EL MUESTREO

193

DE LA MEDIA MUESTRAL

6.2 DISTRIBUCI~NEN EL MUESTREO DE LA MEDIA MUESTRAL Supongamos que se ha extraido una muestra de n observaciones de una poblacidn con media px y varianza axZ, y representemos 10s elementos de la muestra por XI, X2, ...X.. Antes de que la muestra haya sido observada, habri incertidumbre sobre 10s resultados. Esta incertidumbre es consecuencia del hecho de que cada uno de 10s miembros de la muestra es una variable aleatoria con media p, y varianza a:. Asumamos por el momento que nuestro principal interis es hacer inferencias sobre la media poblacional p,. Un punto de partida obvio es el promedio de 10s valores muestrales.

Definici6n: Sea XI,Xz, ...X. una muestra aleatoria de una poblaci6n. El valor medio de tales observaciones 1 "

X = -cxj n i=l

se denomina media muestral.

Queremos analizar la distribuci6n muestkal de la variable aleatoria xZ.En primer lugar, determinaremos la media de esta distribuci6n. En las secciones 4.4 y 5.4, se vio que, para variables aleatorias discretas y continuas, la esperanza de una suma es la suma de las esperanzas y, por tanto,

FIGURA 6.1 Funci6n de probabilidad de la distribuci6n muestral de la media de muestras de cuatro observaciones extraidas de la poblaci6n 2,4,6,6,7,8

A1 igual que en 10s Capitulos 4 y 5, distinguiremos entre una variable aleatoria y 10s valores especificos que puede tomar. Asf, cuando la muestra ha sido extraida, podremos observar 10s valores espegficos x,, x2, ... x.. con media T = X1., xJn. En este contexto, F es una realizaci6n concreta de la variable aleatoria X.

.

-

Puesto que cada variable aleatoria Xi tiene media px, podemos escribir

La media muestral es la suma de 10s valores de la muestra multiplicada por l/n, y, por tanto, su valor esperado sera

En consecuencia, la media de la distribucidn en el muestreo de la media muestral es la media poblacional. Esto nos asegura que, si se extraen repetidas muestras independientes de n observaciones de una poblacidn, entonces, cuando el n ~ m e r ode muestras se hace muy grande, el promedio de las medias muestrales se hace muy pr6ximo a la verdadera media poblacional. Este resultado es G a importante consecuencia del muestreo aleatorio, y refleja la proteccidn que este tip0 de muestreo proporciona contra observaciones muestrales no representativas de la poblacidn. Por supuesto, la media obtenida para una muestra particular puede ser mucho mayor o mucho menor que la media poblacional. Sin embargo, en la media, no hay razones para esperar un valor que sea mayor o menor que el valor poblacional.

EJEMPLO

6.1

Vamos a confirmar este resultado para el ejemplo de la Tabla 6.1, en el que considerhbamos una poblacidn de aiios de experiencia para seis empleados:

La media de esta poblacidn es simplemente la media de estos seis valores, es decir, px= 5 3 . Habiamos encontrado que la distribuci6n de probabilidad de la media muestral para muestras de cuatro observaciones de esta poblaci6n puede ser representada por la siguiente funci6n de probabilidad:

Por tanto, el valor esperado de la media muestral es

que es la media poblacional, px. De esta forma hemos probado que la distribucidn de la media muestral esth centrada en la media poblacional. Nos interesarh determinar tambiCn lo cerca que puede estar la media muestral de la media poblacional. Supongamos, por ejemplo, que para una muestra aleatoria de 20 coches de un determinado modelo, se obtuvo un consumo medio de combustible de un litro en 10 kil6metros. iQuC diferencia habri entre este valor y la media del consumo de todos 10s coches de este modelo? Las cuestiones de este tip0 van a depender de la varianza de la distribuci6n muestral de 2. Si el tamaiio de la poblacidn es muy grande con respecto al tamaiio muestral, entonces, una consecuencia del muestreo aleatorio simple es que la distribuci6n de cada uno de 10s valores de la muesua

DISTRIBUCI~N EN EL MUESTREO DE LA MEDIA MUESTRAL

195

es independiente de la de 10s otros. Recordemos de las Secciones 4.4 y 5.4 que, en tal caso, la varianza de la suma es la suma de las varianzas y, por tanto, tendremos

Puesto que cada Xi tiene varianza,:a se sigue que

)

Var E X i ( i ~ l

= nux2

Llegamos asi a que la varianza de la media muestral es

Esto implica que la varianza de la distribuci6n muestral de X decrece a medida que aumenta el tamaiio muestral n. Lo que esto nos indica es que, cuantas mhs observaciones tenga la muestra, mhs concentrada estarh la distribuci6n muestral de la media muestral alrededor de la media poblacional. En otras palabras, cuanto mayor sea la muestra, mhs segura sera nuestra inferencia acerca de la media poblacional. Y esto es lo que esperibamos: cuanto mayor sea la cantidad de informaci6n que se ha extraido de una poblacibn, mis probable seri que acertemos cosas sobre caractensticas (tales como la media) de dicha poblaci6n. Representaremos por:a la varianza de la media muestral; la correspondiente desviaci6n tipica, que recibe el nombre de error esthndar de X,vendrfi dada por

N de miemSi el n~meron de miembros de la muestra no es una fracci6n muy pequeiia del n ~ m e r o bros de la poblaci6n. no podremos asumir que 10s valores individuales de la muestra se distribuyen independientemente unos de otros. Por ejemplo,.puesto que un individuo de la poblaci6n no puede ser incluido en la muestra m b de una vez, la probabilidad de que cualquier miembro concreto de la poblaci6n sea el segundo de 10s elegidos en la muestra dependerh de cud fue el primero de 10s miembros escogidos. El argument0 usado en el p k a f o anterior para encontrar la varianza de la media muestral no es vhlido en este caso. De hecho, puede probarse que la expresi6n adecuada en este caso' es

A1 t6rmino (N - n)l(N - 1) se le suele dar el nombre de factor de correccibn por poblucibnfmita. Hasta a h ~ r ahemos encontrado expresiones para la media y la varianza de la distribuci6n muestral de X.Afortunadamente, para la mayoria de las aplicaciones, esto bastarh para caracterizar completamente su distribuci6n. Se puede probar que, si la poblaci6n de la que se extrajo la muestra es normal, la media muestral sigue tambiCn una distribuci6n normal. Si el tamaiio muestral es una proporci6n pequefia del tamaiio poblacional, entonces, restando la media y dividiendo por el error esthndar, se obtiene una variable aleatoria

Ya habtarnos encontrado este fen6meno en el Capttulo 4. La varianza de la distribuci6n hipergeomitrica es (N-n)/(N-1) vexes la varianza de la distribuci6n binomial.

que sigue una distribuci6n normal esthdar. Ademas, el teorema central del limite nos asegura que, incluso cuando la distribucibn de la poblacibn no es normal, si el tamaiio muestral n es suficientemente grande, la distribuci6n de X sera tambiCn muy prdxima a la normal y, por tanto, la Ecuaci6n (6.2.1) seguirh una distribuci6n muy pr6xima a la normal esthdar. Los resultados de esta seccidn se resumen en el cuadro que aparece a continuaci6n.

Distribuci6n muestral de 5 Sea f la media de una muestra aleatoria de n observaciones extraidas de una poblaci6n con media px y varianza ax2. Entonces, (i) La distribucidn muestral de f tiene media px ,es decir, E(X) = Px (ii) La distribuci6n muestral de ,f tiene desviaci6n tipica aa =

ax 3

Esta cantidad recibe el nombre de error estirndar de f. (iii) Si el tamaiio muegral n no es una fracci6n pequeiia del tamaiio poblacional N,entonces, el error esthdar de X es u.=

3 JE

(iv) Si la distribucidn de la poblacidn es normal, entonces, la variable aleatoria

z = X - px m

\

sigue una distribuci6n normal estfindar. (v) Si la distribuci6n de la poblaci6n no es normal per0 el tamaiio muestral n es suficientemente grande, entonces, del teorema central del limite se sigue que, el resultado del apartado (iv) es aproximadamente viilido.

En la Figura 6.2, aparece la distribuci6n muestral de la media muestral para muestras de tamaiios n = 25 y n = 100, extraidas de una poblaci6n normal. Puede observarse que ambas distribuciones es-

thn centradas en la media poblacional, per0 que, cuando el tamaiio muestral se hace mayor, la distribucidn se concentra miis alrededor de la media, reflejando el hecho de que el error esthdar de la media muestral es una funci6n decreciente del nlimero de observaciones de la muestra. Asi, tal como cabria esperar, la probabilidad de que la media muestral difiera de la media poblacional en una cantidad fija decrece a medida que aurnenta el tamaiio muestral. A continuaci6n, ilustraremos las ideas de esta secci6n con algunos ejemplos concretos que se refieren a muestreo en poblaciones con distribuci6n normal.

EJEMPLO

6.2

.

Supongamos que el increment0 porcentual de 10s salarios de 10s funcionarios de todas las corporaciones medianas se distribuye siguiendo una normal con media 12,2% y desviaci6n tipica 3,6%. Se toma una muestra aleatoria de nueve observaciones de esta poblaci6n de incrementos porcentuales de salario. iCut4l es la probabilidad de que la media muestral .sea menor del lo%?

DISTRIBUCI~N EN EL MUESTREO DE LA MEDIA MUESTRAL

197

FIGURA 6.2 Funci6n de densidad de probabilidad para las medias muestrales de muestras de 25 y de 100 observaciones de una dishibuci6n normal con media 100 y desviaci6n tipica 5

Tenemos )(LX=

122

UX=

3,6

n =9

Representemos por 2 la media muestral. Debemos calcular

donde el error esthdar de la dishibuci6n muestral de la media muestral es

Por consiguiente, la probabilidad requerida es

donde la variable aleatoria Z sigue una dishibuci6n normal esthdar. Por tanto, usando la Tabla 3 del Aptndice, tenemos

Concluimos, entonces, que la probabilidad de que la media muestral sea menor que un 10% es s610 0,0336.

EJEMPLO

6.3

Un fabricante declara que la duraci6n de, las bujias que 61 fabrica sigue una distribuci6n normal con una media de 36.000 kildmetros y una desviacidn esthdar de 4.000 kil6metros. Para una muestra aleatoria de diecistis bujias, se obtuvo una duraci6n media de 34.500 kil6metros. Si la afirmaci6n

del fabricante es corrects, jcual es la probabilidad de obtener una media muestral tan pequeiia como Csta o menor? Si X representa la media muestral, entonces, la probabilidad que queremos calcular es

donde se asume que la media muestral es px = 36.000. y

Por tanto.

siendo Z una distribuci6n normal esthdar. La Figura 6.3(a) muestra la funci6n de densidad de probabilidad de X; la zona sombreada es la probabilidad de que la media muestral sea menor o igual que 34.500. En la Figura 6.3(b) se ha sombreado la misma probabilidad per0 en este caso sobre el grfifico de la funci6n de densidad de la distribuci6n normal esthdar. La probabilidad es

como puede verse en la Tabla 3 del ~ ~ C n d i c e .

FIGURA 6.3 (a) Probabilidad de que la media muestral sea menor que 34.500 en muestras de 16 observaciones de una distribuci6n normal con media 36.000 y desviaci6n tipica 4.000; la media muestral seguirh una ditribuci6n normal con media 36.000 y desviaci6n tipica 1.000

FIGURA 6.3 (b.) Probabilidad de que una variable aleatoria con distribuci6n normal esthdar sea menor que -1,5

El resultado nos indicaque, en el caso de que la afirmaci6n del fabricante fuese corrects, la probabilidad de obtener un valor tan bajo de la media muestral sena bastante pequefia. Esto introduce ciertas dudas sobre la veracidad de la afirmaci6n.En el Capitulo 9 discutiremos un mCtodo general para contrastar tales afirmaciones o hip6tesis sobre la base de la evidencia muestral.

6.3 DISTRIBUCI~NEN EL MUESTREO DE UNA PROPORCI~N MUESTRAL Como ya se dijo en la Secci6n 4.5, si se repite n veces un experiment0 que tiene probabilidad de Cxito p, entonces, la variable aleatoria X, que recoge el ndmero total de Cxitos en las n repeticiones, sigue una distribuci6n binomial. Un problema bastante comdn consiste en que el parhetro p sea desconocido. Por ejemplo, podemos estar interesados en determinar cual es la proporci6n del electorado que tiene intenci6n de votar a un determinado candidato, o la proporci6n de lectores de revistas que podrian estar en el mercado de un product0 especifico. En situaciones de este tipo, sera natural basar nuestra inferencia en la proporci6n de Cxitos en una muestra tomada de la poblaci6n que nos interese.

Definici6n: Sea Xel ndmero de Cxitos en una muestra binomial de n observaciones, donde la probabilidad de Cxito es p. (En la mayoria de las aplicaciones, el parhetrop sera la proporci6n de individuos de una gran poblaci6n que posean la caractenstica de inter&.) Entonces, la proporci6n de Cxitos en la muestra

I

recibe el nombre de proporei6n rnuestra14. La media y la varianza de la distribucidn muestral de la proporci6n muestral pueden deducirse fiicilmente a partir de la media y la varianza del ndmero de Cxitos que, como vimos en la Secci6n 4.5, vienen dadas por

E(X) = np

Var(X) = np(1 - p)

De nuevo, distinguiremos entre una variable aleatoria y sus posibles realizaciones concretas. Por ejemplo, en una muestra concreta podemos observar x Bxitos, en cuyo caso la proporci6n muestral serAFx = x h . Entonces,bx es una realizaci6n particular de la variable aleatoria Fx.

200

MUESTREO Y DISTRIBUCIONES MUESTRALES

De aqui se deduce que

Es decir, la media de la proporci6n muestral es la proporci6np de Cxitos en la poblaci6n. Su varianza es

De riuevo, la desviaci6n tipica de la proporci6n muestral, que es la raiz cuadrada de su varianza, recibe el nombre de errbk estandar. Si el ndmero N de individuos en la poblaci6n no es demasiado grande cornparado con el ndmero de individuos de la muestra, en la expresi6n de la varianza de la proporci6n muestral serh necesaria una correcci6n por poblaci6n finita. La varianza serh entonces

Ya se dijo el la Secci6n 5.7 que, como una consecuencia del teorema central del limite, la distribuci6n del ndmero de Cxitos es aproximadamente normal para tamaiios muestrales grandes. Esto mismo es tambikn cierto para la proporci6n de Cxitos. Por tanto, si restamos a la proporci6n muestral su media p y la dividimos por su error estbdar, obtendremos una variable aleatoria con distribuci6n normal esthdar. -

Distribucibn en el muestreo de una proporci6n muestral sea Bx la proporci6n de txitos en una muestra aleatoria de n observaciones. Entonces (i) La distribuci6n muestral de fix fiene mediap, es decir, E(Dx) = P (ii) La distribucidn rnuestral de tiene desviaci6n tipica

ix

.=/T p(1 -PI

La cantidad ub recibe el nombre de error esthdar de fix. (iii) Si el niunero n de individuos de la muestra no es una proporci6n pequefia del n6mero N de individuos de la poblaci6n, entonces, el error esthdar de fix es

q=,lT/zl p(1-P)

N-n

(iv) Si el tamaiio muestral es grande ', entonces, la variable aleatoria

z= i k l ! se distribuye aproximadamentecomo una normal estindar.

'En general, la aproximaci6n es satisfactoria para muestras de 50 observaciones o mhs. La-calidad de la aproxirnacidn dependerh tambiCn de p; lo ideal es que se verifique np (1 -p) > 9.

DISTRIBUCI~N EN EL MUESTREO DE UNA PROPORCI6N MUESTRAL

20 1

N6tese que para p fijo, el error esthndar de la proporci6n muestral disminuye a medida que crece el tamaiio muestral. Esto implica que, a1 aumentar el tamaiio muestral, la distribuci6n de jx se concentra rnhs alrededor de su media, como puede observarse en la Figura 6.4.Esto a su vez supone que, para cualquier proporcidn poblacional particular, la probabilidad de que a1 proporci6n muestral y la poblacional difieran en rnhs de una cantidad fija diminuye a medida que crece el tamaiio muestral. En otras palabras, si tomamos una muestra mayor de la poblacibn, nuestra inferencia acerca de la proporci6n de individuos que poseen alguna caracteristica particular se harh rnhs firme. Cuando el tamaiio muestral es grande, la aproxirnaci6n normal de la distribuci6n binomial proporciona un procedimiento muy adecuado para calcular la probabilidad de que la proporci6n muestral estC dentro de un determinado rango. Vamos a ilustrar esto con 10s ejemplos siguientes.

EJEMPLO

6.4

Se toma una muestra de 250 casas de una poblaci6n de edificios antiguos para estimar la proporci6n de casas de este tipo cuya instalaci6n elCctrica resulta insegura. Supongamos que, de hecho, el 30% de todas 10s edificios de esta poblaci6n tienen una instalaci6n insegura. Hallar la probabilidad de que la proporci6n de edificios de la muestra con instalacidn insegura estC entre 0,25y 0,35. Tenemos n 7 250 p = 0,30 Representemos por & la proporci6n de casas de la muestra que tienen una inst@aci6n insegura. Se tiene

donde el error esthndar de la distribuci6n rnueskal de-la proporci6n muestral es

FIGURA 6.4 Funci6n de densidad de probabilidad de las proporciones muestrales en muestras de 100 y 400 observaciones cuando la proporci6n poblacional es 0,8

La probabilidad requerida seri entonces

siendo Z una variable aleatoria con distribuci6n normal esthndar, lo cual nos proporciona una buena aproximaci6n. Usando la Tabla 3 del ApCndice,

Por tanto, la proporci6n de casas con instalaci6n insegura estai6 dentro de este rango para, aproximadamente, el 91,5% de las muestras de 250 observaciones de esta poblaci6n.

EJEMPLO

6.5

Se ha estimado que el 43% de 10s licenciados en economia consideran que es muy importante que se imparta un curso de Ctica en economia para inculcar valores morales a 10s estudiantes '. Hallar la probabilidad de que m k de la mitad de 10s 80 licenciados en economia de una muestra opinen de este modo. Nos indican que n = 80 p = 0,43 Si representamos porOx la proporci6n muestral, la probabilidad que se nos pide es

El error esthndar de la distribuci6n muestral de la proporci6n muestral es

FIGURA 6.5 La probabilidad de que una variable aleatoria normal esthndar sea mayor que 1,27. ~ s t es a la probabilidad de que la proporci6n muestral sea mayor que 0,50 para una muestra de 80 observaciones cuando la proporci6n poblacional es 0,43

6F.R .David, L. M. Anderson y K. W. Lawrimore, "Perspectives on business ethics in management education", S.A.M. Advanced Management Journal, 55, no.4 (1990), 26-32.

DISTRIBUCI~N EN EL MUESTREO

DE UNA PROPORC16N MUESTRAL

203

Por tanto,

La variable aleatoria Z sigue aproximadamente una distribucidn normal esthndar. Usando la Tabla 3 del Aptndice, obtenemos que

Por tanto, la probabilidad de que mhs de la mitad de 10s individuos de la muestra tengan esta opinidn es aproximadarnente 0,l. Esta probabilidad se corresponde con el Area sombreada en el grhfico de la curva de densidad d e la normal estandar que aparece en la Figura 6.5.

EJERCICIOS

-

1. Cuando un cierto proceso de producci6n estA funcionando correctamente, la resistencia en ohmios de 10s componentes producidos sigue una distribuci6n normal con media 92 y desviaci6n tipica 3,6. Se toma una muestra aleatoria de cuatro componentes. a) Hallar la media de la distribuci6n muestral de la media muestral de la resistencia. b) Hallar la varianza de la media muestral. C) Hallar el error estindar de la media muestral. d) iCu6l es la probabilidad de que la media muestral resulte ser mayor que 93 ohmios? 2. La duraci6n de las bombillas producidas por un cierto fabricante tiene una media de mil doscientas , horas y una desviaci6n tipica de cuatrocientas horas. La poblaci6n sigue una distribuci6n normal. Supongamos que t6 has comprado nueve-bombillas, que pueden ser consideradas como una muestra aleatoria de la producci6n del fabricante. a) iCuAl es la media de la media muestral de la duraci6n de estas bombillas? b) iCuAl es la varianza de la media muestral? C) iCuAl ees el error esthdar de la media muestral? d) CuAl es la probabilidad de que el tiempo medio de duraci6n de tus bombillas sea de menos de mil cincuenta horas? 3. El consumo de combustible, en kil6metros por litro, de todos 10s coches de cierto modelo tiene media diez y desviaci6n tipica dos. Puede asumirse que la distribuci6n poblacional es normal. Se toma una muestra aleatoria de estos coches.

a) Hallar la probabilidad de que la media muestral del consumo de combustible sea menor que diez kildmetros por litro si (i) se ha tomado una muestra de una observaci6n. . (ii) se ha tomado una muestra de cuatro observaciones. (iii) se ha tomado una muestra de diecistis observaciones. b) Explicar por quC las tres respuestas de (a) difieren de este modo. Hacer un grifico para ilustrar el razonamiento. 4. El precio medio de venta de casas nuevas durante el liltimo aiio en cierta ciudad americana fue de 115.000 d6lares. La desviaci6n tipica de la poblaci6n fue de 25.000 d6lares. Se toma una muestra aleatoria de 100 casas nuevas de esta ciudad. a) iCuAl es la probabilidad de que la media muestral de 10s precios de venta sea menor que 110.000 d6lares? b) ~ C u 6es l la probabilidad de que la media muestral de 10s precios de venta estC entre 113.000 d6lares y 117.000 d6lares? C) iCuhl es la probabilidad de que la media muestral de 10s precios de venta estC entre 114.000 y 116.000 d6lares? d) Sin hacer 10s cAlculos, razonar en cuAl de 10s siguientes rangos resulta mAs probable que se encuentre la media muestral de 10s precios de venta:

e) Supongamos que, despu6s de haber realizado 10s ciilculos anteriores, un amigo tuyo afirma que la distribuci6n poblacional de 10s precios de venta de las casas nuevas de esta ciudad es casi con toda seguridad no normal. tQu6 podrias contestarle? 5. Los candidatos a empleados del departamento de bomberos de cierta ciudad han de realizar un examen de actitudes. Las puntuaciones en dicho examen siguen una distribuci6n normal con media 280 y desviaci6n ttpica 60. Se toma una muestra aleatoria de nueve puntuaciones de estos e x h e n e s . a) ~ C u isera l el error estindar de la media muestral de las puntuaciones? b) iCu6l es la probabilidad de que la media muestral de las puntuaciones sea menor que 270? c) ~ C u ies l la probabilidad de que la media muestral de las puntuaciones sea mayor que 250? d) Supongamos que la desviaci6n tipica poblacional fuese 40 en lugar de 60. Sin repetir 10s cilculos, establecer c6mo cambim'an las respuestas a 10s apartados (a), (b) y (c). llustrar las conclusiones con 10s graficos adecuados. 6. Se ha tomado una muestra de 16 directores de oficinas de corporaciones de una gran ciudad, con el fin de estimar el tiempo medio diario que emplean en desplazarse para ir hasta su trabajo. Supongamos que la distribuci6n de dichos tiempos en la poblaci6n sigue una normal con media de 87 minutos y desviaci6n tipica de 22 minutos. a) iCuAl es el error esthndar de la media muestral de 10s tiempos de desplazamiento? l la probabilidad de que la media muesb) ~ C u kes tral sea menor que 100 minutos? c) iCuil es la probabilidad de que la media muestral sea mayor que 80 minutos? l la probabilidad de que la media muesd) ~ C u ies tral tome un valor que est6 entre 85 y 95 minutos? e) Supongamos que se toma una segunda muestra de quince directores, independiente de la anterior. Sin hacer 10s cilculos, razonar si las probabilidades calculadas en 10s apartados (b), (c) y (d) serin mayores, menores o iguales para esta segunda muestra. Utilizar grificos para ilustrar las respuestas. 7. Una compaiiia produce cereales para el desayuno. La media del peso que contienen las cajas de estos

cereales es de doscientos gramos y su desviaci6n tipica de seis gramos. La distribucidn de 10s pesos en la poblaci6n es normal. Se eligen cuatro cajas, que pueden ser-consideradas como una muestra aleatoria del total de la producci6n. a) ~Cuiiles el error estindar de la media muestral del peso de estas cuatro cajas? b) ~Cuiiles la probabilidad de que, como media, el peso de estas cuatro cajas sea menor que 197 gramos? d la probabilidad de que, como media, el c) t ~ u es peso de estas cuatro cajas sea mayor que 206 gramos? d) ~Cuiiles la probabilidad de que, como media, el peso de estas cuatro cajas est6 entre 195 y 205 gramos? e) Se eligen al azar dos de estas cuatro cajas. iCuil es la probabilidad de que, como media, el contenido de estas dos cajas pese entre 195 y 205 gramos? 8. Supongamos que la desviaci6n tipica de la cuota pagada mensualmente por 10s estudiantes de cierta ciudad americana es de 40 d6lares. Se toma una muestra de 100 estudiantes con el fin de estimar la renta media pagada mensualmente por el total de la poblaci6n de estudiantes. a) ~ C u i sera l error estindar de la media muestral de la cuota mensual? b) ~Cuiiles la probabilidad de que la media muestral exceda a la media poblacional en m h de cinco dblares? c) ~ C u a es l la probabilidad de que la media muestral est6 mas de cuatro d6lares por debajo de la media poblacional? d) ~ C u k es l la probabilidad de que la media muestral difiera de la media poblacional en rnis de tres d6lares? 9. El tiempo que dedican a estudiar 10s estudiantes de cierta universidad en la semana anterior a 10s ex& menes finales sigue una distribuci6n normal con una desviaci6n tipica de ocho horas. Se toma una muestra aleatoria de cuatro estudiantes con el fin de estimar el tiempo medio de estudio para esta poblaci6n de estudiantes. a) ~ C u ies l la probabilidad de que la media muestral exceda a la media poblacional en m h de dos horas? b) iCuAl es la probabilidad de que la media muestral estC rnis de tres horas por debajo de la media poblacional? l la probabilidad de que la media muesc) ~ C u a es tral difiera de la media poblacional en rnis de cuatro horas?

DISTRIBUCI~N EN EL MUESTREO DE UNA P R O P O R C I ~ NMUESTRAL

d) Supongamos que se toma una segunda muestra de diez estudiantes, independiente de la anterior. Sin hacer 10s chlculos, razonar si las probabilidades calculadas en 10s apartados (a), (b) y (c) serhn mayores, menores o iguales para esta segunda muestra. 10. Un proceso industrial produce lotes de un cierto producto quimico cuyos niveles de irnpureza siguen una distribuci6n normal con una desviaci6n tipica de 1,6 grarnos por cada 100 gramos del product0 quimico. Se selecciona una muestra de 100 lotes a fin de estimar la media poblacional del nivel de irnpurezas. a) 0,05 es la probabilidad de que la media muestral del nivel de impurezas exceda a la media poblacional, ten qu6 cantidad? b) 0.1 es la probabilidad de que la media muestral del nivel de irnpurezas est6.por debajo de la media poblacional, ten qu6 cantidad? C) 0,15 es la probabilidad de que la media muestral del nivel de irnpurezas difiera de la media poblacional, ten qu6 cantidad? 11. Las tasas de rentabilidad de cierto tipo de acciones siguen una distribucidn con una desviacidn tipica de 3,8. Se extrae una muestra de tales acciones con el fin de estimar el precio medio. a) tQu6 tamaiio ha de tener la muestra para asegurarnos de que la probabilidad de que la media muestral difiera de la media poblacional en una cantidad superior a 1 sea menor que 0,1? b) Sin realizar 10s chlculos, razonar si serh preciso un tamaiio muestral mayor o menor que el requerido en el apartado (a) para garantizar que la probabilidad de que la media muestral difiera de la media poblacional en m h de 1 sea menor que 0,05. c). Sin realizar 10s chlculos, razonar si serh preciso un tamaiio muestral mayor o menor que el requerido en el apartado (a) para garantizar que la probabilidad de que la media muestral difiera de la media poblacional en m h de 1,5 sea menor que 0,l. 12. El tiempo que dedican a estudiar 10s estudiantes de cierto campus en la semana anterior a 10s exhmenes finales sigue una distribucidn normal con una desviacidn tipica de 8,4 horas. Se toma una muestra aleatoria de estos estudiantes con el fin de estimar el tiempo medio de estudio para esta poblacidn de estudiantes. a) tQu6 tamaiio ha de tener la muestra para poder asegurar que la probabilidad de que la media muestral difiera de la media poblacional en m h de dos horas sea menor que 0,05?

205

b) Sin realizar 10s ctllculos, razonar si se requerirri un tamaiio muestral mayor o menor que el del apartado (a) para poder garantizar que la probabilidad de que la media muestral difiera de la media poblacional en m k de dos horas sea menor que 0,lO? C) Sin realizar 10s chlculos, razonar si se requerirh un tamaiio muestral mayor o menor que el del apartado (a) para poder garantizar que la probabilidad de que la media muestral difiera de la media poblacional en mhs de 1,5 horas sea menor que 0,05. 13. En la Tabla 6.1 y en el Ejemplo 6.1, consideribamos muestras de n=4 observaciones de una poblaci6n de N=6 valores de aiios de experiencia de trabajo en una compaiiia. La media poblacional es px= 5,5 aiios. a) Confirmar, a partir de 10s seis valores de la poblaci6n, que la varianza muestral es

b) Confirmar, siguiendo la aproximacidn del Ejemplo 6.1, que la varianza de la distribucidn muestral de la media muestral es

c) Verificar para este ejemplo que

14. Si se toma una muestra de n observaciones de una poblacidn con N individuos, la varianza de la distribucidn muestral de la media muestral es

La cantidad

recibe el nombre de "factor de correccidn por poblacidn finita". a) Para tener una idea de las posibles magnitudes del factor de correccidn por poblaci6n finita, calcular dicho factor para muestras de n=20 observaciones de poblaciones de N=20, 40, 100, 1.000 y 10.000 individuos. b) Explicar por quC el resultado obtenido para N=20 en el apartado (a) coincide 'kxactamente con lo que se esperana intuitivamente. c) A partir de 10s resultados obtenidos en el apartad0 (a), discutir el efecto que tendri en la prhc-

206

MUESTREO Y DlSTRlBUClONES MUESTRALES

tica el factor de correcci6n por poblaci6n finita para muestras de 20 observaciones extraidas de poblaciones de diferentes tamaiios. 15. En cierta ciudad americana hay 400 agentes que se dedican a1 negocio de venta de propiedades. El valor medio de las propiedades vendidas por estos agentes en un aiio es de 800.000 d6lares, y su desviaci6n tipica es de 300.000 d6lares. Se selecciona una muestra de 100 agentes y se anota el valor de las propiedades que han vendido en un aiio. a) iCuhl es el error esthdar de la media muestral? b) iCuhl es la probabilidad de que la media muestral sea mayor que 825.000 dblares? C) iCuBl es la probabilidad de que la media muestral sea mayor que 780.000 d6lares? d) /,Cuhl es la probabilidad de que la media muestral est6 entre 790.000 y 820.000 dblares? 16. En un curso de econom'a hay 250 estudiantes. Cada uno de 10s integrates de una muestra aleatoria de 50 estudiantes es interrogado con el fin de estirnar la cantidad de tiempo que gasta semanalmente en resolver 10s problemas de estadistica. Supongamos que la desviaci6n tipica de la poblaci6n es de treinta minutos. a) iCuhl es la probabilidad de que la media muestral exceda a la media poblacional en mhs de 2,5 minu tos? b) iCu8l es la probabilidad de que la media muestral est6 m h de cinco minutos por debajo de la media poblacional? C) ~ C u hes l la probabilidad de que la media muestral difiera de la media poblacional en mhs de diez minutos? 17. Para una audiencia de 600 personas que han acudido ha escuchar un concierto, el tiempo medio empleado en desplazarse hasta el lugar del concierto fue de treinta y dos minutos, con una desviaci6n tipica de diez minutos. Se toma una muestra de 150 personas de dicha audiencia. a) iCull es la probabilidad de que la media muestral del tiempo de desplazamiento sea superior a treinta y un minutos? b) /,Cuhl es la probabilidad de que la media muestral del tiempo de desplazamiento sea inferior a treinta y tres minutos? C) Dibujar un grhfico que explique por qu6 la respuesta en (a) y en (b) es la misma. d) ~ C u hes l la probabilidad de que la media muestral del tiempo de desplazamiento est6 entre treinta y uno y treinta y tres minutos? 18. En 1992 10s canadienses votaron en un referindurn acerca de una nueva Constituci6n. En la provincia

de Quebec, el 42,4% de la gente que vot6 lo hizo en favor de la nueva Constituci6n. Se tom6 una muestra de 100 votantes de dicha provincia. a) /,Cull sera la media de la proporci6n muestral que esti en favor de la nueva Constituci6n? b) /,Cuhl es la varianza de la proporci6n muestral? C) iCuBl es el error esthndar de la proporci6n muestral? d) iCuhl es la probabilidad de que la proporci6n muestral sea mayor que 0,5? 19. De acuerdo con 10s datos del Ministerio de Economia y Hacienda, el 15% de las declaraciones del IRPF del dltimo aiio pasado darin lugar a una devoluci6n. Se toma una muestra aleatoria de 100 declaraciones. l la media de la distribuci6n en el muesa) ~ C u hes treo de proporci6n muestral de declaraciones que d a r h lugar a una devoluci6n? b) iCu81 es la varianza de la proporci6n muestral? C) iCuBl es el error esthndar de la proporci6n muestral? d) /,Cuhl es la probabilidad de que la proporci6n muestral sea mayor que 0,8? 20. El dueiio de una tienda de discos ha comprobado que el 20% de 10s clientes que entran en su tienda realizan alguna compra. Cierta maiiana, entraron en esta tienda 180 personas, que pueden ser consideradas como una muestra aleatoria de todos sus clientes. a) /,Cuhl serh la media de la proporci6n muestral de clientes que realizaron alguna compra? b) ~ C u hes l la varianza de la proporci6n muestral? C) /,Cuhl-es el error estlndar de la proporci6n muestral? d) ~ C u h es l la probabilidad de que la proporci6n muestral sea menor que 0,15? 21. El adrninistrador de una gran cadena de hospitales opina que, de entre todos sus pacientes, un 30% generarh facturas que se pagarh con m L de dos meses de retraso. Se toma una muestra aleatoria de 200 pacientes. a) /,Cull es el error esthndar de la proporci6n muestral de pacientes con facturas cuyo pago se retrasarh m8s de dos meses? l la probabilidad de que esta proporci6n b) ~ C u hes muestral sea inferior a 0,25? C) iCuhl es la probabilidad de que esta proporci6n muestral sea superior a 0,33? d) /,Cuhl es la probabilidad de que esta proporci6n muestral est6 entre 0,27 y 0,33?

DISTRIBUCI~N EN EL MUESTREO DE UNA PROPORCI6N MUESTRAL

22. Una corporaci6n ha recibido 120 solicitudes de trabajo de estudiantes que acaban de terminar su licenciatura en economia. Suponiendo que estas solicitudes pueden ser consideradas como una muestra aleatoria de todos 10s licenciados, jcual es la probabilidad de que entre un 35% y un 45% de las solicitudes correspondan a mujeres si se sabe que el 40% de 10s licenciados en economia que acaban de terminx su carrera son mujeres? 23. Una asociaci6n benCfica ha comprobado que el 42% de las personas que hicieron alguna donaci6n el aiio anterior donarh de nuevo este aiio. Se toma una muestra de 300 donantes del aiio anterior. a) cud es el error esthdar de la proporci6n muestral de donantes que donartin de nuevo este aiio? b) jCuiil es la probabilidad de que miis de la mitad de 10s individuos de esta muestra vuelvan a ser donantes este aiio? c) jCud es la probabilidad de que esta proporci6n muestral estC entre 0,40 y 0,45? d) Sin realizar 10s ciilculos, decidir en cuiil de 10s siguientes intewalos es miis probable que se encuentre la proporci6n muestral: 0,39-0,41; 0,41-0,43; 0,43-0,45; 0,45-0,47. 24. Una corporaci6n estii considerando una nueva emisi6n de bonos convertibles. Sus directores piensan que la oferta resultarii atractiva para el 20% de 10s accionistas actuales. Supongamos que su creencia es acertada. Se toma una muestra aleatoria de 130 accionistas. a) jCuiil es el error estiindar de la proporci6n muestral de accionistas que encontrarh atractiva la oferta? b) jCud es la probabilidad de que esta proporci6n muestral sea superior a 0,15? c) jcuiil es la probabilidad de que esta proporci6n muestral estC entre 0,18 y 0,22? d) Supongamos que se toma ahora una muestra de 500 accionistas. Sin realizar 10s cdculos, razonar si las probabilidades correspondientes a 10s apartados (b) y (c) resultarh en este caso mayores, menores o iguales que las calculadas para la muestra anterior. 25. Unos almacenes han comprobado que el 30% de 10s clientes que compran una cortadora de cCsped, adquieren tambiCn un contrato de servicios. En un mes fueron vendidas 280 cortadoras de cCsped a un grupo de clientes que puede ser considerado como una muestra aleatoria del total de compradores. a) jCu6l es el error estiindar de la proporci6n muestral de clientes que adquieren u6 contrato de servicios?

26.

27.

28.

29.

30.

207

b) jcuiil es la probabilidad de que esta proporci6n muestral sea superior a 0,25? c) jcuiil es la probabilidad de que esta proporcion muestral sea inferior a 0,32? d) Sin realizar 10s cdculos, mzonar en cud de 10s siguientes intewalos es mhs probable que se encuentre la proporci6n muestral : 0,29-0,3 1; 0.30-0,32; 0,3 1 4 3 3 ; 0,32434. Se toma una muestra aleatoria de 100 votantes con el fin de estimar la proporci6n de votantes de un cierto estado que estii a favor de un aumento en 10s impuestos sobre la gasolina para contar asi con un ingreso adicional para reparaciones de las autopistas. jCuiil es el mayor valor que puede tomar el error esthdar de la proporcion muestral de esta medida? Supongamos que, en el context0 del Ejercicio 26, se decide que una muestra de 100 votantes es demasiado pequeiia para obtener un estimador de la proporci6n poblacional que resulte suficientemente creible. Se decide exigu que la probabilidad de que la proporci6n muestral difiera de la proporci6n poblacional (cualquiera que sea su valor) en m6s de 0,03 no debe ser superior a 0,05. jQuC tamaiio ha de tener la muestra para poder garantizar que se cumple este requerimiento? Una compaiiia quiere estimar la proporcidn de personas que son posibles compradores de afeitadoras elCctricas que ven las retransmisiones de 10s partidos de flitbol de la liga nacional. Se toma una muestra de 120 individuos aue se identificaron como posibles compradores de afeitadoras elCctricas. Supongamos que la proporci6n de posibles compradores de afeitadoras elCctricas en la poblaci6n que ven estas retransmisiones es 0,25. a) 0,10 es la probabilidad de que la proporci6n muestral exceda a la proporci6n poblacional jen auk valor? b) 0,05 es la probabilidad de que la proporci6n muestral estC por debajo de la proporci6n poblacional jen quC cantidad? c) 0,30 es la probabilidad de que la proporcion muestral difiera de la proporci6n poblacional Len quC cantidad? Supongamos que el 50% de 10s espaiioles adultos opinan que es necesaria una revisi6n del sistema nacional pliblico de hospitales. iCu6l es la probabilidad de que miis del 56% de 10s componentes de una muestra aleatoria de 150 espaiioles adultos tengan esta opini6n? Supongamos que el 50% de 10s espaitoles adultos opinan que el nivel actual de dCficit del presupuesto nacio-

nal puede causar un daiio importante a la economfa de la naci6n a largo plazo. j C ~ es a la probabilidad de que mL del58% de 10s componentes de una muestra aleatoria de 250 espaiioles adultos tengan esta opini6n? 31. Un periodista quiere averiguar cuhtos de 10s 500 maestros de cierta regi6n e s t h a favor de un cambio en 10s planes de estudio. En el tiempo disponible, s610 fue posible contactar con una muestra aleatoria de 81 de estos maestros. Si el 55% de todos 10s individuos de la poblaci6n opina que un c ~ b i resultm'a o beneficioso, jcual es la probabilidad de que menos de la mitad de 10s individuos de la muestra tengan esta opini6n? 32. Una universidad cuenta con un total de 528 estudiantes de primer curso. De ellos, 211 llevan su propio ordenador a1 campus. Se toma una muestra aleatoria de 120 estudiantes de primer curso. a) j C ~ h les el error esthndar de la proporci6n muestral de alumnos que llevan su propio ordenador al campus? b) jCuk1 es la probabilidad de que la proporci6n muestral sea menor que 0,33?

c) jCud es la probabilidad de que la proporci6n muestral se encuentre entre 0,40 y 0,50? 33. Una fhbrica tiene a 439 obreros contratados. De ellos, 239 e s t h preocupados sobre sus futuras pensiones. Se toma una muestra de 80 obreros y se les interroga con el fin de estimar la proporci6n de la poblaci6n que esth preocupada sobre el futuro de su pensi6n. a) jCuhl serh el error esthndar de la proporci6n muestral de obreros preocupados? b) jCuhl es la probabilidad de que la proporci6n muestral sea menor que 0,5? c) jCuhl es la probabilidad de que la proporci6n muestral se encuentre entre 0,5 y 0,6? 34. El increment0 porcentual del salario de 10s directores ejecutivos de medianas corporaciones sigue una distribuci6n normal con una media del 12,2% y una desviaci6n tipica del 3,6%. Se toma una muestra aleatoria de 8 1 de estos directores ejecutivos. jCu6l es la probabilidad de que mhs de la mitad de 10s individuos de la muestra tengan incrementos salariales menores del lo%?

6.4 DISTRIBUCI~NEN EL MUESTREO DE LA VARIANZA MCTESTRAL En la Secci6n 6.2, consideramos el problema de hacer inferencias sobre la media de una poblaci6n bashdonos en la informaci6n muestral. Ahora vamos a centrar nuestra atenci6n en la varianza poblacional. Supongamos que se extrae una muestra de n observaciones de una poblaci6n con media desconocida px y varianza desconocida ax2. Representaremos las observaciones muestrales por XI,Xz,....., X,. La varianza poblacional es la esperanza

ux' = E[(X- px)'I y, por tanto, una cantidad en la que evidentemente deberiamos fijamos seria en la media de 10s (Xi-pJ2 para 10s n individuos de la muestra. Sin embargo, la media poblacional px es desconocida, por lo que en la prkctica esta cantidad no podrh ser calculada. Es natural, entonces, sustituir la desconocida px por la @. De hecho, como ya se dijo en el Capitulo 2, la media muestral y considerar la media de 10s (Xivarianza muestral se define como

X,

DISTRIBUCI~N EN EL MUESTREO DE LA VARlANZA MUESTRAL

209

Definici6n: Sea XI, Xz, ....., X, una muestra aleatoria de una poblaci6n. La cantidad Sx2

1

=

-5 ( x i - x ) 2 n - 1 i=I

recibe el nombre de varianza muestra17.Su raiz cuadrada, SX, se denornina desviaci6n tipica muestral.

1

Obsbrvese que, en nuestra definici6n de varianza muestral, hemos usado como divisor (n-1) en lugar de n, lo cual puede resultar sorprendente. La raz6n para esta formulaci6n es que puede probarse que, si se define la varianza muestral de este modo, entonces, 1a.media de su distribuci6n muestral es la verdadera varianza poblacional ',es decir,

La conclusi6n de que el valor esperado de la varianza muestral es la varianza poblacional, es general. Sin embargo, para poder caracterizar completarnente su distribuci6n muestral, necesitaremos saber m k acerca de la distribuci6n de la poblaci6n. En muchas aplicaciones prkticas, el supuesto de que la distribuci6n de la poblaci6n es normal resulta razonable. En tal caso, puede probarse que la variable aleatoria

sigue una distribuci6n conocida con el nombre de distribuci6n X 2 (distribuci6n chi-cuadrado) con ( n -1) grados de libertad 9.

La familia de distribuciones chi-cuadrado se-usa con mucha frecuencia en el analisis estadistico. Estas distribuciones s610 esthn definidas para valores positivos de la variable aleatoria, lo cual resulta adecuado en este contexto, ya que la varianza muestral no puede ser negativa. Su funci6n de densidad, que aparece representada en la Figura 6.6, es asimbhica. Un miembro concreto de la farnilia chicuadrado viene caracterizado por un dnico parhetro, a1 que llarnaremos grados de libertad, para el que habitualmente se usa el simbolo v. Si una variable aleatoria sigue una distribuci6n 2 con v graLa media y la varianza de esta dishibuci6n son, respectivados de libertad, se representar&por 2v. mente, el ndmero de grados de libertad y el doble del ndmero de grados de libertad, es decir,

E(x;) = v Y var(xP) = 2v En nuestro contexto, la variable aleatoria (n - l)s,2/d sigue una distribuci6n media es

y, por tanto, su

' ~ n avez mas, distinguimos entre la variable aleatoria SX' y el valor especifico que toma. Asi, si la muestra concreta que se ha obsewado es x,, xl. ....J",entonces, la realizacidn de s? sera

"Esteresultado se demuestra en el Apc5ndice A6.1 que aparece al final de este capitulo. N6tese que esto s610 es cierto cuando el tamaiio muestral es una proporci6n pequeiia del tamafio de la poblaci6n. 9La distribuci6n chi-cuadrado con v grados de libertad es la distribuci6n de la suma de 10s cuadrados de variables aleatorias normales esthdar independientes.

FIGURA 6.6 Funci6n de densidad de probabilidad de la distribuci6n chi-cuadrado con v = 4,6 y 8 grados de libertad

Por tanto, tenemos

'n ax'

~ ( s : )= ( n - 1 )

de donde

E(sXZ)= ax2 como antes. Para hallar la varianza de :s ,usamos que

Por consiguiente,

( n - 1)' ax"

var(sX2)= 2(n - 1)

y, en consecuencia,

Las propiedades de la distribuci6n XZ pueden usarse tambiCn para calcular la varianza de la distribuci6n muestral de la varianza muestral lo. El parhetro v de la distribuci6n ,$ recibe el nombre de grados de libertad. Para entender esta terminologfa, observemos que'la varianza muestral involucra en su definici6n a la suma de 10s cuadrados de las cantidades

(XI

-a,(X2 - m,.. . ,(X" - m

Esto supone que estas n piezas de informaci6n intervienen en el cAlculo de la varianza muestral. Sin embargo, no son piezas de informaci6n independientes, puesto que su suma ha de ser 0, seg6n se deduce de la definici6n de X . Por tanto, si conocemos ( n - 1 ) cualesquiera de 10s (Xi - X), podemos calcular el otro a partir de 10s (n-1) primeros. Por ejemplo, dado que

10~ecutrdese que este resultado s610 es vflido cuando la poblaci6n de la que se extrajo la muestra es normal.

DISTRIBUCI~N EN EL MUESTREO DE LA VARlANZA MUESTRAL

2 11

sejiene que

-z)

son equivalentes a un conjunto de (n - 1) piezas independientes de inforLas n cantidades (Xi maci6n. Podemos pensar en esta situaci6n de la forma siguiente: queremos hacer inferencia sobre la desconocida 0x2. Si la media poblacional px fuese conocida, nuestra inferencia podria estar basada en la suma de cuadrados de Estas cantidades son independientes unas de otras, y podriamos decir que tenemos n grados de libertad para la estimaci6n de 0x2. Sin embargo, dado que en la prictica la media poblacional es desconocida, y tendremos que sustituirla por su estimador X,uno de estos grados de libertad se pierde, y nos quedamos con (n - 1) observaciones independientes para hacer inferencia sobre la varianza poblacional. Se dice por ello que 10s grados de libertad disponibles son (n - l). Con frecuencia, necesitaremos encontrar valores de la funci6n de distribuci6n acumulada de una variable aleatoria 2.En muchos casos, estos problemas e s t h planteados en tCrminos de la determinaci6n de puntos de corte correspondientes a una probabilidad concreta. Por ejemplo, para una variable aleatoria que sigue una distribuci6n XloZ, se nos puede pedir que hallemos el nlimero K para el cual se verifica P(,y,: < K ) = 0,90 o, equivalentemente, P(,yl; > K ) = 0,lO Las funciones de distribuci6n de las variables aleatorias con distribuci6n chi-cuadrado aparecen tabuladas en la Tabla 5 del Aptndice de tal forma que se pueden leer directamente 10s puntos de corte. si P(,yl: > K)= 0,10, Puede verse en la Tabla 5 que, para una variable aleatoria con distribuci6n entonces, K = 15,99. Esta probabilidad corresponde a1 Area sombreada debajo de la funci6n de densidad en la Figura 6.7.

x,:,

Distribucion muestral de la varianza muestral Seas? la varianza muestral de una muestra aleatoria de n observaciones extraidas de una poblacidn con varianza ax2. Entonces, (i) La distribuci6n muestral de sx2 tiene media a?, es decir, E(s2) = 0-2 (ii) La varianza de la distribuci6n muestral de sx2 depende de la distribuci6n de la poblaci6n. Si dicha distribuci6n es normal, entonces, 2~x4 var(sxZ)= n-1 (iii) Si la distribuci6n poblacional es normal, entonces,

(n - l)sx2 ax2

se distribuye como una 2(,-1,.

Supongamos que hemos tomado una muestra aleatoriir de una poblaci6n y queremos hacer alguna inferencia sobre la varianza poblacional. Si se asume la normalidad de la poblacibn, se podri usar la distribuci6n chi-cuadrado, como haremos en 10s ejemplos que aparecen a continuaci6n.

2 12

MUFSTREO Y DISTRlBUClONES MUFSTRALES

EJEMPLO

Cuando un proceso de producci6n esta funcionando correctamente, la resistencia en ohmios de 10s componentes que produce sigue una distribucibn normal con desviaci6n tipica 3,6. Se toma una muestra aleatoria de cuatro componentes. iCuA es la probabilidad de que la varianza muestral sea superior a 30? Tenemos que n =4 ax= 3,6 u? = (3,6)' = 12,96 La probabilidad que se nos pide es

6.6

En la Tabla 5 del ApCndice, encontramos que Puesto que 6,94 esti entre 6,25 y 7,81, la probabilidad que buscamos debe estar entre 0,05 y 0,10, esto es 0,05 < p(sX2> 30) < 0,lO La tabla no nos permite encontrar la probabilidad exacta, aunque existen muchos programas de ordenador que si pueden calcularla. N6tese tambiCn que la varianza muestral ser6 mayor que 30 si y s610 si la desviaci6n tipica muestral es mayor que fi= 5.48. Por tanto, las probabilidades de estos dos sucesos son iguales. En consecuencia, se tiene que

FIGURA 6.7 Probabilidad (0,9) de que una variable aleatoria chi-cuadrado con 10 grados de libertad sea menor que 15,99

$

,

DISTRIBUCI~NEN EL MUESTREO DE LA VARIANZA MUESTRAL

EJEMPLO

6.7

2 13

Un fabricante de latas de guisantes estd interesado en que el peso medio de su product0 estk pr6ximo a1 peso anunciado. Ademds, desea que no haya mucha variabilidad en 10s pesos de las latas de guisantes, ya que de lo contrario, una gran proporci6n de latas diferiria sensiblemente del peso anunciado. Asumamos que la distribuci6n poblacional de 10s pesos es normal. Se toma una muestra aleatoria de veinte latas. Hallar 10s ndmeros K, y K2que verifican

Tenemos que

es una variable aleatoria que se distribuye como una chidonde n = 20 es el tamafio muestral y x?(..~, cuadrado con (n- 1 ) = 19 grados de libertad. Entonces,

0,05 = P(X,; < 19Kl)

o

0,95 = P(x,: > 19K1)

En la Tabla 5 del ApCndice, encontramos que

19K1 = 10,12 y, por tanto,

Kl = 0,533 La conclusi6n es que la probabilidad de que la varianza muestral sea menor que un 53% de la varianza poblacional es 0,05. Tenemos que hallar tambiCn el ndmero Kz.que verifica

De forma equivalente podemos escribir

Asi pues, dado que n = 20 luego, buscando en la Tabla 5, encontramos que

19Kz = 30,14 y, por tanto,

Kz = 1,586 Esto supone que la probabilidad de que la varianza muestral sea mds de un 58,6% mayor que la varianza poblacional es 0,05. Estas probabilidades aparecen representadas en la Figura 6.8 como ireas debajo de la funci6n de densidad de la distribuci6n x:,. Hay que hacer hincapik en el hecho de que la tCcnica empleada en estos ejemplos no es tan universalmente aplicable en la prictica como la que usibamos en las primeras secciones de este capitulo. En este contexto, el supuesto de que la distribuci6n de la poblaci6n de la que se ha extraido la

2 14

MUESTREO Y DISTRIBUCIONES MUESTRALES

FIGURA 6.8 0,05 es la probabilidad de que una variable aleatoria chi-cuadrado con 19 grados de libertad sea menor que 10,12 y tambitn la de que dicha variable aleatoria sea mayor que 30,14

muestra es normal, es fundamental. Hemos visto cdmo pueden encontrase probabilidades relativas tanto a la media muestral como a la varianza muestral cuando se muestrea de una poblacidn normal. Sin embargo, esta liltima se verfi mfis afectada por desviaciones del supuesto de normalidad de la distribuci6n poblacional. Cuando se quieren calcular probabilidades relativas a la media muestral, el teorema central del limite asegura que, para muestras moderadarnente grandes, desviaciones pequefias de la hipdtesis de normalidad de la poblaci6n de la que se extrae la muestra tienen un efecto pequefio en la validez de las probabilidades calculadas. Por esta raz6n, se dice que las inferencias basadas en la media muestral son robustas frente a desviaciones del supuesto de normalidad de la poblacidn, rnientras que las inferencias basadas en la varianza poblacional no lo son. Sin embargo, es frecuente en la prfictica que la varianza poblacional tenga un interts direct0 para el investigador. Debe recordarse que, si s610 se dispone de una cantidad pequeiia de obsemaciones muestrales, desviaciones importantes del supuesto de normalidad de la poblacidn pueden invalidar las conclusiones del anfilisis realizado seglin la tCcnica que hemos descrito en esta secci6n. Por tanto, un analista precavido deberfi ser cuidadoso a la hora de hacer inferencias en tales circunstancias.

EJERCICIOS

35. Un proceso produce lotes de un product0 quimico cuyos niveles de concentraci6n de irnpurezas siguen una distribuci6n normal con varianza i ,75. Se extrae una muestra aleatoria de 20 lotes. Hallar la probabilidad de clue la varianza muestral sea suverior a 3.10. 36. Las reniabilidades mensuales de cieio tipo de acciones son independientes unas de otras, y siguen una distribuci6n normal con desviaci6n tipica 1,7. Se toma una muestra de doce meses.

a) Hallar la probabilidad de que la desviaci6n tipica muestral sea menor que 2,5. b) Hallar la probabilidad de que la desviaci6n tipica muestral sea mayor que 1. 37. Los salarios de 10s contables durante sus primeros aiios de trabajo siguen una distribuci6n normal con desviaci6n tipica de'250.000 pesetas. Se' extrae una muestra aleatoria de 16 observaciones.

DISTRIBUCI~N EN EL MUESTREO DE LA VARIANZA MUESTRAL

38.

39.

40.

41.

a) Hallar la probabilidad de que la desviaci6n tipica muestral sea mayor que 300.000 pesetas. b) Hallar la probabilidad de que la desviaci6n tipica muestral sea menor que 150.000 pesetas Se quiere someter a todos 10s empleados de una gran universidad a un test de 100 preguntas de elecci6n m6ltiple. Inicialmente, en un estudio piloto, se somete a este test a una muestra aleatoria de 20 trabajadores. Supongamos que, para la poblaci6n completa de todos 10s trabajadores de la Universidad, la distribuci6n del n6mero de respuestas correctas sigue una normal con varianza 250. a) cull es la probabilidad de que la varianza muestral sea menor que loo? b) ~ C u i l les la probabilidad de que la varianza muestral sea mayor que 500? Se ha comprobado que, en cierta ciudad espaiiola, las facturas de electricidad durante el periodo de verano siguen una distribuci6n normal con una desviaci6n tipica de 10.000 pesetas. Se toma una muestra aleatoria de 25 facturas. a) Hallar la probabilidad de que la desviaci6n tipica muestral sea menor que 7.500 pesetas. b) Hallar la probabilidad de que la desviaci6n tipica muestral sea mayor que 15.000 pesetas. El ndmero de horas que dedican a ver televisi6n 10s estudiantes en la semana anterior a sus exhnenes finales sigue una distribuci6n normal con una desviaci6n tipica de 4,s horas. Se toma una muestra aleatoria de 30 estudiantes. a) La probabilidad de que la desviaci6n tipica muestral sea mayor que 3,s horas, Les mayor que 0,95? b) La probabilidad de la desviaci6n tipica muestral sea menor que seis horas, Les mayor que 0,95? En la Tabla 6.1, consider6bamos las quince posibles muestras de cuatro obsewaciones de una poblaci6n de N=6 valores de aiios de experiencia de trabajo. La varianza poblacional para estos seis valores es

Calcular la varianza muestral para cada una de la 15 posibles muestras. Hallar la media de estas 15 varianzas muestrales, y comprobar que el valor esperado de la varianza muestral no es igual a la varianza poblacional cuando el nirmero de individuos en la muestra no es una proporci6n pequeiia del n6mero de individuos en la poblacidn. [De hecho, puedes comprobar para este ejemplo que ~(s;) = NuxZ/(N- I)].

2 15

42. En una empresa se fabrican componentes electr6ni-

cos que emiten seiiales cuya duraci6n sigue una distribuci6n normal. Se extrae una muestra aleatoria de seis componentes, y se mide la duraci6n de las seiiales que emiten. a) 0,05 es la probabilidad de que la varianza muestral sea mayor que ~ q u Cporcentaje de la varianza poblacional? b) 0,10 es la probabilidad de que la varianza muestral sea menor que ~ q u Cporcentaje de la varianza poblacional? 43. Se toma una muestra aleatoria de diez acciones de empresas aseguradoras. Supongarnos que la distribuci6n de las tasas de rentabilidad de las acciones en la poblaci6n de todas las empresas aseguradoras es normal. a) 0,10 es la probabilidad de que la varianza muestral sea mayor que ~ q u porcentaje t de la varianza poblacional? b);Encontrar dos niimeros, a y b, que hagan correcta la frase siguiente: 0,95 es la probabilidad de que la varianza muestral est6 entre el a% y el b% de la varianza poblacional. c) Supongamos que se extrae una muestra de 20 acciones. Sin realizar 10s cillculos, indicar cdmo cambiaria esto la respuesta a1 apartado (b). 44. Se extrae una muestra aleatoria de 15 economistas y se les pregunta sobre su predicci6n acerca de la tasa de inflaci6n para el pr6ximo aiio. Supongamos que las predicciones para la poblaci6n completa de economistas sigue una distribuci6n normal con una desviaci6n tipica de 1,8%. a) 0,01 es la probabilidad de que la desviaci6n tipica muestral sea mayor que ~ q u Cn6mero? b) 0,025 es la probabilidad de que la desviaci6n tipica muestral sea menor que ~ q u Bndmero? C) Encontrar un par de n6meros tales que la probabilidad de que la desviaci6n tipica muestral se encuentre entre estos dos ndmeros sea 0,9. 45. Para comprobar la precisidn de cierto instrumento, se hacen 12 lecturas de la misma cantidad. La distribuci6n poblacional de las lecturas que hace este instrumento es normal. a) 0,95 es la probabilidad de que la varianza muestral sea mayor que ~ q u Cporcentaje de la varianza poblacional? b) 0,9 es la probabilidad de que la varianza muestral sea mayor que ~ q u Cporcentaje de la varianza poblacional? c) Encontrar un par de n6meros, a y b, que hagan correcta la frase siguiente: 0,95 es la probabilidad de que la varianza muestral estC entre el a% y el b% de la varianza poblacional.

2 16

MUESTREO Y DISTRIBUCIONES MUESTRALES

46. Una compaiiia farmaceutica elabora pfldoras que contienen un ingrediente activo. La compaiiia se preocupa sobre la media del peso de este ingrediente por pfldora, per0 tambiCn pretende que la varianza (medida enmiligramos cuadrados) no sea mayor que 1,5. Se extrae una muestra aleatoria de 20 pildoras y su varianza muestral resulta ser de 2,05. jCukl es la probabilidad de que la varianza muestral sea tan alta como la observada o mayor si la varianza poblacional es realmente 1,5? Asumir que la distribuci6n poblacional es normal. 47. Un fabricante ha estado comprando materias primas a un proveedor cuyos envios tienen niveles

de impurezas con una varianza de 15,4 (medida en kilos cuadrados). Un competidor de este proveedor asegura a1 fabricante que puede proporcionarle envios de la misma materia prima con el mismo nivel medio de impurezas per0 con menor varianza. Para una muestra de 25 envios del segundo proveedor, la varianza del 10s niveles de impureza result6 ser de 12,2. jCukl es la probabilidad de obtener un valor de la varianza muestral tan bajo como el observado o menor si, de hecho, la verdadera varianza poblacional es de 15,4? Asumir que la distribuci6n de la poblaci6n es normal.

UERClClOS DE REPASO 48. ~ Q u 6quiere decir que la media muestral tiene una distribuci6n en el muestreo? 49. Un agente estk considerando seis fondos de inversi6n diferentes. El ndmero medio de dias que tardan en vencer estos fondos es 41 39 35 35 33 38 Se eligen a1 azar dos de estos fondos. a) jCu6l es el ndmero de posibles muestras de dos fondos? b) Hacer una lista de todas las posibles muestras. C) Hallar la funci6n de probabilidad. de la distribuci6n en el muestreo de la media muestral. d) Comprobar directamente que la media de la distribuci6n en el muestreo de la media muestral es igual a la media poblacional. 50. jQuC importancia tiene el teorema central del Ifmite en la distribuci6n muestral de la media muestral. 51. Nos situamos en el context0 del Ejercicio 49. Hallar la funci6n de probabilidad de la distribuci6n en el muestreo de la proporci6n muestral de fondos con un vencimiento medio superior a treinta y seis dias para muestras de dos observaciones. Comprobar directamente que la media de la distribuci6n en el muestreo de la proporci6n muestral es igual a la proporci6n poblacional. 52. Las puntuaciones obtenidas en su examen de ingreso por todos 10s candidatos a entrar en cierta facultad de derecho sigue una distribuci6n normal con una media de 420 y una desviaci6n tipica de 100. Se extrae una muestra aleatoria de 25 puntuaciones.

a) Hallar la probabilidad de que la media muestral de las puntuaciones sea mayor que 450. b) Hallar la probabilidad de que la media muestral . de las puntuaciones tome un valor que estC entre 400 y 450. c) 0,10 es la probabilidad de que la media muestral de las puntuaciones sea mayor que jquC ndmero? d) 0,10 es la probabilidad de que la media muestra de las puntuaciones sea menor que jquC nhmero? e) 0,05 es la probabilidad de que la desviaci6n tipica muestral de las puntuaciones sea mayor que ~ q u Cndmero? f) 0,05 es la probabilidad de que la desviaci6n tipica muestral de las puntuaciones sea menor que jquC nhmero? g) Si se toma una muestra de 50 e x h e n e s , la probabilidad de que la media muestral de las puntuaciones sea mayor que 450 jseri mayor, menor o la misma que la obtenida en el apartado (a)? No es necesario detallar 10s ciilculos. Realizar un grkfico para ilustrar el razonamiento 53. Una compaiiia repara aparatos de aire acondicionado. Se ha comprobado que el tiempo que duran 10s servicios de reparaci6n sigue una distribuci6n normal con una media de sesenta minutos y una desviaci6n tipica de diez minutos. Se extrae una muestra aleatoria de cuatro reparaciones. a) jCuiil es la probabilidad de que el tiempo medio de reparaci6n sea mayor que sesenta y cinco minutos? b) 0,10 es la probabilidad de que el tieihpo medio de reparaci6n sea menor que jcuhtos minutos?

c) 0,10 e s la probabilidad de que la desviaci6n tipica muestral del tiempo de servicio sea mayor que jcuhtos minutos? d) 0,10 es la probabilidad de que la desviaci6n tipica muestral del tiempo de servicio servicio sea menor que jcuhtos minutos? e) jCud es la probabilidad de que m h de dos de estos servicios duren m h de sesenta y cinco rninutos? 54. En un determinado aiio, las tasas de rentabilidad de las acciones de las compaiiias eltctricas siguieron una distribuci6n normal con media 14,8 y desviaci6n tipica 6,3. Se extrae una muestra aleatorid de nueve de estas acciones. a) jCull es la probabilidad de que la media muestral de la tasa de rentabilidad sea mayor que 19? b) jCuhl es la probabilidad de que la media muestral de la tasa de rentabilidad estt entre 10,6 y 19? c) 0,25 es la probabilidad de que la media muestrd de la tasa de rentabilidad sea menor que jqut n~mero? d) Supongamos ahora que se selecciona una muestra de 20 acciones. Razonar si la probabilidad de que la media muestral de la tasa de rentabilidad sea mayor que 19 resultarl en este caso mayor, menor o igual que la calculada en el apartado (a). Realizar un grifico para ilustrar el razonamiento. 55. Se sabe que 10s tiempos de duraci6n de cierto tip0 de componentes electr6nicos siguen una distribuci6n normal con una media de mil seiscientas horas y una desviaci6n tipica de cuatrocientas horas. a) Para una muestra aleatoria de diecistis componentes, hallar la probabilidad de que la media muestral sea mayor que mil quinientas horas. b) Para una muestra aleatoria de diecistis componentes, 0,15 es la probabilidad de que la media muestral del tiempo de duraci6n sea mayor que jcuhtas horas? c) Para una muestra aleatoria de diecistis componentes, 0,10 es la probabilidad de que la desviaci6n tipica muestral del tiempo de duraci6n sea mayor que jcuhtas horas? d) Para una muestra aleatoria de 121 componentes, hallar la probabilidad de que menos de la mitad de 10s componentes muestrales tengan un tiempo de duraci6n mayor que mil quinientas horas. 56. Analicese el Aptndice A6.1 con el objeto de calcular la media de la distribuci6n en el muestreo de la varianza muestral para una muestra de n individuos extraida de una poblaci6n con N individuos cuando la varianza poblacional es a:. Modificando adecua-

damente el argument0 empleado en la demostraci6n del Aptndice A6.1 ,probar que

N6tese lo intuitivo que resulta este resultado cuando n=N. 57. Se ha comprobado que el tiempo que tarda la gente en completar sus formularios de la declaraci6n de la renta, sigue una distribuci6n normal con una media de cien minutos y una desviaci6n tipica de treinta minutos. Se toma una muestra aleatoria de nueve personas que han completado su declaraci6n de la renta. a) jCull es .la probabilidad de que la media muestral del tiempo empleado en completar 10s impresos sea mayor que dos horas? b) 0,20 es la probabilidad de que la media muestral del tiempo empleado sea menor que jcuhntos minutos? c) 0,05 es la probabilidad de que la desviaci6n tipica muestral del tiempo empleado sea mayor que jcuhtos minutos? d) 0,05 es la probabilidad de que la desviaci6n tipica muestral del tiempo empleado sea menor que jculntos minutos? 58. Se ha comprobado que, en cierta universidad, el 80% de 10s estudiantes de 6ltimo aiio acepta una oferta de trabajo antes de su graduaci6n. Para quienes aceptan una oferta, la distribuci6n de 10s salanos es normal con una media de 29.000 d6lares y una desviaci6n tipica de 29.000 d6lares. a) Para una muestra aleatoria de sesenta alumnos de 6ltimo curso, jcuhl es la probabilidad de que menos del 70% hayan aceptado una oferta de trabajo?. b) Para una muestra aleatoria de seis alumnos, jcuhl es la probabilidad de que menos del 70% hayan aceptado una oferta de trabajo? c) Para una muestra aleatoria de seis alumnos que han aceptado una oferta de trabajo, ~ c u h es l la probabilidad de que la media muestral de su salario sea mayor que 30.000 d6lares? d) Se elige un estudiante de ultimo aiio a1 azar. jCuhl es la probabilidad de que haya aceptado una oferta de trabajo con salario superior a 10s 30.000 d6lares? 59. Las bolsas de pllstico empleadas para empaquetar productos se fabrican de forma que la resistencia a rotura de las bolsas sigue una distribuci6n normal con una desviaci6n tipica de cinco kilos por centimetro cuadrado. Se extrae una muestra aleatoria de 16 bolsas.

60.

61.

62.

a) 0,01 es la probabilidad de que la desviaci6n tipica muestral de la resistencia a rotura sea mayor que jqu6 nlimero? b) 0,15 es la probabilidad de que la media muestral supere a la media poblacional en jqud cantidad? c) 0.05 es la probabilidad de que la media muestral difiera de la media poblacional en iquC cantidad? Un director de control de calidad est6 preocupado sobre la variabilidad de la cantidad de ingredientes activos en las pfldoras producidas por un cierto proceso. Se toma una muestra aleatoria de 21 pildoras. jCud es la probabilidad de que la varianza muestral de la cantidad de ingrediente activo sea mayor que dos veces la varianza poblacianal? Se toma una muestra de 100 estudiantes para determinar cual de entre dos marcas de cerveza se prefiere. Se les da a probar ambas marcas con 10s ojos tapados. supong&os que, para la poblaci6n completa de estudiantes, el 50% prefiere la marca A. a) iCud es la probabilidad de que mfis del60% de 10s individuos de la muestra prefieran la marca A? b) iCu5l es la probabilidad de que la proporci6n muestral de individuos que prefieren la marca A est6 entre un 45% y un 55%? c) Supongamos que s610 se dispone de una muestra de diez estudiantes. Indicar c6mo diferiria el mdtodo de cdculo de probabilidades comparado con las respuestas a 10s apartados (a) y (b). Las puntuaciones de cierto examen realizado por un grupo grande estudiantes sigue una distribuci6n normal con una desviaci6n tipica de 40 puntos. Se toma una muestra aleatoria de diecis6is puntuaciones para estimar la puntuaci6n media en la poblaci6n. Sea X la media muestral. cCu5l es la probabilidad de que el interval0 que va de - 10) a + 10) contenga a la verdadera media poblacional? Un fabricante de detergente liquido afirma que el peso medio de detergente en 10s envases que vende es al menos de 500 gramos. Se sabe que la distribuci6n poblacional de 10s pesos es normal con una desviaci6n tipica de 17 gramos. Con el fin de comprobar la afirmaci6n del fabricante, se toma una muestra aleatoria de 16 envases de detergente. La afirmaci6n ser6 cuestionada si la media muestral de 10s pesos es menor que 440 gramos. ~ C u 5 es l la probabilidad de que la afirmaci6n sea cuestionada en el caso de que la media poblacional de 10s pesos sea realmente de 500 gramos?

(x

63.

(x

64. Cierto aiio, el 40% de las ventas a domicilio fueron parcialmente financiadas por el vendedor. Se examina una muestra aleatoria de 250 ventas. a) 0,8 es la probabilidad de que la proporci6n muestral sea mayor que iquB cantidad? b) 0,9 es la probabilidad de que la proporci6n muestral sea menor que j q ~ 6cantidad? c) 0,7 es la probabilidad de que la proporci6n muestral difiera de la proporci6n poblacional jen qu6 cantidad? 65. Un candidato a la alcaldia de cierta ciudad quiere presentarse a las elecciones s610 si la proporci6n del electorado que esti inicialmente dispuesto a votarle es superior al30%. Se toma una muestra aleatoria de 300 votantes, y se decide que se presentarh a las elecciones si la proporci6n muestral de votantes a favor del candidato es mayor que 0,28. a) ~ C u h es l la probabilidad de que el candidato tome la decisi6n de participar en las elecciones si la verdadera proporci6n de candidatos que estin inicialmente a su favor es del20%? b) jCuhl es la probabilidad de que el candidato tome la decisi6n de no participar si la verdadera proporci6n de votantes que e s t h inicialmente a su favor es del40%? 66. Se sabe que la renta de 10s lectores que se han suscrito a cierta revista americana sigue una distribuci6n normal con una desviaci6n tipica de 6.600 d6lares. Se toma una muestra aleatoria de veinticinco lectores suscritos a dicha publicaci6n. a) cud es la probabilidad de que la desviaci6n tipica muestral de sus rentas sea mayor que 4.000 d6lares? b) jCud es la probabilidad de que la desviaci6n tipica muestral de las rentas sea menor que 8.000 d6lares? 67. Un proceso d i producci6n fabrica lotes de cierto product0 quimico. Se seleccionan muestras de 20 lotes para realizar un examen. Si la desviacidn tipica del porcentaje de concentraci6n de impureza contenido en 10s lotes muestreados supera el 2,5%, el proceso de producci6n tendri que ser cuidadosamente revisado. Asumamos que la distribuci6n poblacional del porcentaje de concentraci6n de impureza es normal. jCu5l es la probabilidad de que el proceso de producci6n tenga que ser revisado si la desviaci6n tipica poblacional del porcentaje de concentraci6n de impureza es del2%?

En este apkndice, demostraremos que la media de la distribuci6n en el muestreo de la varianza muestral es la varianza poblacional. Comenzaremos por hallar la esperanza de la suma de cuadrados de la diferencia entre cada miembro de la muestra y la media muestral, es decir, la esperanza de

Tomando esperanzas tenemos

E

f ( x i - X)' ] = E Z (Xi - px)']

- nE[(X - PXYI

N6tese que la esperanza de cada (Xi -,uA2 es la varianza poblacional a', y la esperanza de es la esperanza de la media muestral, es decir, d n . Por tanto, tenemos

Por liltimo, el valor esperado de la varianza muestral sera

Y este es el resultado que querlarnos probar.

(x,-

px)2

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF