Unidad 2 - Fase 3 - Distribución y Probabilidad - Mery - Garcia

October 14, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Unidad 2 - Fase 3 - Distribución y Probabilidad - Mery - Garcia...

Description

 

  Fase Fa se 3 - Distribuc ión y pro babilidad

Mery Me ry Janeth García Prada

Código:  1.002.262.848

Grupo:: 300046_17 Grupo

LUIS ALBERTO AL BERTO CACERES TORR TORRES ES

Tutor

Escuela de Ciencias Agrícolas, Pecuarias y Medio Ambiente ECAPMA. Tecnolog ía Saneamiento Saneamiento Ambient al Estadística Descriptiva 300046 12 Abril 2022

 

  INTRODUCCION

Como soluciónnace a muchas situaciones de incertidumbre que sey presentan en aleatorias, el área de la Agronomía, el estudio de los modelos probabilísticos las variables para poder procesar la información con herramientas tecnológicas como el programa R, que nos permita obtener de manera sencilla y ágil resultados a determinadas situaciones y prediciendo correctamente los posibles resultados para la toma de decisiones.

 

  Objetivo general:  Aplicar conceptos conceptos de probabilidad probabilidad a través través de ejercicios ejercicios prácticos y el programa programa R

Objetivos Específicos:  

Determinar conc conceptos eptos de variables variables aleatorias y mode modelos los probabilísticos p para ara su puesta en practica

 

Interpretar lo los s resultados obtenidos po porr el p programa rograma R

 

Como re resultado sultado a la informac información ión suministrad suministrada a

  Desarrollar

los ejercicios de modelos probabilísticos del programa R para el procesamiento de la información

  

  1. Re Revisar visar el OV OVII y los Cont enidos y referentes bibli ogr ográficos áficos de la U Unidad nidad 2, ubicados en el Entorno de Aprendizaje y explicar en sus propias palabras los siguientes términos: términos: a. Espacio muestral, con qué letra se denota denota:: El espacio muestral son todos los posibles resultados de un experimento aleatorio, se denota con () , aunque también se puede representar con la letra E mayúscula. b. Punto Muestral: Muestral : Se puede decir que es el resultado particular de un experimento. Se denota con ().  c. Eve Evento nto muestral: Es un conjunto de posibles resultados de un experimento. Se denota con ( ).  d. Variable Aleatoria Aleatoria:: Representa un resultado de un experimento aleatorio, nuestro experimento tiene que ser de tal forma que cada posible suceso o resultado se pueda expresar mediante un número  número  e. ¿Q ¿Qué ué signif ica que el espacio espacio muestral muestr al de una va variable riable a aleatoria leatoria cont inua es no contable? Es cuando la variable obtenida no la podemos derivar . f. ¿Q ¿Qué ué son va variables riables a alea leator torias ias discr etas pro por porcio cio nales? Resulta del conteo que pueden superar el número de elementos evaluados. Ejemplo: Numero de nematodos por hectárea registrado a partir de una muestra aleatoria de hectáreas de un cultivo de papa. ¿Que son las variables aleatorias discretas de conteo no acotado? Cuando una variable solo es capaz de adquirir un numero finito de valores dentro de un intervalo. Ejemplo: El número de semillas germinadas en cajas de Petri con 25 semillas cada caja; los resultados se expresan como proporciones porque existe un denominador natural.   natural. g. Existen dos conceptos de probabilidad: el clásico: Se le conoce como probabilidad a priori que se define como el cociente entre los eventos favorables a dicho evento y el total de eventos posibles, con la condición de que cada uno de estos eventos sean todos igualmente probables. probables . Probabilidad frecuencial: Probabilidad frecuencial: se conoce como el cociente entre la cantidad de casos favorables y la cantidad de casos posibles cuando la cantidad de casos tiende al infinito. infinito.

 

  h. En e ell caso de la pro babili dad frecuencial, expliqu e el e experimento xperimento d e germinación de una semilla, cuál es el experimento aleatorio, cuál es el evento y cuantos puntos muéstrales tiene. El experimento aleatorio seria las 1000 semillas estudiadas, el evento son las 600 semillas que se pudieron  )) = germinar, los puntos muéstrales dicen que se pueden estimar por (      = 0,6.  (  )  =  →  = 1

i.

¿Q ¿Qué ué dif ere erenci nci a existe entre e ell conc epto de frecuencia re relativ lativ a y el de probabilidad?   Si realizamos la experiencia muchas veces, la frecuencia probabilidad? relativa tiende a estabilizarse alrededor de un determinado valor, la probabilidad de un suceso A de un experimento aleatorio se puede definir como el número al que se aproximan las frecuencias relativas de dicho suceso cuando el experimento se repite un número indefinido de veces. v eces.  

 j.

¿Qué son so n even evento to s mu tu amen amentt e exc excll uyent uy ent es? Son cosas que no pueden ocurrir al mismo tiempo.  tiempo.   ¿Cómo es la intersección de dos eventos mutuamente excluyentes?  excluyentes?   Su intersección es el conjunto vacío.  vacío.  ¿Si son excluyentes, dado un evento A y uno B, a que es igual la P(A ꓴB)? B) ?   (  ∪ ) = ( ) + ( ) − ( (  ∩ )  la probabilidad de la unión de dos sucesos incompatibles incompatibles será igual a la suma de las probabilidades de cada uno de los sucesos (ya que su intersección es el conjunto vacío y por lo tanto no hay que restarle nada).  nada).  

k. ¿Q ¿Qué ué tipos de distribu ciones de frecue frecuencia ncia o de probabilidad son las más comunes en el estudio de variables biológicas? Presente ejemplos gráficos de ellas La frecuencia absol absol uta: es uta:  es el número de veces que se repite algo y la frecuencia relativa es la proporción que representa la frecuencia absoluta en relación con el total. Distribución de frecuencias La distribución de frecuencias de una variable es la especificación de las frecuencias correspondientes a cada uno de sus valores o categorías. Distribución de frecue frecuencias ncias:: La distribución de frecuencias de una variable es la especificación de las frecuencias correspondientes a cada uno de sus valores o categorías EJEMPLO: Distribución de frecuencias de los sentidos de inclinación de los tallos de 40 EJEMPLO: plantas de girasol de una parcela con densidad baja (5 plantas por m²). Las plantas estaban dispuestas en hileras con dirección norte-sur. (fa, frecuencia absoluta, fr, frecuencia relativa).

 

 

l.

De Defina fina qué es curtosi s y prese presente nte e ejemplos jemplos gráficos de los tipo s de curtosis que e existen xisten

Dependiendo del número de observaciones que haya en la zona central de la distribución y del que haya en las zonas alejadas dos distribuciones con la misma varianza pueden tener dos perfiles distintos, con mayor o menor forma " de punta “. Al  Al  mayor o menor "apuntamiento" que puede tener una distribución con independencia del valor que tome su varianza se le llama CURTOSIS (o  APUNTAMIENTO)

 

 

m. ¿Qué significa la simetría o asimetría de una variable? ¿qué tipos de asimetrías exist exist en? Pre Presente sente e ejemplo jemplo s gráfico s

 

  Las medidas de asimetría son indicadores que permiten establecer el grado de simetría (o asimetría) que presenta una distribución de probabilidad de una variable aleatoria sin tener que hacer su representación gráfica. Como eje de simetría consideramos una recta paralela al eje de ordenadas que pasa por la media de la distribución. Si una distribución es simétrica, existe el mismo número de valores a la derecha que a la izquierda de la media, por tanto, el mismo número de desviaciones con signo positivo que con signo negativo. Decimos que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de la media es más larga que la de la izquierda, es decir, si hay valores más separados de la media al derecho.

n. . Para una variable de conteo no acotado, ¿qué modelo de distribución se utiliza?  utiliza?   Variables discretas es importante distinguir al menos dos subtipos muy comunes en estudios biológicos: las proporciones que provienen de conteos que no pueden superar el número de elementos evaluados y los conteos no acotados o sin denominador natural o. Pa Para ra variables de prop orci ones ¿qué ¿qué modelo de dist rib ució n se uti liza? Para el caso de proporciones es importante dejar expresado que si bien el valor puede ser continuo en el rango 0-1, el espacio generatriz es discreto, porque la base de la variable es el conteo Si el espacio muestral de una variable es discreto pero representado por nombres o códigos que representan categorías excluyentes y exhaustivas de la variable, entonces la variable aleatoria es una variable cualitativa de tipo categorizada (nominal u ordinal). p. ¿Q ¿Qué ué variables tienen funci ón de prob abilid ad y cuáles variables variables ti enen funció n de densida densidad? d?

 

  La función de distribución de probabilidad de una variable aleatoria discreta Para una variable aleatoria discreta la función de distribución de probabilidades f(.), es aquella que designa una probabilidad de ocurrencia a cada valor de la variable. A diferencia de la función de probabil probabilidad, idad, se tiene la distribución acumulada F (.), que designa una probabilidad de ocurrencia para valores menores o iguales a un valor de la variable. La función de densidad de una variable aleatoria continúa denotada como f(.)contienen exhaustivamente toda la información sobre la variable

q. ¿C ¿Cuáles uáles son los paráme parámetro tro s más más usados e en n e estadístic stadístic a para estudi ar y utili za zarr f unciones de distr ibución de variables variables a alea leatorias? torias? El valor esperado, formaliza la idea de valor medio de un fenómeno aleatorio, La varianza formaliza la idea de incertidumbre y su recíproco la idea de precisión, más varianza indica más incertidumbre sobre el fenómeno y menor precisión de las conclusion conclusiones es que podemos elaborar desde los datos que lo caracterizan. r. ¿Qué es la e esperanza speranza ma matemáti temáti ca de un una a vari variable able alea aleato tori ria? a? ¿cómo se denota? Esperanza Matemática o también llamada valor esperado, es el número que expresa el valor medio del fenómeno que representa dicha variable  variable   Se denota con la letra griega ().  2. Lea el Capítu Capítu lo 3 – Modelos probabilísticos del libro Esta Estadística dística y Biometría de Móni Móni ca Ba Balzarini lzarini y respon da las siguient es preguntas: preguntas : a. Qué tipo de histog rama se de debe be seleccion seleccion ar e en n un modelo pro babilísti co para una variable aleator aleatoria ia cont inu a cuando cuando se tienen datos d e esa esa variable. La distribución normal se usa para el cálculo de probabilidades de variables continuas, cuyos histogramas tienen forma “acampanada”, por eso y porque su expresión   matemática fue estudiada por Gauss, también se conoce como modelo Gaussiano. Gau ssiano. b. Qué es la estandariza estandarizació ció n, cuál e es s su fórmu la. Nos permite llevar cualquier distribución normal a la distribución normal estándar

z=y−μ√σ  c. Qué tipo de conteos se trabajan trabajan con l a distribuci ón Bino mial mial.. Puede usarse para el cálculo de probabilidades de eventos provenientes de conteos acotados

 

  d. En la dist rib ució n bino mial qué es n y qué es P.

Número (n) (P) Probabilidad e. A qué e es s igual la e esperanza speranza y la varianza en la dist rib ució n bi nomi al Consideramos la variable aleatoria X que sigue una binomial B (n, p). Recordamos que la variable aleatoria X expresa el número de éxitos que se obtienen al realizar "n" pruebas o ensayos independientes de Bernouilli con probabilidad "p" de éxito y "(1-p)" de fracaso. Esta variable puede interpretarse perfectamente como suma de "n" variables de Bernouilli, una por cada uno de los ensayos realizados. En consecuencia, para deducir la esperanza matemática y la varianza de la binomial B (n, p) podemos calcular la esperanza matemática y varianza de la variable correspondiente a un ensayo y después aplicar las propiedades generales de dichos parámetros con respecto a la suma de variables independientes. f. Qué tipos de conte conteos os se trabajan trabajan con la distri bución de Poisson. La distribución de Poisson también sirve como modelo probabilístico para variables discretas de tipo conteo, los conteos se refieren al número de veces que un evento ocurre en una unidad de tiempo o espacio espacio dada (hora, kilo, m2, m3, planta, etc.) y por tanto los valores de la variable no están acotados. g. Cómo se denota denota el único pará parámetro metro de la distrib ución de Poisson Poisson.. El único parámetro de la distribución Poisson es . Si una variable aleatoria Y se distribuye como Polisón lo denotamos como: Y~ Poisson(). Esta distribución tiene un único parámetro, que representa la esperanza y también a la varianza, es decir que cuando Y~ Poisson(). h. ¿A qué es igual la media y la varianza en la dist ribu ción de Poisson ? los valores de la esperanza (o media) y de la varianza para la distribución de Poisson son respectivamente E (X) = λ y Var(X) = X. Observemos ahora la demostración de estas afirmaciones. i. Re Realice alice un cuadro comparativ o dond e indi que al menos 5 variables relacionadas con su pr ogr ograma ama de e estud stud io, dond e se pue pueda da ver claramente la diferencia entre el uso de la distribución Binomial y la distribuci ón Poisson:

 

  Ejercicios con el programa R Recuerde que para esta sección puede usar R o RStudio; en la guía de actividades de la Fase 2, puede acceder al instructivo para la instalación i nstalación y el manejo de cada uno de ellos. 3.  Abra “Script Fase 3 - DADOS.txt”, ejecútelo y responda las siguientes preguntas: a. Revise Revise el experimento d e los dados en el li bro Estadístic a y Biometría de Mónica Balzarini (Capítulo (Capítulo 2 - Variables Variables alea aleator torias ias y p robabi lid ade ades. s. Pá Págin gin a 70)) y expli 70 expli que en sus pro pias palabras palabras el experimento alea aleator torio io d el dado. Un experimento aleatorio para tirar dos dados, uno para cada uno de los posi bles result ados de las tiradas de dados están represe representados ntados p or un p ar de números q ue apa aparecen: recen: Ω = {(1.1), (1.2) (1.3), (1.4), (1.5), (1.6), (2.1) (2.2), (2, 3), (2.4), (2.4), (2.5),  (2.5), (2.6) , (3.1), (3.2),(3.3), (3.4), (3.5), (3.6), (4.1), (4.2), (4.3), (4.4), (4.5), (4.6), (5.1), (5.2), (5 , 3), (5,4),(5.5), (5.6), (6.1), (6.2), (6.3), (6.4), (6.5), (6.6)} Este espacio muestral es finito y discreto y por ello se pueden calcular probabilidades desde el concepto clásico, para cualquier variable aleatoria definida sobre el espacio. Por ejemplo, si se quiere estudiar la variable aleatoria Y=suma de los puntos en los dos dados, el espacio muestral de esta variable tendrá como elementos las sumas posibles (es decir todos los valores posibles para Y). Ω(y)= {2, Ω(y)= {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}. b. Adjunte en el informe los tres gráficos generados por el script (Frecuencias Absolutas, frecuencias relativas y frecuencias relativas acumuladas). No No d ebe haber más de un gráfi co po r p ágina

 

 

 

 

 

 

RIOD ODO O 114 1141 1-F Frec rec uen cias relativas acum ulad as SU SUMA MA 0. 1

.8 0 s a vi t 6. al 0 e r s ia c n 4. e u 0 c e Fr .2 0

0. 0

2

3

4

5

6

7

8

9

10

Suma de las caras de dos dados

1 11 1

12

 

 

C. Haga Haga una breve de descri scri pció n y expli cación d e ca cada da uno de los gr gráficos áficos adjuntados Frecuencias Absolutas Observamos que el valor que más frecuent frecuente e o se repite es el 7, es decir tiende a tener mas frecuencia salir dos números que sumen siete que cualquier otra suma. Frecuenci as relativas Frecuenci la frecuencia en la que saldría como resultado dos o doce esta por p or debajo del 0,005. Frecuenci as relativas acumuladas Frecuenci En la tabla de frecuencias fr ecuencias relativas acumuladas vemos que suman en total. 4. Abra en el programa R “Script Fase 3 –  MODELOS.txt” y ejecútelo.

Este script está basado en los ejemplos del libro “Estadística y Biometría de Mónica Balzarini” - Capítulo 3  – Modelos probabilísticos. Aunque el script no usa exa exactame ctamente nte los mi smos d atos del libro, lee leerr lo s eje ejercicio rcicio s le permiti rá e entender ntender lo q ue encontrará post eriorm ente e en n el Script . P Para ara responder a las preguntas de los puntos b y c, tendrá que ingresar manualmente en en el scri pt el valor d el que dese desea a conocer la respuesta; si no sabe cómo hacerlo, revise el tutorial de manejo del programa que encuentra en la carpeta del curso o en el Entorno de Información Inicial  – Encuentros sincróni cos vía we webconfere bconference. nce. a. Distribución normal - Ejercicio de las vacas del tambo (página 91). i. Presente y describa el gráfico "Producción de leche - Función de Distribución N (misma varianza, distinta media)". Este gráfico muestra dos distribuciones dentro de la misma gráfica -una azul y otra roja-. Para obtenerlo, cuando aparezca la gráfica de distribución de color azul, NO LA CIERRE, continúe ejecutando el script (para volver al script, ubique el cursor en el marco azul, donde aparece el nombre del script, para que no pierda la secuencia de ejecución). Indique si estas gráficas son simétricas y qué tipo de curtosis tiene cada una.

 

  RIODO RI ODO 1141 - Dist Distribución ribución N Produc Producción ción de lech leche e misma v

       )        x        (          F

       6         0 . .         0         0         0 . .         0 

10

15

20

25

30

35

40

Producción de leche (litros/dí (litros/día) a)

RTA:  

La línea azul demues demuestra tra que la p producción roducción de leche máxima (Litros/Día) es de 2 20 0 litros.

 

La línea roja que se da una nueva ración ración que aumen aumenta ta en 5 litros.la producción diaria.

 

pero no m modifica odifica las varia varianzas, nzas, se demuestra qu que e la prod producción ucción máxima aumenta a 30(litros/día).

 

Ambas son simétricas ,curtosis grande

ii. Presente Presente y describa el gráfico " Producción de leche - Función de Distribución N (mism (mism a me media, dia, disti nta varianza varianza"" . IIndi ndi que si estas gráficas so n simétr simétricas icas y qué tipo de curtosis tiene ca cada da una

 

 

         4 . .        0         )        x        (  

       2 . .        0 

       F

       0 . .         0 

10

15

20

25

30

35

Producción de leche (litros/dí (litros/día) a)

La línea azul demuestra que la producción de leche máxima (Litros/Día) es de 23 con una frecuencia de 0,1. la línea roja aumenta en 5 l la producción diaria, modificando las varianzas. la producción máxima es la misma pero su frecuencia cambia y aumenta el doble, llegando 0,3. No son simétricas e igualmente una la azul tiene una curtosis pequeña y la roja una mucho más grande.  grande. 

b. Probabilidad en distribución normal - Ejercicio del híbrido de maíz (página 93).

i. Presente y describa el gráfico “Rendimiento de maíz - Función Función de D Distrib istrib ución N (media.sigma)” 

PERIODO 1141 - Rendimiento de maíz - Función de Distribución N(media.sigma)

       0         2 . .        0 

       )        x        (          F

       5         1 . .        0         0         1 . .        0         5         0 . .         0         0         0 . .         0 

0

2

4

6 Rendimiento (Ton/Ha) (Ton/Ha)

8

10

12

 

  El grafic o representa que e ell rendi miento en Ton/Ha es de seis, seis, con u na fun ció n de dis tri buci ón de mas de 0, 0,20 20 ii . Indiq Indiq ue los valores de la media y la desviación estándar

Media: 5.8 Desviació De sviació n estándar: 3 iii. Indique la probabilidad de que el rendimiento sea igual o menor que 6 Toneladas por hectárea (Ton/Ha) [1] 0.5459637

iv. Indiqu e la probabili dad de que e ell rendi miento sea mayor qu e 6 Ton/H Ton/Ha. a.   [1] 0.4540363 v. Indique la probabilidad de que el rendimiento se encuentre entre 5,5 y 6,5 Ton/Ha. [1] 0.2257019

vi. Presente y describa el gráfico “Rendimiento de maíz Distribución Normal con área bajo la curva”  

 

  c. Distrib uci ón Bi nomi al - E Ejercici jercici o de la semilla de Panicum Panicum sp . ((página página 1 102 02). ). i. Indique la probabilidad de que germinen 7 de d e las 10 semillas. [1] 0.003089905 ii. Indique la probabilidad de que germinen al menos 4 de las 10 semillas. [1] 0.145998 iii. Indique la probabilidad de que germinen 4 o más semillas. [1] 0.07812691 iv. Indique la probabilidad de que germinen a lo l o sumo 6 semillas. [1] 0.016222 v. Indique la esperanza (E) de esta variable aleatoria. [1] 2.5 vi. Indiqué la varianza (V) de esta variable aleatoria. [1] 1.875 vii. Presente y describa el gráfico “Distribución Binomial - Germinación de semillas\n (n=10, p=0.25)” p=0.25)”  

 

 

RTA: Es probable que germinen dos semillas que cualquier otra varianza de 1 a 10, RTA: siendo esta última, una de los más poco probables resultados d. Distrib ució n Poisson - E Ejercici jercici o de las picaduras de gorgoj o (pá (página gina 10 105) 5).. i. Indique la probabilidad de que, en 100 semillas 10 tengan picaduras. [1] 9.695426e-259 ii. Indique la probabilidad de que, en 100 semillas cuatro o más tengan t engan picaduras. [1] 0 iii. Indique la probabilidad de que en 100 semillas máximo 3 tengan picaduras. [1] 1

 

  CONCLUSIONES El estudio de variables y modelos probabilísticos desarrollado en este trabajo, sirve para poder presentar información precisa y verídica. De la l a mano del programa R nos permite poder procesar información de manera más ágil y rápida r ápida para realizar presentaciones con un grado alto de calidad. El hecho de poder predecir los acontecimientos que van a suceder nos permite poder tomar decisiones, y medir sucesos o calidad de los productos.

 

  BIBLIOGRAFIA Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en problemas de agronomía. Recuperado de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=322177 5&query=bioestadística.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF