PAQUETES ESTADISTICOS GUIA DE MANEJO DE STATA _____________________________________________________________________ Maestría en Ciencias de la Salud con Área de Concentración en Epidemiología El presente documento documento resume resume los principales comandos comandos utilizados para el análisis de bases de datos en STATA 1. ADMINISTRACIÓN GENERAL DE BASES DE DATOS •
COMANDOS PARA ABRIR BASE DE DATOS: COMANDO
using unidad:/nombre de la base .dta use a:/ nombre de la base .dta
• • • • • • •
Clic( a $ile ) Arc*i+o ,pen - Abrir Seleccionar el arc*i+o a e!ecutar Abrir cono de carpeta Seleccionar el arc*i+o a e!ecutar Abrir •
COMANDOS PARA GUARDAR INFORMACIÓN – ARCHIVO LOG
COMANDO Clic( al icono pergamino0 Elegir localización para guardar el arc*i+o Asignar nombre al arc*i+o con e"tensión log Abrir #ara cerrar clic( en el icono 1 en close log $ile 3og using a:/nombre del archivo .log Clic( al icono pergamino0 Elegir localización del arc*i+o Elegir el arc*i+o Clic( a la opción de append to e"isting $ile #ara cerrar clic( en el icono 1 en close log $ile • •
•
USO Estos comando se utilizan para abrir una base de datos. Es importante mencionar ue STATA TATA solo solo pued puede e e!ec e!ecut utar ar bases ases con e"tensión e"tensión dta. #ara trans$ormar trans$ormar las bases se utiliza un pauete ane"o denominado STATA T%A&S'E%. Esta opción *ace uso del menu propuesto por el programa
USO #ara #ara abrir abrir arc*i+ arc*i+o o log ue permit permite e grabar grabar auto automá máti tica came ment nte e toda toda la in$o in$orm rmac ación ión de coma comand ndos os 1 resu result ltad ados os gene genera rado doss en el análisis de la base de datos. #uede ser leído en el procesador de te"to 2ord.
• •
•
#ara ab abrir un un ar arc*i+o lo log 1a 1a e" e"istente en en el el cual se uieren ane"ar nue+os resultados.
• • •
•
•
COMANDO PARA DESCRIPCIÓN DE LA BASE DE DATOS
COMANDO (DIFERENTES OPCIONES) USO Se utiliza para describir las generalidades de describe la base de datos numero de obser+aciones4 de
• •
1
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
numero de +ariables 1 tama5o de la base0
desc d codeboo( • •
Se utiliza para ubicar +alores perdidos o $altantes 1 obser+ar generalidades de las +ariables list i$ Se utiliza para listar cualuier obser+ación E!. list i$ edad66. contenida en la base de datos. En este caso 3ist i$ edad 7. se e!empli$ica la b8sueda de +alores $altantes de la +ariable edad COMANDOS PARA EDICIÓN DE LA BASE DE DATOS •
COMANDO bro2se cono data bro2ser edit l is t label +ar +ariable E!. label +ar edad 9edad en a5os label de$ine E!. label de$ine edad ;
sa+e as a:/nombre de la base de datos hija .dta using a:/nombre de la base.dta
D
Sort $olio
merge $olio using a:/ nombre de la base de datos hija.dta
G
tabFmerge
I
sa+e4 replace
USO #ara abrir una base gen@rica localizada en A ,rganizar es esta base de de datos de acuerdo con el n8mero de $olio Selección de las +ariables ue se desean conser+ar uardar arc*i+o de las +ariable seleccionadas en el punto anterior #ara abrir la base a la cual deseamos pegar las +ariables seleccionadas arc*i+o: nombre de la base de datos hija .dta ,rganizar esta base de datos con base en la +ariable $olio. 3a +ariable $olio debe ser igual en todos los arc*i+os #ara unir las +ariables al arc*i+o en uso. 3a unión se e+idencia por la creación automática de la +ariable Fmerge #ara +e +eri$icar la la un unión. He Hebe ob obser+arse un una so sola categoría ?0 con el total de las obser+aciones #ara guardar los cambios *ec*os en la base de datos nombre de la base principal.dta principal.dta
;< ;;
•
describ describe e drop Fmerge
#ara #ara re+isar re+isar ue la nue+as nue+as +ariab +ariables les $ueron $ueron incluid incluidas as #ara bo borrar la l a +a +ariable cr creada Fm Fmerge4 de de!ando la la posibilidad de nue+a uniones
CREACIÓN DE UN ARCHIVO DO
Es un arc*i+o ue constru1e inclu1e la relación de todos los comandos necesarios para abrir4 e!ecutar 1 analizar una base de datos. Es una rutina de comandos. 2. ANALISIS DE BASES DE DATOS •
• • •
COMANDOS DESCRIPCIÓN UNIVARIADA
COMANDO summarize summ sum
USO #ara est estima imar de una o más +ariab iables les continuas numero de obser+aciones4 media4 des+iación estándar 1 rango. En el e!emplo se describirán las +ariables edad4 peso 1 talla
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
#ara #ara estim estimar ar en una una +aria +ariabl ble e categ categór óric ica a n8me n8mero ro de obse obser+ r+ac acio ione nes4 s4 porc porcen enta ta!e !e 1 $recuencia acumulada #ara #ara estimar estimar simult simultáne áneame amente nte en mas de una +ariable categórica n8mero de obse obser+ r+ac acio ione nes4 s4 porc porcen enta ta!e !e 1 $rec $recue uenc ncia ia acumulada #ara obser+ar dispersión de los datos 1 +alores aberrantes #ara +er la distribución de una +ariable continua #ara +e +er la la di distribución en en ca ca!a de de un una +ariable continua #ara +e +er la la di distribución de de un una +a +ariable conti ontinu nua a com compara parada da con con el pat patrón rón de distribución normal #ara re r ealizar la l a pr prueba es e stadística de de normali normalidad dad de una una +ariab +ariable le contin continua ua Jo: Jo: dist distrib ribuc ución ión norm normal0 al0.. ,$rec ,$rece e los los dato datoss de curtosis curtosis 1 sesgo la distribución distribución normal tiene una curtosis de ? 1 un sesgo de cero0 #rueba de S*apiro Kil( para probar normalidad de una +ariable +ariable continua Jo: la +ariable tiene distribución normal0 #ara comprobar ob!eti+amente la normalidad de una una +ari +ariab able le cont contin inua ua 1 e+al e+alua uarr sus sus posibl posibles es tras$o tras$ormac rmacion iones es en b8sue b8sueda da de normalidad en su distribución. Jo: la +ariable contin continua ua trans$ trans$orm ormada ada tiene tiene distribu distribució ción n normal
COMADOS PARA ANLISIS BIVARIADO
COMANDO USO RELACIÓN VARIABLE CONTINUA VS. DICOTÓMICA sdtest +ar4 b1+ar0 Se utiliza para comparar las +arianzas una E!. sdtest edad4 b1genero0 +ariable continua con una dicotómica. Jo: las +arianzas son iguales ttest +ar4 b1+ar0 Si la las +a +arianzas so son ig iguales. Co Compara la las med medias ias una una +ari +ariab able le con contin tinua con una dicotómica. Jo: las medias de las categóricas son iguales. ttest +ar4 b1+ar0 uneual Si la las +a +arianzas no no so son ig iguales. Co Compara la las med medias ias una una +ari +ariab able le con contin tinua con una dicotómica. Jo: las medias de las categóricas son iguales. iguales. tab +ar4 summ +ar0 Mues Muestr tra a una una tabl tabla a de cont contin inge genc ncia ia ue ue E!. tab genero4 summ edad0 relacio relaciona na una +ariab +ariable le dicotó dicotómic mica a con una continua
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
tab +ar +ar4c*i=
%elaciona dos +ariables dicotómicas mediante una prueba de c*i= tab +ar +ar4 ro2 cell e"act4 all %elaciona dos +ariables categóricas4 calcula porcenta!e dentro de las $ilas 1 las columnas4 adem además ás de la prueb rueba a e"ac e"acta ta de 'is* 'is*er er cuando se tiene una celda con menos de obser+aciones. tabi a b c d %ealiza una tabla de contingencia con los +alores e"actos de las celdas4 además de la prueba de c*i= cc +ar +ar #ermite obtener la razón de momios relacionando dos +ariables dicotómicas cci a b c d %elaciona una tabla de contingencia con los +alores e"actos de las celdas4 además de la prueba de c*i=. ,$rece el ,% cs +ar +ar #ermite obtener %% relacionando dos +ariables dicotómicas csi a b c d #ara realizar una tabla de contingencia con los +alores de agrupados de la tabla. Calcula el %% logit +ardep +arindep +arindep #ermite #ermite realizar realizar una regresión regresión logística logística con un sólo regresor 3ogistic +ardep +arindep RELACIÓN VARIABLE CONTINUA VS. CATEGÓRICA DE MAS DE DOS CATEGORIAS tab +ar4 summ +ar0 ano+a %eal %ealiz iza a una una tabl tabla a de cont contin inge genc ncia ia ue ue E!. tab genero4 summ edad0 relacio relaciona na una +ariab +ariable le categó categórica rica con una cont contin inua ua.. ,$re ,$rece ce di$er di$eren encia cia de medi medias as 1 +arianza entre las categorías one2 one2a1 a1 +ar +ar4 ar4 mean eans bon$ on$erro erron ni #erm #ermit ite e compa compara rarr media ediass 1 +ari +aria anzas nzas entr entre e los grupos. #ara medias: Jo: 3as medias son di$erentes J;: Al menos una media es di$erente. #rueba Larttlet +arianzas0: Jo: 3as +arianzas son iguales J;: Al menos una +arianza es di$erente. RELACIÓN VARIABLE CONTINUA VS. CONTINUA Corr Correla elaci ción ón de #ear #earsó són. n. Esta Esta corre correlac lació ión n p2corr +ar +ar4 sig a!u a! u sta st a por po r el nume nu mero ro de reg re g reso re sore res. s. E l corr +ar +ar4 sig calc calcu ulo tom toma en cuen cuentta el nume numero ro de obser+aciones completas. pcorr +ar +ar Correlación parcial. El calculo se realiza sin ponderar por otras +ariables plot +ar; +ar= #ermite gra$icar en diagrama de dispersión dos +ariables continuas (sm +ar; +ar=4 lo" #ermite gr gra$icar en en di diagrama de de di dispersión dos dos +ari +ariab able less cont contin inua uass con con t@cn t@cnic ica a de • •
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
COMANDO tab +ar4gen +ar0
•
USO #ara ge generar +a +ariables in indicadoras de de un una +ariable de más de dos categorías
USO Correla Correlación ción de #earsó #earsón. n. Esta Esta correla correlació ción n a!usta por el numero de regresores. Solo se usa para +ariables continuas Correla Correlación ción parcial parcial.. Sin ponder ponderaci ación ón por otras +ariables. Solo se usa para +ariables continuas Comando para regresión lineal m8ltiple para anál anális isis is mult multi+ i+ar aria iado do con con una una +ari +ariab able le depe ependien iente continu inua 1 n +aria riables independientes de cualuier tipo Comando para regresión logística m8ltiple con una +ariable dependiente dicotómica 1 n +ari +ariab ables les inde indepen pendi dien entes tes de cual cualu uier ier tipo tipo.. 3os resu result ltad ados os estim estimad ados os están están en escala logarítmica4 lo ue permite estimar probabilidades 1 proporciones a!ustadas en estudios de co*orte 1 trans+ersal sales respecti+amente Comando para regresión logística m8ltiple con una +ariable dependiente dicotómica 1 n +ari +ariab ables les inde indepen pendi dien entes tes de cual cualu uier ier tipo tipo.. 3os resu result ltad ados os estim estimad ados os están están en escala real razones de momios en estudios de casos 1 controles 1 razones de momios de pre+alencia en estudios trans+ersales0. Comando para usar sar el modelo elo lin lineal gene eneraliz lizado para una +ariab iable con distrib distribuci ución ón poisso poisson n medida medida como como conteo conteo regresión poisson0 1 n +ariables independientes de cualuier tipo Comand Comando o para para regresi regresión ón poisso poisson n m8ltip m8ltiple le para análisis multi+ariado con una +ariable depen epend dient iente e de cont onteo 1 n +ari +ariab able less inde indepe pend ndie ient ntes es de cual cualu uie ierr tipo tipo.. 3os 3os resultados están en escala logarítmica Comand Comando o para para regresi regresión ón poisso poisson n m8ltip m8ltiple le para análisis multi+ariado con una +ariable depen epend dient iente e de cont onteo 1 n +ari +ariab able less inde indepe pend ndie ient ntes es de cual cualu uie ierr tipo tipo.. 3os 3os resu result ltad ados os está están n en esca escala la real real ries riesgo goss relati+os0 &ota: &ota: la +ariab +ariable le e"posu e"posure re se utiliz utiliza a para para
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Trusted by over 1 million members
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Thank you for interesting in our services. We are a non-profit group that run this website to share documents. We need your help to maintenance this website.