Bottarelli E. Quaderno Di Epidemiologia 2016 CrComm (1)
April 11, 2017 | Author: Mario Cossu | Category: N/A
Short Description
Download Bottarelli E. Quaderno Di Epidemiologia 2016 CrComm (1)...
Description
1
Cap. 1 Introduzione allo studio dell'epidemiologia 1.1.Epidemiologia e malattie dell'uomo negli ultimi 100 anni OBIETTIVI: apprendere una comune forma di espressione grafica dei dati; constatare i progressi compiuti dalla medicina umana - per alcune malattie - nell'arco di un secolo; porre l'attenzione sull'importanza dell'interpretazione dei dati.
Questa prima unità didattica ha una funzione introduttiva e in essa vengono proposti, per sommi capi, alcuni concetti di base per fornire una idea approssimativa riguardo all'approccio «epidemiologico» ai problemi sanitari. Più in particolare, vi si parla delle malattie nelle popolazioni, della mortalità nell'uomo e negli animali, dei progressi della medicina, dell'importanza dei dati e della loro presentazione e interpretazione. I «dati» Cominciamo col dire metaforicamente che la materia prima - malta, cemento, mattoni - di ogni edificio epidemiologico è costituita dai dati. Che cosa sono i dati? Una risposta un po' più esauriente a questa domanda si trova nella prossima unità didattica; per ora basta dire che i "dati" sono numeri o valori o attributi inseriti in un particolare contesto, e che portano con sé una dose di informazione. I dati rappresentano il «raccolto» di ogni studio epidemiologico, ed anche il mezzo per giungere a conclusioni scientificamente valide. "Dati" sono contenuti, ad esempio, nel grafico (più precisamente: diagramma a barre) che segue.
2
I dati del diagramma sono stati raccolti dal più importante Ente internazionale che si occupa di sanità pubblica: l'Organizzazione Mondiale della Sanità (World Health Organization); essi rappresentano il numero di morti per alcune forme morbose nel 1900 e nel 1984. In primo luogo è da rilevare l'espressione dei dati numerici sotto forma di diagramma a barre; questo è un tipo di espressione molto utile perché consente di cogliere le caratteristiche salienti e di effettuare raffronti direttamente «a colpo d'occhio» (prova per un attimo a immaginare la minor immediatezza se gli stessi dati fossero presentati in forma tabulare, e clicca sull'immagine a destra per vedere corrispondente la tabella). La scala dell'asse orizzontale indica i tassi di mortalità per 100.000 persone e per anno (cioè il numero di morti ogni 100.000 persone in 1 anno per ogni causa considerata). Questo tipo di espressione (morti/100.000/anno), molto comune in medicina umana, può essere usato anche in medicina veterinaria, eventualmente modificando arbitrariamente la scala (es. morti/1000/anno oppure morti/10.000/mese ecc.) in rapporto alla dimensione numerica della popolazione di animali in studio e ad altri fattori. I progressi della medicina Nel diagramma, le barre rosse forniscono i valori osservati nel 1900, quelle verdi i valori del 1984. Ad esempio, dal diagramma si desume che nel 1984 sono morte per cancro circa 190 persone su 100.000, mentre nel 1900 ne sono morte - per la stessa causa - soltanto 60 su 100.000. Ora prova a confrontare le differenze fra barre rosse (anno 1900) e verdi (anno 1984) per ciascuna delle cause riportate nel diagramma, tenendo presente che nella porzione alta sono riportate le malattie infettive, mentre in basso vi sono le malattie non-infettive (per comodità il grafico è riprodotto rimpicciolito qui a destra, clicca per ingrandirlo).
3
Puoi facilmente notare che, per le malattie infettive, le barre verdi indicanti la frequenza di morti nel 1984 sono pressoché inesistenti. In altre parole, oggi le malattie infettive rappresentano soltanto una causa di morte trascurabile. In particolare, enormi progressi sono stati ottenuti soprattutto per quelle malattie infettive che, in passato, hanno rappresentato un flagello per l'umanità. Basti evocare, fra gli altri, morbi terribili quali: peste, vaiolo, colera; queste malattie non vengono nemmeno considerate nel grafico, in quanto già ai primi del '900 non rappresentavano più un problema. Spiccano invece i progressi per altre temibili malattie infettive: tubercolosi, influenza, polmonite, difterite, gastroenteriti infettive e tutte le malattie dell'infanzia. Molte di queste malattie sono attualmente pressoché scomparse, almeno nei paesi industrializzati cui il diagramma si riferisce. Quelle che ancora persistono (es. alcune malattie infantili) non rappresentano più una causa di morte. Ben diversa è la situazione in paesi meno sviluppati, come si intuisce facilmente se si considera che le malattie infettive causano annualmente nel mondo quasi 20 milioni di morti, cioè oltre 1/3 di tutti i decessi. Una parte importante di questi progressi è da attribuire alla epidemiologia ed alla preventiva
medicina
I progressi nella Medicina e nelle condizioni di vita dell'uomo nei Paesi industrializzati sono da attribuire ad una serie di fattori, fra i quali emergono per importanza: miglioramento dell'alimentazione, disponibilità di acqua pura, controllo dei vettori, pastorizzazione del latte, educazione delle madri riguardo all'allevamento dei figli, vaccinazioni, utilizzo di antibiotici, miglioramento generale dell'igiene e delle condizioni di vita. In questo scenario, il contributo della medicina veterinaria non è stato trascurabile: basti pensare ai miglioramenti dell'igiene degli alimenti di origine animale ed alla lotta alle malattie che possono essere trasmesse dagli animali all'uomo. Anche in Italia la mortalità dell'uomo per malattie infettive e parassitarie, particolarmente elevata agli inizi del secolo, è andata progressivamente riducendosi nel tempo, grazie al miglioramento delle condizioni igieniche e, recentemente, a una maggiore diffusione delle vaccinazioni ed all'utilizzo di farmaci sempre più efficaci. Nel 1998 si sono registrati, a causa di malattie infettive, solo 0.6 decessi ogni 10.000 uomini e 0.5 decessi per ogni 10.000 donne. A scopo di raffronto, considera che nello stesso anno i morti per malattie cardiovascolari sono stati 48 (maschi) e 32 (femmine), sempre ogni 10.000 individui. L'interesse per la mortalità per malattie infettive e parassitarie oggi è, quindi, limitato ad alcuni fenomeni emergenti, quali la recrudescenza della tubercolosi, favorita anche dalla resistenza ai farmaci tradizionali di alcuni ceppi del batterio (Mycobacterium tuberculosis) agente della malattia. [Fonte dei dati: ISTAT, Istituto Nazionale di Statistica, www.istat.it]. Come si avrà modo di imparare durante il corso degli studi, la diminuzione della mortalità per malattie infettive è avvenuta, seppure in misura più limitata, anche nel settore veterinario relativamente agli animali "da compagnia" (i cosiddetti pets); al contrario, un analogo miglioramento non sembra essersi verificato nel settore dell'allevamento industriale degli animali "da reddito", ossia quelli allevati come fonte di guadagno (bovini, suini, pollame ecc.) per i quali le malattie infettive continuano a rappresentare fra le più importanti cause di danni economici o di mortalità.
4
Progressi o regressi? Un'altra osservazione: esaminando il diagramma, si potrebbe dedurre che ai progressi ottenuti nel caso delle malattie infettive si siano associati dei regressi per altre forme morbose (cancro e malattie cardiache, per le quali la maggiore lunghezza della barra verde rispetto alla rossa testimonia che si è avuto un incremento della frequenza nel periodo 1900-1984). Questi regressi sono soltanto apparenti e sono dovuti all'allungamento della vita media della popolazione avvenuto nel corso del XX secolo. Infatti, per una corretta interpretazione dei dati, bisogna tener conto che in una popolazione con molti anziani saranno più frequenti le malattie tipiche della senilità, quali appunto le neoplasie o le malattie di cuore. La scienza medica ha fatto molti progressi ed ha prolungato la durata della vita dell'uomo; tuttavia non si vive in eterno e quindi... di qualche malattia bisogna pur morire! È quindi del tutto logico che le patologie tipiche degli anziani rappresentino una importante causa di morte in popolazioni composte da molti individui in età avanzata. Per effettuare un confronto preciso che annulli l'effetto dell'età, i dati andrebbero standardizzati in base all'età (più avanti verrà proposto un esempio di standardizzazione delle misure).
riportato l'incremento delle nell'arco del XX secolo.
Ad ulteriore dimostrazione dei progressi compiuti nel campo della sanità in tutto il mondo, nel diagramma a sinistra è speranze di vita delle popolazioni dei paesi sviluppati e non-sviluppati
Una breve digressione: salute dei ricchi e salute dei poveri Nonostante i progressi compiuti, ancora molto resta da fare. Dovrebbe essere costantemente presente, nella nostra coscienza di popoli di Paesi ricchi economicamente (ma forse non altrettanto ricchi sul piano morale e spirituale), la triste condizione in cui ancora versa una parte considerevole dell'umanità. Dati emblematici sono rappresentati nel grafico a destra, che illustra l'andamento della mortalità infantile nel mondo. Dal 1960 al 2000 nei Paesi industrializzati la mortalità infantile è diminuita dell'80% circa (da 31 a 5.5); nell'Africa sub-sahariana, la diminuzione è stata molto più modesta (da 153 a 108, ossia circa il 30%). Deve far riflettere anche il fatto che nei Paesi non industrializzati la mortalità infantile è causata non da malattie intrinsecamente gravi o incurabili, bensì da patologie che potrebbero essere facilmente prevenute, quali semplice malnutrizione o disidratazione per diarrea. NELLA PROSSIMA UNITÀ: viene ampliato l'argomento riguardante i dati e la loro interpretazione, e vengono elencati, in maniera essenziale, gli obiettivi pratici che si possono conseguire attraverso l'applicazione dei metodi epidemiologici. Interpretazione dei dati... arte o scienza?
5
Cap. 1. Introduzione allo studio dell'epidemiologia 1.2 Interpretazione dei dati... arte o scienza? OBIETTIVI: apprendere l'impostazione di uno studio scientifico osservare delle strutture fondamentali di uno studio epidemiologico; riflettere sull'importanza dell'interpretazione dei dati
L'epidemiologia viene considerata una scienza "eclettica" con molti punti di contatto con altri settori di studio: le scienze biomediche di base, le scienze cliniche, la statistica ed anche, relativamente alla epidemiologia umana, la antropologia, la demografia e la sociologia. In ogni caso, l'epidemiologia (così come molte altre discipline scientifiche) si basa sul metodo scientifico. Il metodo scientifico viene usato nelle scienze naturali a partire dalla "rivoluzione scientifica" del XVII secolo ed è rimasto concettualmente invariato; esso si basa sull'osservazione dei fenomeni naturali e, in buona sostanza, consiste in un procedimento che avanza per passi successivi (vedi schema) dalle osservazioni fino alle conclusioni utilizzando un rigoroso sistema di generazione e verifica della ipotesi.
Rappresentazione schematica del metodo scientifico
6
Non sempre i risultati degli esperimenti conducono nella giusta direzione: occasionalmente i risultati ingannano, e si traggono conclusioni errate. Però la scienza è saggia, si accontenta delle umane limitazioni degli scienziati e non ne teme gli errori individuali, perché il suo incessante processo di verifica collettiva le permette col tempo di individuarli ed emendarli. Il metodo scientifico si basa non soltanto sull'osservazione, ma su un processo chiamato «ragionamento ipotetico-deduttivo», che è un processo di generazione dell'ipotesi seguito da tentativi di negare l'ipotesi stessa - cioè un processo basato sulla «falsificazione dell'ipotesi». In sostanza, l'impossibilità di rifiutare l'ipotesi rappresenta la prova migliore della sua veridicità. Pertanto, la forza di una ipotesi dipende dal grado con cui essa può essere confutata. Questo concetto è stato espresso magistralmente dalla famosa frase di Sherlock Holmes (il detective creato da sir Arthur Conan Doyle): «È una mia vecchia massima che, una volta escluso l'impossibile, ciò che resta, per quanto improbabile, non può che essere la verità». Anche fra le famose «Leggi di Murphy» si trova qualcosa di adatto: la Legge di Bates sulla ricerca, che recita: «La ricerca consiste nel percorrere vicoli per vedere se sono ciechi». Comunemente, quando si effettuano indagini epidemiologiche "di routine" nella pratica clinica e su argomenti già ampiamente noti, alcuni dei passi del classico metodo scientifico vengono omessi, e lo schema dell'indagine può essere riassunto in sole 3 fasi: • • •
raccolta dei dati elaborazione dei dati interpretazione dei dati (conclusioni)
ESEMPIO. Veniamo interpellati per accertare la frequenza di mastite subclinica in un grande allevamento di bovine da latte. Conosciamo già bene questa patologia, e quindi non è necessario formulare alcuna teoria né ri-studiare quanto già conosciamo sull'argomento, né dobbiamo formulare alcuna ipotesi sulle cause di mastite, o sulle modalità di trasmissione ecc.. Passiamo quindi direttamente alla raccolta dei dati (ad esempio sottoponendo tutte le vacche in lattazione ad un test idoneo a rivelare la presenza di mastite). Successivamente elaboriamo i dati (ad esempio: calcoliamo la proporzione di animali positivi; evidenziamo eventuali correlazioni fra mastite ed età o altri fattori; calcoliamo gli intervalli di confidenza ecc.). Finalmente, possiamo trarre le debite conclusioni. I DATI sono numeri (oppure valori non numerici, come ad esempio sì o no, malato o sano ecc.), ma non sono soltanto numeri. I dati sono numeri in un contesto. Ad esempio, il numero "3.8" o il valore "3.8 kg" in sé non portano alcuna informazione. Ma se veniamo a sapere che una conoscente ha dato alla luce un bambino del peso di 3.8 kg, allora questo numero assume significato in uno specifico contesto e, ad esempio, possiamo congratularci per il buon peso del bambino, indice di presumibile buona salute. Il contesto implica il possesso di conoscenze sull'argomento, le quali ci consentono di formulare giudizi. Ad esempio, sappiamo che un bambino alla nascita non può pesare 450 grammi, né 45 kg. Il contesto fa sì che il numero contenga informazione.
7
I dati nella pratica La struttura logica ora descritta (cioè i processi di raccolta-elaborazione-interpretazione dei dati) non è peculiare dell'epidemiologia, ma è comune anche ad altri settori della professione veterinaria. Per esempio, nel procedimento diagnostico di fronte ad un animale ammalato, il veterinario raccoglie dati ( anamnesi, visita dell'animale con evidenziazione dei sintomi, esami di laboratorio ecc.); questi dati vengono «elaborati» (spesso quasi inconsciamente!) nella mente del veterinario che infine, interpretandoli anche in base al suo «buon senso clinico», arriverà alla diagnosi. Durante la visita clinica di un animale, alcuni dei dati raccolti non sono esprimibili in forma numerica. Ad esempio, è impossibile (o molto difficile) misurare e rappresentare con precisione attraverso un numero fenomeni come l'entità di una zoppicatura o il dolore provocato da una manovra di palpazione addominale. In altri casi, invece, i dati sono esprimibili in forma numerica; ad esempio, il numero di pulsazioni cardiache al minuto. Quasi sempre, le osservazioni non quantificabili numericamente possono essere trasformate in un numero in base a criteri più o meno arbitrari. Ad esempio, una zoppicatura potrebbe essere codificata con i valori 0, 1, 2, 3, 4, dove 0 corrisponde ad andatura normale, 1 a zoppicatura appena percettibile, 2 a zoppicatura lieve ecc. Questo tipo di trasformazione è molto utile quando i dati devono essere sottoposti ad una elaborazione. In epidemiologia i dati sono sempre rappresentati da numeri. Ad esempio, uno studio epidemiologico potrebbe mirare a stabilire QUANTI animali sono affetti da una malattia in un determinato momento, oppure QUANTI nuovi casi si sono verificati in un lasso di tempo, oppure QUANTI animali esposti ad un certo fattore vengono colpiti dalla malattia, ecc. Ecco perché l'epidemiologia, servendosi di dati numerici, ricorre più di altre discipline a tabelle o grafici in cui riportare i dati numerici. Per lo stesso motivo, l'epidemiologia si serve frequentemente di due altre discipline: la matematica e, soprattutto, la statistica. Quest'ultima comprende i metodi di studio dei fenomeni collettivi e quindi rappresenta logicamente la compagna ideale dell'epidemiologia (e di altre discipline). I dati purtroppo non parlano da soli, ma vanno interpretati. L'interpretazione, però, non deve essere lasciata al buon senso soggettivo dello sperimentatore. È necessario definire una serie di metodi formali, accettati dal mondo degli scienziati; questi metodi devono essere usati per l'analisi dei dati, allo scopo di trarre conclusioni il più possibili veritiere. La statistica comprende appunto questi metodi. Riassumendo: la statistica è l'interfaccia tra la matematica e la scienza medica:
Attraverso procedimenti statistici di "analisi", i dati possono essere convertiti dalla forma grezza iniziale (poco o nulla interpretabile) ad una forma più comprensibile. Il fatto è che, per tutte le discipline scientifiche che studiano gli organismi viventi, i dati ottenuti attraverso gli esperimenti oppure raccolti «in campo» (ossia in natura) non consentono mai di giungere ad una conclusione con una certezza del 100%. La statistica ci aiuta in maniera oggettiva, numericamente, ad analizzare
8
le diverse ipotesi ed a valutare il grado di incertezza delle conclusioni cui siamo giunti. Ciò significa che lo studio e l'interpretazione dei fenomeni biologici dipendono imprescindibilmente dalla statistica.
Inoltre, come vedrai più avanti, attraverso i metodi statistici le osservazioni effettuate su un campione possono essere generalizzate all'intera popolazione, attraverso un processo logico detto di «inferenza» (statistica inferenziale). D'altra parte, già secoli or sono, due fra i più grandi studiosi di tutti i tempi, padri delle scienze e del metodo sperimentale, si erano resi conto che l'analisi dei dati è parte inscindibile del processo di ampliamento delle conoscenze umane:
Non devi pensare, però, che il processo di raccolta-elaborazione-interpretazione dei dati sia puramente meccanico o possa essere in qualche modo automatizzato in tutte le sue fasi. Infatti, sia nella raccolta che nell'elaborazione che - soprattutto - nell'interpretazione dei dati è necessario ingegno, acume e discernimento, associati ad una profonda conoscenza della storia naturale della malattia (cioè come essa si manifesta e decorre in natura, senza intervento del medico) nonché di tutte le altre discipline mediche di base (anatomia, fisiologia, patologia generale ecc.). Ed è forse anche per questo che i sistemi di diagnosi computerizzata - ossia i cosiddetti «sistemi esperti» che certo costituiscono un utilissimo ausilio diagnostico per casi particolari, come ad esempio gli avvelenamenti - non possono (ancora?) competere con un buon clinico. Gli obiettivi pratici dell'epidemiologia veterinaria A questo punto potresti chiederti quali sono gli obiettivi pratici ottenibili attraverso la raccolta, l'elaborazione e l'interpretazione dei dati. La risposta a questa domanda racchiude l'essenza stessa di tutta l'attività epidemiologica, e quindi non può essere esaurita in poche righe. In seguito, verrà accennato ai compiti specifici ed agli scopi pratici della disciplina. Tuttavia, possiamo già anticipare che le informazioni sullo stato sanitario di popolazioni animali sono utili ad una ampia gamma di soggetti, a partire dai semplici proprietari degli animali o allevatori, fino alle Autorità
9
sanitarie periferiche e centrali (nazionali ed internazionali) ed ai centri di ricerca. Per ora, basterà ricordare che le informazioni raccolte sono utili a: • • •
• • • • •
identificare la causa e l'origine delle malattie, soprattutto (ma non soltanto) di quelle diffusibili; identificare la presenza di determinate malattie in un territorio; accertare l'assenza di determinate malattie; questo è spesso richiesto dai partner commerciali (che non intendono correre il rischio di importare nuove malattie in territori indenni attraverso l'acquisto di animali o di loro prodotti) e vale soprattutto per le malattie trasmissibili; individuare la frequenza, o la localizzazione geografica, o l'andamento nel tempo delle malattie; valutare l'importanza (sanitaria, economica, zoonosica ecc.) delle malattie esistenti in un territorio; determinare le priorità di intervento, tenuto conto delle risorse disponibili; pianificare ed implementare piani di controllo e sorvegliarne l'andamento; soddisfare le richieste di informazioni provenienti da organismi internazionali (es. Office International des Épizooties, OIE).
10
Cap. 1. Introduzione allo studio dell'epidemiologia 2.1 Eventi-chiave nella storia dell'epidemiologia OBIETTIVO a scopo di cultura generale, conoscere alcuni eventi e personaggi celebri fra i tanti che hanno caratterizzato la scienza medica ed hanno gettato le basi della epidemiologia moderna.
•
Nato a Kos (Grecia) nel IV secolo A.C., Ippocrate affrancò la medicina dalla speculazione filosofica e dalla superstizione, basando la pratica medica sullo studio del corpo umano. Ritenendo che ogni malattia avesse una spiegazione razionale, riconobbe l'importanza dell'ambiente sulla comparsa e sull'evoluzione delle malattie. Per primo descrisse con precisione i sintomi di alcune affezioni (come la polmonite e l'epilessia nei bambini) e fu sostenitore di rimedi semplici, quali il sonno, il riposo ed una buona alimentazione. Egli dimostrò che i pensieri ed i sentimenti avevano origine dal cervello e non dal cuore, come allora si credeva. Ippocrate fu anche brillante studioso di matematica e geometria; egli venne e viene ancora riconosciuto come "padre della medicina".
• Girolamo Fracastoro (Verona 1478 - Affi 1553), fisico, poeta, astronomo e geologo, propose un abbozzo della teoria scientifica dei microrganismi come agenti di malattia ben 300 anni prima della formulazione avvenuta ad opera di Pasteur e Koch. Fracastoro raccolse la sua visione sulle epidemie nell'opera "De Contagione et Contagiosis Morbis" (Sul Contagio e le Malattie Contagiose), nella quale si affermava che ogni malattia era provocata da un diverso tipo di corpuscoli in grado di moltiplicarsi rapidamente e di trasmettersi dagli ammalati ai sani in 3 modalità: per contatto diretto, per il tramite di materiali diversi (es. indumenti) ed attraverso l'aria. La teoria di Fracastoro fu molto apprezzata, ma venne ben presto offuscata dalle dottrine mistiche del medico rinascimentale Paracelso.
•
Durante le spaventose epidemie di peste che colpirono l'Europa negli anni fra il 1346 ed il 1352, e che portarono a morte un quarto degli abitanti dell'Europa, si cominciò a tener conto delle persone morte ogni settimana. Fu tuttavia soltanto 3 secoli più tardi, per merito di John Graunt (1620-1674), che prese corpo l'idea dell'utilità di disporre di statistiche epidemiologiche sulla durata della vita e sulle cause di morte. Graunt è autore di una delle prime opere di statistica venute alla luce in Europa ("Natural and political observations upon the bill of
11
mortality"), in cui i dati dei certificati di morte stilati dai ministri del culto vengono riassunti sotto forma di tavole, percentuali e probabilità. Da esse si evince, ad esempio, l'alta frequenza di morte nei bambini (1/3 di essi moriva in età 5) è consigliabile utilizzare una formula del chi-quadrato modificata secondo quanto proposto da F. Yates nel 1934:
I dati utilizzati nell'esempio sono fittizi ed utilizzati esclusivamente a scopo didattico per il calcolo del chi-quadrato. Il fatto che la differenza fra i due gruppi in studio sia risultata statisticamente significativa non implica necessariamente che, nella pratica clinica, la xmicina avrebbe sostituito la streptomicina nella terapia della leptospirosi del cane. Ad esempio, la xmicina potrebbe essere molto più tossica, oppure dotata di gravi effetti collaterali, oppure molto più costosa ecc. Infine, ti ricordo che il test chi-quadrato si può estendere al confronto di più di due gruppi, con tabelle n x n. Però in tal caso il calcolo è diverso da quello dell'esempio. Foglio di calcolo per Microsoft Excel® con un esempio di calcolo del chi-quadrato
78
Il mio consiglio: consolida quanto hai appreso risolvendo questo problema (si apre in una nuova finestra) NELLA PROSSIMA UNITÀ: si accenna ad un caso diverso: il confronto fra due medie (anziché due percentuali). Attraverso un esempio ed un foglio di calcolo, si illustra l'applicazione di uno dei test più frequentemente utilizzati per il confronto di due medie: il test t di Student. Significatività statistica e causalità
Confrontare due medie: il test t di Student
79
Cap. 5. Dalla associazione alla causalità 5.6 Confrontare due medie: il test t di Student OBIETTIVO: imparare l'utilizzo del test t attraverso un esempio
Nella unità precedente hai imparato come stabilire (attraverso il test del chi-quadrato) se due proporzioni (o due percentuali) sono significativamente diverse fra loro. Vi sono molte altre situazioni in cui devi risolvere un problema concettualmente simile: quello di confrontare due (o più) valori ottenuti studiando due (o più) gruppi, ma avendo a disposizione, invece di due percentuali, dati di altro tipo. Ad esempio, potresti confrontare una variabile qualitativa con una variabile quantitativa, oppure una qualitativa con un'altra pure qualitativa, od ancora più variabili quantitative con una o più variabili numeriche ecc. ecc. Ciascuno di questi casi richiede un test statistico adatto. In effetti, uno degli aspetti più difficili (...per i non-statistici!) nell'elaborazione dei dati consiste proprio nella scelta del test da utilizzare: c'è anche chi ha paragonato la statistica... all'arte culinaria: un test statistico è come una ricetta di cucina. Un buon cuoco ottiene un buon piatto a partire dagli ingredienti che ha a disposizione, così come uno studioso ottiene informazioni veritiere «cucinando» opportunamente, con un test statistico adatto, i dati che ha raccolto.
UN PROBLEMA FREQUENTE: CONFRONTARE DUE MEDIE Una circostanza frequente è quella in cui si sono esaminati due (o più) campioni di animali; sugli animali di ciascun campione è stata misurata una variabile numerica (es. altezza, peso, frequenza cardiaca, produzione di latte ecc.), di cui è stata poi calcolata la media. Ti chiedi: la differenza fra le medie dei due campioni è significativa? Ossia: puoi affermare che la differenza osservata non è dovuta al caso ma che, invece, esiste veramente una diversità tra le medie delle due popolazioni da cui i campioni stessi derivano? Oppure, esprimendoci in altro modo: puoi affermare che i due campioni appartengono a popolazioni diverse riguardo alla variabile considerata?
80
Come vedi la questione, in buona sostanza, è analoga a quella della unità precedente in cui hai utilizzato il test del chi-quadrato per confrontare due proporzioni. Il fatto è che la «ricetta» del chiquadrato va bene per confrontare due proporzioni, ma non è utilizzabile se devi confrontare due medie. Allora, devi ricorrere ad un altro test: ad esempio il test «t» (detto anche t di Student). Lo schema di ragionamento da fare è quello già visto:
I calcoli da eseguire per effettuare il test t sono un po' più complicati rispetto a quelli del chiquadrato, e perciò non entreremo nei dettagli. Solo a titolo di curiosità, ecco la formula di calcolo del valore t:
... e per i più interessati (o masochisti?) dirò che s è la deviazione standard media delle deviazioni standard dei due campioni, cioè la radice quadrata della varianza che si ottiene sommando le devianze dei due campioni e dividendo per la somma dei gradi di libertà. Una volta trovato il valore t, esso va confrontato con quelli tabulati in apposite Tabelle, che si trovano in tutti i libri di statistica. Dal confronto fra il valore ottenuto e quello tabulato si potrà stabilire se la differenza fra le due medie è dovuta al caso o no. Ora che ti ho esposto brevemente il principio che "sta dietro" al calcolo del test t di Student, ti
81
consiglio di non preoccuparti più di tanto di calcoli e tabelle di raffronto (che, fra l'altro, sono più complesse di quanti ti aspetteresti, vedi un esempio qui). Oggi, infatti, il test t si esegue al computer con l'aiuto di apposito software, incluso in pacchetti statistici oppure reperibile in rete. Ad esempio, alla fine di questa unità troverai un foglio di calcolo con cui calcolare il valore t su una serie di dati che tu stesso puoi inserire. In conclusione: è importante che tu conosca non tanto il metodo di calcolo (difficile da ricordare), quanto l'esistenza del test t ed il contesto in cui esso si applica. Ancora più importante è che tu sia convinto che, anche nel confronto fra due medie, non si possono trarre conclusioni soggettive «ad occhio», ma è indispensabile ricorrere ad un test statistico. Un esempio di applicazione del test t Stai sperimentando l'effetto sul suino dell'aggiunta alla razione di una miscela «probiotica» costituita da batteri normalmente presenti nella flora intestinale del suino. L'ipotesi da verificare è che il probiotico favorisca l'accrescimento degli animali. Allo scopo di verificare l'ipotesi, hai disegnato uno studio sperimentale preliminare su due piccoli gruppi di suini. I gruppi sono fra loro omogenei (stessa razza, età, provenienza ecc.) e sono mantenuti nelle stesse condizioni di allevamento (alimentazione, temperatura ambiente ecc.). L'unica differenza è che alla razione del Gruppo 1 (10 suini) viene aggiunto il probiotico, mentre al gruppo 2 (11 suini) no. All'inizio dell'esperimento ciascun suino viene pesato; dopo 21 giorni di trattamento i suini vengono pesati di nuovo e per ogni animale si calcola l'incremento giornaliero medio. I dati (fittizi) sono riportati nella tabella che segue.
82
Confrontando le medie degli accrescimenti, puoi notare che il valore del Gruppo 1 è superiore a quello del Gruppo 2 (643.8 g/giorno contro 637.0 g/giorno). La domanda è: questa differenza è dovuta al probiotico oppure al caso?
L'ipotesi zero dice che la differenza è dovuta al caso... accetti o rifiuti questa ipotesi? Per rispondere, puoi applicare ai tuoi dati il test t. Tieni presente, però, che il test t test va bene soltanto se i dati hanno una distribuzione Normale (se ti serve un rapido ripasso di questo argomento, dai un'occhiata al Cap. 7). La trattazione dei metodi per verificare la Normalità di un set di dati va oltre gli scopi del Quaderno. In linea di massima, si utilizza un software statistico (tutti i pacchetti statistici hanno funzioni adatte a questo scopo). In Excel, si possono utilizzare le formule ASIMMETRIA e CURTOSI. I dati dell'esempio, sottoposti ad analisi, risultano avere una distribuzione normale. Se lo desideri, puoi avviare una breve presentazione animata che illustra l'analisi dei tuoi dati con un software statistico. Infine, per i più interessati, aggiungo che, se i dati non hanno una distribuzione normale, è necessario normalizzarli (con metodi sui quali non mi dilungo) oppure ricorrere ad test diversi dal t di Student (es. il Test Mann-Whitney o il Test di Wilcoxon).
Una volta verificata la Normalità dei tuoi dati, puoi tranquillamente applicare il test t, magari utilizzando questo foglio di calcolo. Se non hai installato Excel sul tuo PC, puoi vedere una immagine di output del programma. Nel foglio di calcolo dovrebbero essere già presenti i dati corretti (in caso contrario, li puoi inserire tu). Come vedi dall'output di Excel, con i tuoi dati ottieni un valore t pari a 2.2796. Che farne, di questo valore? Il procedimento di base è abbastanza simile a quello che hai già appreso nel caso del test Chi-quadrato. In pratica, devi confrontare il valore t che hai ottenuto (2.2796) con quelli presenti nella Tabella dei valori t, per 19 gradi di libertà (gradi di libertà=numero osservazioni-numero gruppi; nel nostro esempio 21-2=19). Il tuo valore è superiore a quello della colonna p=5% (ma inferiore a quello della colonna p=1%). Perciò puoi rifiutare l'ipotesi zero e concludere che la differenza è significativa per p
View more...
Comments