Support Spss Td
Short Description
DD...
Description
ROYAUME DU MAROC HAUT COMMISSARIAT AU PLAN Institut National de Statistique et d’Economie Appliquée
ELEMENT DE MODULE PRATIQUE SOUS SPSS : TD ET TP DE STATISTIQUE DESCRIPTIVE
INTRODUCTION AU LOGICIEL SPSS TRAVAUX DIRIGES ET PRATIQUES : ENONCES ET SOLUTIONS
NOVEMBRE 2013 p. 1
[PRATIQUE SOUS SPSS (TD ET TP)]
M. BERROUYNE
TABLE DES MATIERES I. INTRODUCTION AU LOGICIEL SPSS ................................................................................................................... 4 1. QU’EST-CE QUE SPSS ? ................................................................................................................................................... 4 2. POURQUOI SPSS ? ........................................................................................................................................................... 4 3. QUE PEUT FAIRE SPSS ? ................................................................................................................................................. 4 4. PRESENTATION DE SPSS ? .............................................................................................................................................. 5 4.1. La feuille de données ............................................................................................................................................... 6 4.2. Le Viewer ................................................................................................................................................................. 8 4.3. La syntaxe ................................................................................................................................................................ 8 5. LES PRINCIPALES FONCTIONS DE SPSS .......................................................................................................................... 9 5.1. Les fonctions de base ............................................................................................................................................... 9 5.2. Les fonctions de tri ................................................................................................................................................ 10 5.3. Les fonctions de transformation de variables ....................................................................................................... 11 5.4. Les fonctions de calcul .......................................................................................................................................... 11 5.5. Les travaux sur fichiers ......................................................................................................................................... 11 5.6. Les tableaux ........................................................................................................................................................... 12 II. SOLUTIONS DES TRAVAUX DIRIGES ............................................................................................................... 13 PARTIE 1. ANALYSE D’UNE POPULATION SELON UN SEUL CARACTERE ................................................... 13 EXERCICE1. ....................................................................................................................................................................... 13 Enoncé : ........................................................................................................................................................................ 13 Réponse : ...................................................................................................................................................................... 13 EXERCICE2. ....................................................................................................................................................................... 13 Enoncé : ........................................................................................................................................................................ 13 Solution : ...................................................................................................................................................................... 13 EXERCICE3. ....................................................................................................................................................................... 14 Enoncé : ........................................................................................................................................................................ 14 Solution : ...................................................................................................................................................................... 14 EXERCICE4. ....................................................................................................................................................................... 14 Enoncé : ........................................................................................................................................................................ 14 Solution : ...................................................................................................................................................................... 14 EXERCICE5. ....................................................................................................................................................................... 14 Enoncé : ........................................................................................................................................................................ 14 Solution : ...................................................................................................................................................................... 14 EXERCICE 6. ...................................................................................................................................................................... 15 Enoncé : ........................................................................................................................................................................ 15 Solution (calcul manuel): ............................................................................................................................................ 15 Solution (calcul en utilisant SPSS) : ........................................................................................................................... 16 EXERCICE 8. ...................................................................................................................................................................... 17 Enoncé : ........................................................................................................................................................................ 17 Solution (calcul manuel) : ........................................................................................................................................... 18 Solution (calcul en utilisant SPSS) : ........................................................................................................................... 18 EXERCICE 9. ...................................................................................................................................................................... 19 Enoncé : ........................................................................................................................................................................ 19 Solution (calcul manuel) : ........................................................................................................................................... 20 Solution (calcul en utilisant SPSS) : ........................................................................................................................... 21 Solution (calcul manuel) : ........................................................................................................................................... 22 Solution (calcul en utilisant SPSS) : ........................................................................................................................... 22 EXERCICE10. ..................................................................................................................................................................... 23 Enoncé : ........................................................................................................................................................................ 23 Solution (calcul manuel) : ........................................................................................................................................... 23 EXERCICE11. ..................................................................................................................................................................... 24 Enoncé : ........................................................................................................................................................................ 24 Solution : ...................................................................................................................................................................... 24 EXERCICE 12. .................................................................................................................................................................... 24 Enoncé : ........................................................................................................................................................................ 24 p. 2
M. BERROUYNE
[PRATIQUE SOUS SPSS (TD ET TP)]
Solution : ...................................................................................................................................................................... 24 EXERCICE 13. .................................................................................................................................................................... 24 Enoncé : ........................................................................................................................................................................ 24 Solution : ...................................................................................................................................................................... 25 EXERCICE 14. .................................................................................................................................................................... 25 Enoncé : ........................................................................................................................................................................ 25 Solution : ...................................................................................................................................................................... 25 EXERCICE 15. .................................................................................................................................................................... 25 Enoncé : ........................................................................................................................................................................ 25 Solution : ...................................................................................................................................................................... 26 EXERCICE 16. .................................................................................................................................................................... 26 Enoncé : ........................................................................................................................................................................ 26 Solution : ...................................................................................................................................................................... 26 EXERCICE 17. .................................................................................................................................................................... 26 Enoncé : ........................................................................................................................................................................ 26 EXERCICE 19. .................................................................................................................................................................... 27 Enoncé : ........................................................................................................................................................................ 27 Solution : ...................................................................................................................................................................... 27 EXERCICE 21. .................................................................................................................................................................... 27 Enoncé : ........................................................................................................................................................................ 27 Solution : ...................................................................................................................................................................... 28 Solution (calcul manuel) : ........................................................................................................................................... 28 Solution (calcul en utilisant SPSS) : ........................................................................................................................... 29 EXERCICE 22. .................................................................................................................................................................... 31 Enoncé : ........................................................................................................................................................................ 31 Solution : ...................................................................................................................................................................... 32
[PRATIQUE SOUS SPSS (TD ET TP)]
M. BERROUYNE
Introduction Le présent document comporte deux chapitres. La première partie donne une introduction générale au logiciel SPSS. La deuxième partie traite les travaux dirigés (calcul manuel) et travaux pratiques (utilisant le logiciel SPSS). L'objectif est de familiariser les étudiants de la première année Ingénieurs d’Etat avec le Logiciel SPSS. Ce document vise à permettre à ces étudiants d’être capable d’utiliser SPSS pour réaliser les travaux pratiques et les travaux dirigés du module « Statistique descriptive » assuré par le Professeur Abdesselam FAZOUANE. I. INTRODUCTION AU LOGICIEL SPSS 1. Qu’est-ce que SPSS ? SPSS est un logiciel spécialement conçu pour les analyses statistiques en sciences sociales. Il signifie Statistical Package for Social Sciences. Il est compatible avec tous les logiciels sous l’environnement Windows, tels que Microsoft Excel (importation et exportation), Microsoft Word (importation et exportation). La figure suivante donne une représentation schématique de ce logiciel.
MENU
Gestion des fichiers
Édition des données
Transformation des données
Analyse des données
Commandes d'opérations
Syntaxe
Boite de dialogue
2. Pourquoi SPSS ? SPSS est un outil statistique permettant des analyses simples comme statistiques descriptives, tests d’hypothèse, tableau de contingence, et des analyses plus sophistiquées comme a Analyses multivariées. Les analyses se font à partir des données saisies et la qualité des analyses statistiques est fonction de la qualité des données saisies. 3. Que peut faire SPSS ? La saisie des données et la gestion des bases de données - Saisie des données : on organise une enquête, on crée un masque de saisie et on entre les données; - Gestion de bases de données : on peut importer/exporter des bases de données sur SPSS, on peut manipuler des fichiers : concaténer, scinder, apparier. SPSS c’est …
p. 4
M. BERROUYNE
[PRATIQUE SOUS SPSS (TD ET TP)]
Le traitement des données Traitement des données manquantes (missing values); Recodage de variables (exemple l’âge en classes d’âge); Tri des données; Filtre des données; Transformation des variables; Travaux sur les fichiers; Les tableaux; Les graphiques, …etc L’analyse des données Ses fonctions diversifiées permettent de développer plusieurs types d’analyses : L’analyse « basique » (Fréquences, Moyennes, Tableaux croisés…) L’analyse économétrique (Régressions linéaires, multiples…) L’analyse de données (Analyse factorielle, …) Et bien d’autres encore… Il permet également de travailler directement sur des variables. Ex : recoder automatiquement une variable chaîne en numérique, calculer une variable qui est la somme des valeurs d’autres variables… Traitement graphique des résultats : histogrammes, courbes, camemberts etc, 4. Présentation de SPSS ? L’interface utilisateur est très conviviale. SPSS possède 3 principales fenêtres :
[PRATIQUE SOUS SPSS (TD ET TP)]
M. BERROUYNE
- l’Editeur des données : Elle s'ouvre automatiquement lorsqu’on lance une session SPSS. On ne peut avoir qu'un seul fichier de données ouvert à la fois. C’est dans cette fenêtre que toutes les opérations de SPSS se font : saisie, gestion, traitement, analyse et représentation des données « tableur pour la saisie et la modification des données » ; - Le Navigateur (Viewer) de SPSS : c’est la fenêtre dans laquelle sont envoyés tous les résultats des analyses faites sur SPSS (texte +graphique). - Fenêtre de syntaxe : c’est la fenêtre dans laquelle sont collées les commandes demandées à SPSS La partie du haut, barre d’outils, propose tous les raccourcis vers les applications les plus fréquentes (celles qui sont disponibles dans chaque menu) Dans la partie inférieure, deux onglets sont présentés : « Affichage des données » et « Affichage des variables ». 4.1. La feuille de données 4.1.1. L’onglet « Affichage des données » C’est l’onglet sur lequel l’utilisateur va travailler essentiellement. En colonnes, on retrouvera les noms des variables, et en lignes, les observations. Le fichier de données relatif à cette feuille portera l’extension «sav».
4.1.2 . L’onglet « Affichage des variables » Dans cet onglet, il s’agit de définir les caractéristiques des variables :
- Nom de variable: C’est tout simplement le nom de la variable tel qu’il est affiché dans l’onglet « Affichage des données » Les règles suivantes s'appliquent pour les noms des variables : - Le nom doit commencer par une lettre. Les autres caractères peuvent être n'importe quelle lettre, n'importe quel chiffre, un point, ou les symboles @, #, _ou $. - Les noms de variable ne peuvent pas se terminer par un point. p. 6
M. BERROUYNE
[PRATIQUE SOUS SPSS (TD ET TP)]
- Les noms de variable se terminant par un blanc souligné sont à éviter (pour éviter des conflits avec les variables créées automatiquement par certaines procédures). - La longueur du nom ne doit pas excéder 64 octets. Soixante-quatre octets correspondent à 64 caractères dans les langues sur un octet (anglais, français, allemand, espagnol, italien, hébreu, russe, grec, arabe et thaï par exemple) et à 32 caractères dans les langues sur deux octets (japonais, chinois et coréen par exemple). - Les espaces et les caractères spéciaux ne peuvent pas être utilisés (par exemple, !, ?, ', et *). - Chaque nom de variable doit être unique ; aucune duplication n'est admise. - Les mots-clés réservés ne peuvent pas être utilisés pour les noms de variables : Les mots-clés réservés sont les suivants : ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH. - Les noms de variables peuvent être définis par n'importe quelle combinaison de majuscules et de minuscules. La casse est respectée pour des raisons d'affichage. - Lorsque des noms longs occupent plusieurs lignes au niveau du résultat, SPSS essaie d'insérer les sauts de ligne au niveau des traits de soulignement, des virgules et des passages de minuscule à majuscule. - Type de variable: C’est la caractéristique de votre variable, en général, on se limite à « Chaîne » lorsqu’il s’agit de données alphanumériques et à « Numérique » lorsque l’on travaille avec des chiffres. D’autres types de variables existent : Virgule, Point, Notation scientifique, Date, Dollar, Notation scientifique. L'option Type de variable permet de définir le type de données pour chaque variable. Par défaut, toute nouvelle variable est numérique. Vous pouvez utiliser l'option Type de variable pour changer le type des données. Le contenu de la boîte de dialogue Type de variable dépend du type de données sélectionné. Pour certains types de données, il y a des zones de texte où sont indiqués la longueur et le nombre de décimales. Les types de données disponibles sont les suivants : Numérique : Variable dont les valeurs sont des nombres. Les valeurs sont affichées en format numérique standard. L'éditeur de données accepte les valeurs numériques au format standard ou sous forme de notation scientifique. Virgule : Variable numérique dont les valeurs sont affichées avec des virgules toutes les trois positions, le point servant de séparateur décimal. L'éditeur de données accepte les valeurs numériques pour les variables de virgule avec ou sans virgule ou sous forme de notation scientifique. Point : Variable numérique dont les valeurs sont affichées avec des points toutes les trois positions, la virgule servant de séparateur décimal. L'éditeur de données accepte les valeurs numériques pour les variables de point avec ou sans point ou sous forme de notation scientifique. Notation scientifique : Variable numérique dont les valeurs sont affichées avec un E intégré et un exposant de puissance dix avec signe. L'éditeur de données accepte des valeurs numériques pour les variables de notation scientifique avec ou sans exposant. L'exposant peut être précédé d'un E ou d'un D avec ou sans signe, ou seulement d'un signe. Par exemple, 123, 1.23E2, 1.23D2, 1.23E+2 et même 1.23+2. Date : Variable numérique dont les valeurs sont affichées dans l'un des formats de date ou d'heure possibles. Sélectionnez un format dans la liste. Vous pouvez entrer des dates avec, comme séparateur, des barres obliques, des traits d'union, des points, des virgules ou des espaces. La valeur du siècle pour les années à 2 chiffres est déterminée par les paramètres Options (accessibles depuis le menu Edition, Options, onglet Données). Symbole monétaire : Variable numérique dont les valeurs sont affichées dans l'un des formats monétaires personnalisés que vous avez définis dans l'onglet Devise de la boîte de dialogue Options.
[PRATIQUE SOUS SPSS (TD ET TP)]
M. BERROUYNE
Les caractères de symbole monétaire définis ne sont pas utilisables lors de la saisie de données mais sont affichés dans l'éditeur de données. Chaîne : Variable dont les valeurs ne sont pas numériques et ne sont donc pas utilisées pour les calculs. Ces variables peuvent contenir n'importe quel caractère, dans la limite de la longueur définie. Les majuscules et les minuscules sont différenciées. Egalement appelées variables alphanumériques. - Largeur : correspond à la largeur de votre variable (par défaut fixé à 8) - Décimales : nombre de décimales désirées pour les données numériques - Etiquette : c’est le nom de la variable telle que vous voulez qu’il apparaisse dans le tableau de résultats (ex : pour la variable « Sit », vous voulez afficher Situation) - Valeur : cette fonction donne la possibilité de labelliser des modalités (ex : pour la variable sexe, il va être affiché 1 ou 0, il suffit de définir que 1correspond à Homme et 0 à Femme) - Manquant : il s’agit ici de définir les valeurs que vous ne souhaitez pas intégrer dans vos calculs. Ex : une variable de satisfaction notée de 1 à 4, la modalité 5 correspondant aux « sans opinion », vous ne voulez pas retenir les sans opinion dans vos calculs alors entrez le chiffre 5 dans cette caractéristique «Manquant» - Colonnes : définie la largeur de la colonne (peu utilisé) - Aligner : correspond à l’alignement de vos données (peu utilisé) - Mesure : correspond à l’unité de mesure que vous voulez retenir. Vous pouvez sélectionner l'un des trois niveaux de mesure suivants : Echelle : Les valeurs de données sont des valeurs numériques sur une échelle d'intervalles ou une échelle de rapport (par exemple, âge ou revenu). Les variables d'échelle doivent être numériques. Ordinal : Les valeurs de données représentent les modalités dans un ordre intrinsèque (par exemple, faible, moyen, élevé ; tout à fait d'accord, plutôt d'accord, plutôt pas d'accord, pas du tout d'accord). Les variables ordinales peuvent être des valeurs chaîne (alphanumériques) ou des valeurs numériques représentant des modalités distinctes (par exemple, 1 = faible, 2 = moyen, 3 = élevé). Remarque: Pour les variables chaîne ordinales, l'ordre alphabétique des valeurs chaîne est supposé refléter l'ordre des modalités. Par exemple, pour une variable chaîne comportant des valeurs Faible, Moyen, Elevé, l'ordre des modalités est interprété comme Elevé, Faible ou Moyen, ce qui ne correspond pas à l'ordre correct. En règle générale, il est recommandé d'utiliser les codes numériques pour représenter les données ordinales. Nominal : Les valeurs de données représentent les modalités sans ordre intrinsèque (par exemple, modalité d'emploi ou service d'entreprise). Les variables nominales peuvent être des valeurs chaîne (alphanumériques) ou des valeurs numériques représentant des modalités distinctes (par exemple, 1 = Masculin, 2 = Féminin). 4.2. Le Viewer Le Viewer correspond, comme son nom l’indique, à la page d’affichage des résultats de votre calcul. Exemple : Cliquez sur Analyse, Statistiques descriptives, Fréquences, puis sélectionnez la variable Situation puis OK. Votre résultat s’affiche dans le Viewer (qui apparaît automatiquement). A partir de ce Viewer, vous pouvez utiliser les mêmes fonctions que dans la feuille de données. Vous pourrez imprimer les résultats affichés par la suite. Le fichier relatif à ce Viewer portera l’extension « spv». 4.3. La syntaxe La syntaxe est une page sur laquelle vous pouvez inscrire des opérations à faire sur la feuille de données. Cela est très utile lorsque vous devez faire les mêmes calculs sur plusieurs feuilles de données. Ex : refaites la même manipulation que précédemment avec la fonction fréquence mais ne cliquez pas sur OK, cliquez sur Coller. Le programme va s’afficher sur la feuille de syntaxe. Il vous suffit ensuite d’enregistrer cette feuille, vous pourrez la faire réapparaître quand vous le désirerez (à p. 8
M. BERROUYNE
[PRATIQUE SOUS SPSS (TD ET TP)]
partir de la feuille de données, Fichier, Ouvrir, Syntaxe.) Le fichier relatif à cette fenêtre portera l’extension «sps».
5. Les principales fonctions de SPSS 5.1. Les fonctions de base Les 4 fonctions d’analyse de base sont les suivantes : Fréquence (Analyse – Statistiques descriptives – Effectifs) Caractéristiques (Analyse – Statistiques descriptives – Descriptives) Tableaux croisés (Analyse – Statistiques descriptives – Tableaux croisés) a- Fréquence Cette fonction permet, comme son nom l’indique, d’établir des tableaux de fréquence comme celui-ci : Sexe de l'individu Effectifs Valide
Pourcentage
Pourcentage valide
Pourcentage cumulé
Homme
3
8.6
8.6
8.6
Femme
32
91.4
91.4
100.0
Total
35
100.0
100.0
La première colonne du tableau donne les effectifs en valeur absolue, ensuite les différents pourcentages. (Pourcentage valide va donner les valeurs si l’on ne compte pas les valeurs manquantes). b- Caractéristiques Grâce à cette fonction, nous allons pouvoir obtenir les caractéristiques de tendance centrale (moyennes, médianes, modes), les fractiles (quartiles et centiles), les caractéristiques de dispersion (variance, écart-type, maximums, minimums), les caractéristiques d’une distribution (Skweness et Kurtosis). Exemple : pour une variable âge : Statistiques descriptives N
Minimum
Age de l'enquêté
35
N valide (listwise)
35
Maximum 0
40
Moyenne 20.29
Ecart type 12.954
En cliquant sur le bouton option de la boîte de dialogue « Caractéristiques », on pourra définir les éléments que l’on veut afficher.
[PRATIQUE SOUS SPSS (TD ET TP)]
M. BERROUYNE
En cliquant sur le bouton option de la boîte de dialogue « Diagrammes », on pourra définir les types de diagrammes que l’on veut afficher (histogrammes, digrammes en bâtons, diagrammes en secteurs). c- Tableaux croisés Les tableaux croisés permettent d’avoir une vision sur les croisements de variables diverses. Exemple, l’état matrimonial en fonction du sexe : Tableau croisé Sexe de l'individu * Etat matrimonial de l'enquêté Effectif Etat matrimonial de l'enquêté Célibataire Sexe de l'individu
Total
Marié(e)
Veuf(ve)/Divorcé(e)
Total
Homme
1
2
0
0
3
Femme
0
13
15
4
32
1
15
15
4
35
Seul inconvénient, cela nous donne des chiffres bruts et non des pourcentages. En travaillant sur la boîte de dialogue de cette fonction, on peut faire apparaître des diagrammes en bâtons d’une qualité exceptionnelle.
5.2. Les fonctions de tri a- Le tri (données –trier les observations) La fonction tri est identique à toutes les fonctions tri que l’on peut trouver sur des logiciels comme Excel, à savoir qu’il suffit de définir l’ordre (croissant ou décroissant) et de sélectionner la (ou les ) variable (s). N.B. Vous pouvez aussi trier les variables dans l'ensemble de données actif selon les valeurs d'un des attributs de variables (par exemple nom de variable, type de données, niveau de mesure), y compris les attributs de variables personnalisés. b- le filtre (données – sélectionner des observations) Cette fonction permet de travailler sur une sous-base. L’utilisation de cette fonction génère une nouvelle variable « filter_$ » binaire (1 si l’observation est considérée -selected-, 0 si elle est exclue – not selected-). p. 10
M. BERROUYNE
[PRATIQUE SOUS SPSS (TD ET TP)]
Lors de l’affichage de la boîte de dialogue du filtre, il suffit de donner une condition. Exemple, on désire travailler uniquement avec le sexe masculin, alors il faut définir la condition sexe=1. Attention, tant que le filtre n’est pas désactivé, tous les calculs se feront sur la sous-base. NB : en bas et à droite de la fenêtre SPSS, vous pouvez voir la mention « Filtre actif » lorsque celui-ci est activé. Vous pouvez réaliser un filtre temporaire, c’est-à-dire que vous filtrez uniquement (en conservant les autres données) ou alors, vous pouvez supprimer les observations qui ne remplissent pas la condition du filtre. Pour cela, il suffit de cocher « supprimées » ou « filtrées » dans la boîte de dialogue. 5.3. Les fonctions de transformation de variables a- recoder des variables (Transformer – recoder - …) SPSS permet de transformer des variables. La plus utilisée de ces fonctions de transformation est le recodage de variable. Pour cela, deux possibilités : recoder la variable directement ou recoder sur une nouvelle variable. - Recodage de variables (Transformer – recodage de variables) Il s’agit ici de recoder à l’intérieur d’une variable. Par exemple, prenons la variable « v1 » qui vaut 1 ou 2. On désire recoder les 2 en 0. Il suffit de définir cela dans la boîte de dialogue. On insère tout d’abord la variable concernée (on peut éventuellement indiquer une condition pour le recodage). Note : veillez à bien cliquer sur « ajouter » pour valider le recodage que vous désirez faire. On peut recoder automatiquement les valeurs manquantes (sysmis), on peut également recoder toutes les valeurs (else). - Création de variables (Transformer – création de variables) Cette fonction est très utile lorsque l’on veut travailler sur une modélisation (en créant des variables binaires 0/1). Exemple : prenons la variable «v1» qui vaut 1 ou 2, nous voulons créer 2 variables « v11 » qui vaut 1 ou 0 (selon que « v1 » vaut 1 ou pas ») puis « v12 » qui vaut également 0 ou 1 (selon que « v1 » vaut 2 ou pas). b- recoder automatiquement (Transformer – recoder automatiquement) La deuxième fonction de transformation souvent utilisée est celle du recodage automatique, elle permet notamment de recoder automatiquement une variable chaîne en variable numérique. Exemple : prenons la variable « état matrimonial » et créons la variable « r_etatmat ». Note : la variable « r_etatmat » créée est automatiquement labellisée (1 célibataire ; 2 marié ; 3 veuf/divorcé). 5.4. Les fonctions de calcul a- Compter (Transformer – Compter les occurrences des valeurs par observation) Cette fonction permet, comme son nom l’indique, de compter des valeurs. Il suffit de définir une valeur (ex : 1) puis on donne les variables que l’on veut considérer. La variable créée sera le « comptage » des valeurs 1 pour chacune des variable. b- Calculer (Transformer –Calculer la variable) Il s’agit ici de la fonction qui est comparable aux fonctions d’Excel. Après avoir défini la variable de destination, il s’agit d’intégrer les variables sur lesquelles on veut travailler et on définit la fonction désirée. 5.5. Les travaux sur fichiers SPSS permet d’alimenter le fichier de données externes : ajouter des variables, des observations. a- Ajouter des observations (Données – Fusionner des fichiers – Ajouter des observations) Il s’agit ici d’ajouter des observations lorsque votre travail a été effectué en 2 fois, par exemple.
[PRATIQUE SOUS SPSS (TD ET TP)]
M. BERROUYNE
Le lancement de cette fonction viendra coller les nouvelles observations en dessous des observations actuelles. Note : Une boîte de dialogue intermédiaire fait le point sur les variables communes ou non (attention, 2 variables peuvent avoir le même nom mais ne pas être les mêmes à cause de leurs propriétés, ex. : la longueur). Vous pourrez, si les variables n’ont pas le même nom les intégrer dans le nouveau fichier (les valeurs non renseignées seront automatiquement saisies en valeurs manquantes). b- Ajouter des variables (Données – Fusionner des fichiers - Ajouter des variables) Même principe de fonctionnement que l’ajout d’observations. Attention cependant, dans ce cas, il faut impérativement qu’il y ait une clef de tri (un peu comme dans Access) commune dans le fichier actuel et le fichier que l’on veut importer. Cette clef doit être triée de la même façon dans les 2 fichiers pour le bon fonctionnement de la procédure. 5.6. Les tableaux Les tableaux de résultats de SPSS, qui apparaissent régulièrement dans le viewer, peuvent être retouchés de manières diverses, et cela peut s’avérer intéressant lorsque l’on veut les imprimer pour présentation. On pourra double-cliquer sur ceux-ci et éventuellement transposer les lignes et colonnes (Tableaux pivotants – Transposer lignes et colonnes) ou même travailler sur la mise en forme (Format –Propriétés du tableau/Modèles de tableaux). La fonction « Tabuler » dans la feuille de données (Analyse –Tableaux – Tabuler) permet quant à elle d’établir des tableaux personnalisés avec des variables en colonnes et en lignes. Exemple, on désire un tableau avec en colonnes l’état matrimonial et en lignes le sexe, il nous faut la répartition des ces variables. Il suffit pour cela de cliquer sur Analyse –Tableaux - Tabuler, de mettre « etat_matrimonial » dans la zone colonnes (en la glissant avec la souris) et mettre la variable « sexe » dans la zone lignes (en la glissant avec la souris). En travaillant sur les propriétés du tableau et les modèles, vous pourrez obtenir un tableau dans ce style… etatmat Célibataire Effectif Sexe de l'individu
marié
N % colonne
Effectif
veuf/divorcé
N % colonne
Effectif
N % colonne
Homme
1
8.33%
1
7.69%
1
10.00%
Femme
11
91.67%
12
92.31%
9
90.00%
Total
12
100.00%
13
100.00%
10
100.00%
p. 12
M. BERROUYNE
[PRATIQUE SOUS SPSS (TD ET TP)]
II. SOLUTIONS DES TRAVAUX DIRIGES PARTIE 1. ANALYSE D’UNE POPULATION SELON UN SEUL CARACTERE Exercice1. Enoncé : Pour chacun des sujets qui suivent, spécifier l’unité statistique (individu), identifier le caractère à étudier et son type. - l’absentéisme des ouvriers (en jours) - temps de fonctionnement d’une machine à moudre (en seconde). - Classification des ouvrages dans une bibliothèque. Réponse : Unité statistique
Sujets L’absentéisme des ouvriers (en jours) Temps de fonctionnement d’une machine (en seconde) Classification des ouvrages dans une bibliothèque
L’ouvrier Machine moudre Ouvrage
Caractère à étudier
Type C. quantitatif discret
Nombre de jours d’absence à
Temps seconde
de
fonctionnement
en
C. quantitatif discret C. qualitatif nominal
Classification des ouvrages
Exercice2. Enoncé : Pour chacun des caractères suivants, préciser son type et donner des exemples de modalités. Revenu mensuel Lieu de naissance Nationalité Age
Sexe Pointure de chaussures Couleur des yeux
Etat Matrimonial Tour de taille Nombre de langues parlées
Solution : Caractère
Type
Exemple de modalités
Revenu mensuel
C. quantitatif continu
[4000-6000 [
Sexe
C. qualitatif nominal
Masculin, Féminin
Etat Matrimonial
C. qualitatif nominal
Lieu de naissance
C. qualitatif nominal
Célibataire, Mariée, Divorcé(e)/Veuf(e) Casablanca
Pointure de chaussures
C. quantitatif continu
[30-35 [
Tour de taille
C. quantitatif continu
[38-42 [
Nationalité
C. qualitatif nominal
Marocaine
Couleur des yeux
C. qualitatif nominal
bleu
Nombre de langues parlées
C. quantitatif discret
2
Age
C. quantitatif continu
[30-34[
[PRATIQUE SOUS SPSS (TD ET TP)]
M. BERROUYNE
Exercice3. Enoncé : Lister pour les caractères suivants l’ensemble des modalités prévisibles : - niveau d’instruction - Etat matrimonial - Type de logement - Mode d’occupation du logement - Mode d’acquisition du logement - Appréciation de la qualité des matériaux de construction - Satisfaction quant au comportement des voisins au quartier Solution : Caractère
Modalités prévisibles
Niveau d’instruction
Néant/sans niveau, primaire, collège, secondaire, supérieur
Etat matrimonial
Célibataire, Mariée, Divorcé(e)/Veuf(e)
Type de logement
Villa, appartement, bidonville, maison marocaine traditionnelle, maison marocaine moderne, autre
Mode d’occupation du logement
Propriétaire, locataire, copropriétaire, colocataire, autre
Mode d’acquisition du logement
Comptant, à crédit, héritage, autre
Appréciation de la qualité des matériaux de construction
Très bon, bon, moyenne, médiocre, faible
Exercice4. Enoncé : On vous demande de proposer trois questions à poser aux jeunes âgés entre 15 et 29 ans lors d’une enquête concernant leur participation civique. Essayez d’opérer votre choix pour que chaque question soit associé à un type différent caractère « qualitatif, quantitatif discret, quantitatif continu » (questions, caractères et modalités envisageable). Solution : Population à étudier : Jeunes âgés de 15 à 29 ans ; Enquête sur la participation civique des jeunes âgés de 15 à 29 ans. Question 1. Etes-vous adhérant à une association ? 1 Oui 2 Non Question 2. Si oui, le nombre d’association Question 3. Si oui, type d’association : 1. Politique 2. Culturelle 3. Sportive 4. Autre Exercice5. Enoncé : Apportez une analyse critique aux deux tableaux qui suivent en termes d’insuffisance et de pertinence. Solution : a) Type de logement Propriétaire Locataire Logement administratif Autres Total
Fréquences relatives 70 20 0 10 100 p. 14
M. BERROUYNE
[PRATIQUE SOUS SPSS (TD ET TP)]
En termes d’insuffisance : - Absence de titre du tableau ; - Absence de source des données. En termes de pertinence : - La modalité « autres » détient une fréquence relative significative (à éviter ce cas) ; - La modalité « logement administratif » a une fréquence relative nulle ( à supprimer ou à classer dans la modalité « autres »). b) Répartition des ménages de la municipalité de Sandra Kim selon le type de logement Statut d’occupation Villa ou étage de villa Appartement Maison marocaine moderne Maison marocaine traditionnelle Maison en pisé Baraque Autres Total
Fréquences relatives 5,0 23,0 54,5 5,0 3,0 8,0 15,0 100
En termes d’insuffisance : - Absence de source des données ; - Le total des FR dépasse 100% (113,5%) ; - L’unité des fréquences relatives n’est pas indiquée. En termes de pertinence : - La modalité « autres » détient une fréquence relative très significative -15%- (c’est mieux d’éclater cette modalité). En principe on peut éviter ce genre de résultat si on a réalisé une enquête pilote pour tester les questions et les réponses ; - On pourra regrouper les modalités « maison en pisé » et « baraque » dans la modalité « Bidonville », puisque leurs fréquences ne dépassent pas 11%. Exercice 6. Enoncé : Nous avons relevé les durées d’ancienneté des enseignants du primaire dans une localité comprenant 32 enseignants. Essayez de grouper ces données dans des intervalles et présentez le tableau synthétique des résultats 2 28 6
7 2 6
19 1 5
7 1 11
28 2 30
29 12 13
3 29 23
13 5 20
12 21 21
20 5 22
Solution (calcul manuel): Caractère à étudier : durée d’ancienneté des enseignants du primaire. Unité statistique : Enseignant (n = 34) a) On range par ordre croissant les valeurs du caractère à étudier ; b) On détermine le nombre de classes ou d’intervalles comme suit : k = 1+3,22 log(n) =1+3,22log(34)=6 ; c) On détermine l’amplitude des classes : ai=(Max(xi)-Min(xi))/k=5 ; i=1, 2, …6.
12
2
5
28
[PRATIQUE SOUS SPSS (TD ET TP)] Intervalles des durées d’ancienneté 1-6 ans 6-11 ans 11-16 ans 16-21 ans 21-26 ans 26-31 ans Total
M. BERROUYNE
Fréquences 11 4 6 3 4 6 34
Fréquences relatives (en %) 32,4 11,8 17,6 8,8 11,8 17,6 100,0
Solution (calcul en utilisant SPSS) : a) Après avoir chargé le logiciel SPSS dans la mémoire centrale de la machine, on saisi les données dans l’éditeur de données ; b) On utilise deux méthodes différentes pour la création des intervalles : en utilisant le recodage d’une variable (commande RECODE obtenu en sélectionnant dans le menu principal l’option « TRANSFORMER » suivi de la sous option « CREATION DE VARIABLES ». Le programme relatif à cet exercice est comme suit : **** anciennete = ancienne variable ; anciennete_G =nouvelle variable ************ RECODE ancienneté (Lowest thru 5=1) (6 thru 10=2) (11 thru 15=3) (16 thru 20=4) (21 thru 25=5) (26 thru 30 =6) INTO anciennete_G. VARIABLE LABELS anciennete_G "Classes des durées d'ancienneté". EXECUTE.
Pour Etiqueter les valeurs de cette nouvelle variable (anciennete_G), il faut utiliser la commande VALUE LABELS. Le programme suivant donne la procédure à suivre pour obtenir ces nouvelles modalités. VALUE LABELS anciennete_G 1 "1-6 ans" 2 "6-11 ans" 3 "11-16 ans" 4 "16-21 ans" 5 "21-26 ans" 6 "26-31 ans". EXECUTE.
en calculant une expression numérique (commande calculer la variable obtenu en sélectionnant dans le menu principal l’option « TRANSFORMER » suivi de la sous option « Calculer la variable ». Le programme relatif à cet exercice est comme suit : **** anciennete = ancienne variable ; classes_anciennete =nouvelle variable ************ IF (anciennete >= 1 & anciennete < 6) classes_anciennete=1. EXECUTE. IF (anciennete >= 6 & anciennete < 11) classes_anciennete=2. EXECUTE. IF (anciennete >= 11 & anciennete < 16) classes_anciennete=3. EXECUTE. IF (anciennete >= 16 & anciennete < 21) classes_anciennete=4. EXECUTE. IF (anciennete >= 21 & anciennete < 26) classes_anciennete=5. EXECUTE. IF (anciennete >= 26 & anciennete < 31) classes_anciennete=6. EXECUTE.
Pour Etiqueter les valeurs de cette nouvelle variable (anciennete_G), il faut utiliser la commande VALUE LABELS. Le programme suivant donne la procédure à suivre pour obtenir ces nouvelles modalités. VALUE LABELS anciennete_G 1 "1-6 ans" 2 "6-11 ans" 3 "11-16 ans" 4 "16-21 ans" 5 "21-26 ans" 6 "26-31 ans". EXECUTE. p. 16
M. BERROUYNE
[PRATIQUE SOUS SPSS (TD ET TP)]
L’exécution de ces programmes donne le résultat suivant : Classes d’âge
Effectifs
Pourcentage
Pourcentage valide
Pourcentage cumulé
1-6 ans
11
32,4
32,4
32,4
6-11 ans
4
11,8
11,8
44,1
11-16 ans
6
17,6
17,6
61,8
16-21 ans
3
8,8
8,8
70,6
21-26 ans
4
11,8
11,8
82,4
26-31 ans
6
17,6
17,6
100,0
34
100,0
100,0
Total
Exercice 8. Enoncé : Représentation graphique les distributions qui suivent : a) Répartition des étudiants de la 1ère année de l’INSEA (2006-2007) selon leur premier loisir Type de loisir Effectifs Lecture 13 Théâtre 33 Sport 70 Cinéma 40 Musique 12 Internet 41 Aucun 23 Total 232 c) Répartition des étudiants de la 1ère année de l’INSEA (2006-2007) selon les groupes d’âges les groupes d’âges ]19-20] ]20-21] ]21-23] Total
c)
Effectifs 50 110 72 232
Répartition des étudiants de la 1ère année de l’INSEA (2006-2007) selon la taille de leurs fratries Taille de la fratrie 0 1 2 3 4et + Total
Effectifs 30 110 40 35 17 232
[PRATIQUE SOUS SPSS (TD ET TP)]
d)
M. BERROUYNE
Répartition des étudiants de la 1ère année de l’INSEA (2006-2007) selon leur groupe sanguin Groupes d ‘ages A B AB O Total
Effectifs 88 51 21 72 232
a) Type de loisir Effectifs Lecture Théâtre Sport Cinéma Musique Internet Aucun Total
13 33 70 40 12 41 23 232
Fréquences relatives (en %)
6 14 30 17 5 18 10 100
Solution (calcul manuel) : Type de caractère : Caractère qualitatif nominal Type de graphique : Circulaire par exemple Calculer la proportion de chaque secteur (pourcentage de la modalité). Exemple pour la modalité lecture, on a plecture = 13/232*100 (voit tableau ci-dessus).
Solution (calcul en utilisant SPSS) : Pour construire ce graphique dans SPSS, vous devez suivre les étapes suivantes : 1. Pondérer les observations puisqu’il s’agit de données groupées (non individuelles) ; 2. Donne des codes pour les valeurs de la variable à étudier, parce que SPSS exige que la variable qui donnera les libellés des secteurs doive être de type échelle (QD ou QC) ; 3. Etiqueter ces codes ; 4. Utiliser soit la procédure GRAPH en sélectionnant du menu principal l’option « GRAPHES » suivi de la sous option « BOITES DE DIALOGUE ANCIENNE VERSION », ou bien utiliser l’option diagrammes de la commande FREQUENCIES. p. 18
M. BERROUYNE
[PRATIQUE SOUS SPSS (TD ET TP)]
L’exécution des programmes suivants, que vous devez générer avec SPSS, donne le résultat de cet exercice : ******** Codes de la variable « Type de loisir » ************* VALUE LABELS TypeLoisir 1 "Lecture" 2 "Théâtre" 3 "Sport" 4 "Cinéma" 5 "Musique" 6 "Internet" 7 "Aucun". EXECUTE. ******** Pondérer les observations par la variable ni (fréquences des modalités) ************* WEIGHT BY ni. ******** Construction du graphique ************* GRAPH /PIE=VALUE(TypeLoisir) BY Effectifs. Ou bien ******** Construction du graphique ************* FREQUENCIES VARIABLES=TypeLoisir /PIECHART FREQ /ORDER=ANALYSIS.
Exercice 9. Enoncé : Nous avons tiré les données suivantes du rapport de l’Enquête santé menée en Sergarie en 2004. Ces données représentent les deux distributions des femmes selon les groupes d’âges. Il s’agit des femmes utilisant la pilule comme moyen contraceptif d’une part et de celles utilisant le stérilet d’autre part. Répartition des femmes utilisant la pilule et des femmes utilisant le stérilet selon les groupes d’âges. Classe d’âges 15à
View more...
Comments