Formation Analyse de Données Quantitatives - Sigma Plus
Analyse de Données Quantitatives (F-add-00)
Apprendre les méthodes statistiques d'analyse de données permettant de caractériser et/ou modéliser la relation entre plusieurs variables quantitatives.
Informations
Public : Toute personne souhaitant faire appel aux méthodes d'analyse de données multidimensionnelles pour le traitement de données quantitatives ou renforcer ses compétences dans ce domaine. Pré-requis : Il est conseillé d'avoir participé au préalable au stage Pratique de la Statistique I ou d'avoir acquis par la pratique un niveau équivalent Méthode : Alternance d'exposés, de manipulations et d'exercices pratiques mis en oeuvre dans StatGraphics et Uniwin (ou tout autre logiciel en intra-entreprise). Conseil : Ce stage est systématiquement accolé à celui sur l'Analyse des Données Qualitatives afin de vous permettre de maîtriser en 5 jours les principales méthodes d'analyse des données multidimensionnelles.
Durée : 3 jour(s)
Prochaine(s) session(s) :
Lieu
Du
Au
Paris
26/03/2012
28/03/2012
Paris
18/06/2012
20/06/2012
Paris
19/11/2012
21/11/2012
Frais d'inscription :
- Inter-entreprises : Prix unitaire par stagiaire(s) inscrit(s)
- Introduction à l'analyse des données quantitatives
Présentation des diverses techniques et de leurs finalités selon le domaine d'application (industriel, commercial, recherche)
- Prétraitement des données
Etude univariée, matrices de nuage de points, étude des corrélations et des liaisons entre variables
Traitement des « outliers » et des données manquantes
Transformation des données et codification : quand, comment et pourquoi faut-il transformer/codifier les données ?
- Exposé de l'analyse générale
Notion élémentaires et principes d'ajustement
Ajustement du nuage des individus dans l'espace des variables
Ajustement du nuage des variables dans l'espace des individus
Relations entre les ajustements dans les deux espaces
Reconstitution des données de départ
- L'analyse en composantes principales (méthodes classique et NIPALS)
Description de la méthode :
Nature des données étudiées
Dans quel cas l'utiliser, pour quels résultats.
Présentation de la méthode :
Notions de distance entre deux unités statistiques
Composantes principales : définition et mode de calcul
Les éléments actifs (variables ou unités statistiques) et éléments supplémentaires
Analyse et interprétation des résultats :
La représentation graphique, les plans principaux
Les paramètres d'aide à l'interprétation
Applications :
Etude de la structure d'un grand tableau de données
Modélisation multivariée d'un processus et sa mise sous contrôle statistique
Etude de l'évolution multidimensionnelle dans le temps d'un phénomène
- Les techniques de classification
Description générale de la démarche
Nature des données utilisées
Les diverses méthodes (CAH, k-means,…)
L'agrégation autour de centres mobiles (k-means)
Principes de la méthodologie
Formes fortes et groupements stables
Analyse et interprétation
Applications
La classification ascendante hiérarchique
Principes de la méthodologie
Approche hiérarchique
Les différentes stratégies d'agrégation
Création d'un dendrogramme et définition d'une typologie
Analyse et interprétation des résultats
La représentation graphique
Les paramètres d'aide à l'interprétation
Liaison classification/ analyse factorielle
Classification sur données brutes ou sur données issues d'une analyse factorielle, dans quels cas utiliser l'un ou l'autre,
Complémentarité et enrichissement mutuel
Analyse et interprétation des résultats
- Applications : initiation aux techniques de modélisation
Modélisation pour gérer la stabilité d’un processus
Recherche des variables latentes par ACP
Identification des éléments ou des groupes d’éléments atypiques
Modélisation statique
Modélisation dynamique et détermination des trajectoires
Règles de gestion pour stabiliser un processus
Modélisation pour gérer la performance d’un processus
Les diverses techniques en fonction de la nature des variables de performance
Construction du modèle
Utilisation, gestion et maintenance d’un modèle de performance
- Autres techniques quantitatives multidimensionnelles (illustrés sur exemples)
AFM : l'Analyse Factorielle Multiple pour l'étude conjointe de plusieurs groupes de variables ou plusieurs tableaux de données
STATIS et STATIS duale : la méthode Structuration de Tableaux A Trois Indices de la Statistique permet l'exploration simultanée de plusieurs tableaux de données
L'analyse de distances et dissimilarités : la méthode permet une « cartographie » des individus en fonction de leurs proximités ou dissimilarités