R - Analyse de données (F-R-04)

    

Exploration, description et classification de données multidimensionnelles avec R.


Informations
Public : Toute personne amenée à mettre en œuvre des analyses de données multivariées avec le logiciel R.
Pré-requis : Ce stage s'adresse à toute personne ayant suivi le stage initiation au logiciel R ou atteint par la pratique un niveau équivalent.
Méthode : Alternance d'exposés, de manipulations et d'exercices pratiques.
Durée : 2 jour(s)
Prochaine(s) session(s) :
Lieu Du Au
Paris08/06/2017 09/06/2017
Paris06/11/2017 07/11/2017

Frais d'inscription :
- Inter-entreprises : Prix unitaire par stagiaire(s) inscrit(s)
1 inscrit2 inscrits 3 inscrits et +
1000€ HT900€ HT800€ HT
- Intra-entreprise : Nous consulter
Programme
Introduction à l'analyse des données

  • Présentation des diverses techniques et de leurs finalités.
Analyses factorielles

  • Analyse en composantes principales
    • Préparation des données : étude univariée, matrice de nuages de points, étude des corrélations et des liaisons entre variables, traitement des points extrêmes et des données manquantes, transformation des données et recodification : quand, comment et pourquoi faut-il transformer ou recodifier des données ?
    • Description de la méthode : nature des données étudiées, dans quel cas les utiliser, pour quels résultats ?
    • Présentation de la méthode : notions de distances entre deux unités statistiques, composantes principales, éléments actifs (variables ou unités statistiques) et supplémentaires.
    • Analyse et interprétation des résultats : représentation graphique, plans principaux, paramètres d'aide à l'interprétation.
    • Applications : mise en œuvre dans le logiciel R.
  • Analyse des correspondances multiples
    • Préparation des données : étude univariée, tableaux de contingence, test du khi-carré, élimination des modalités rares.
    • Analyse es correspondances simples
    • Description de la méthode : nature des données étudiées, dans quel cas l'utiliser, pour quels résultats, lien avec l'analyse en composantes principales pour l'analyse non linéaire des données.
    • Présentation de la méthode : notion de distances entre profils, description d'un ensemble de profils, éléments actifs et supplémentaires.
    • Analyse et interprétation des résultats : choix des axes, représentation graphique d'un nuage, représentation simultanée, paramètres d'aide à l'interprétation.
    • Applications : mise en œuvre dans le logiciel R.
Techniques de classification

  • Description générale de la démarche
    • Nature des données utilisées
    • Diverses méthodes (CAH, k-means)
  • Agrégation autour de centres mobiles
    • Principes de la méthode.
    • Formes fortes et groupements stables.
    • Analyse et interprétation, applications.
  • Classification ascendante hiérarchique
    • Principes de la méthode, approche hiérarchique.
    • Différentes stratégies d'agrégation.
    • Création d'un dendrogramme.
    • Définition d'un typologie.
    • Représentation graphique, paramètres d'aide à l'interprétation.
    • Applications : mise en œuvre dans le logiciel R.
  • Liens entre classification et analyse factorielle
    • Classification sur données brutes ou données issues d'une analyse factorielle (dans quels cas utiliser l'une ou l'autre).
    • Complémentarité et enrichissement mutuel.
    • Analyse et interprétation des résultats à partir d'exemples traités.


Pour plus de renseignements, contactez :

- Tél : +33 (0) 1 72 92 05 58