Décrire la structure ou modéliser des relations de causes à effets de tableaux « observations x variables » en particulier lorsque le nombre de variables est très important, éventuellement plus important que le nombre d'observations, ou que le tableau comporte de nombreuses valeurs manquantes.
Informations
Public : Toute personne souhaitant décrire la structure ou modéliser des relations de causes à effets de tableaux « observations x variables » en particulier lorsque le nombre de variables est très important ou que le tableau comporte de nombreuses valeurs manquantes. Conseil : Le stage Simca est accolé aux sessions Méthodes PLS pour une maîtrise totale de cet outil. Pré-requis : Il est conseillé d'avoir participé au préalable aux stages
Pratique de la Statistique I,
Pratique de la Statistique II et
Analyse de Données Quantitatives
Multidimensionnelles ou d'avoir acquis par la pratique un niveau équivalent. Méthode : Alternance d'exposés, de manipulations et d'exercices pratiques mis en oeuvre dans le logiciel Simca-P+. Offert : Le livre La régression PLS de Michel Tenenhaus
Durée : 2 jour(s)
Prochaine(s) session(s) :
Lieu
Du
Au
Paris
29/05/2012
30/05/2012
Paris
20/11/2012
21/11/2012
Frais d'inscription :
- Inter-entreprises : Prix unitaire par stagiaire(s) inscrit(s)
- N.I.P.A.L.S. (Non Linear Iterative Partial Least Square) - Méthode "descriptive"
Analyse en Composantes Principales (A.C.P.) basée sur un mode de calcul qui permet d'utiliser toutes les données disponibles dans un tableau « observations x variables » présentant des valeurs manquantes, et non pas seulement les « cas complets » comme les méthodes « classiques ».
Le nombre de composantes significatives à retenir est déterminé par validation croisée.
Les observations atypiques sont repérées grâce à des tests et une carte de contrôle.
- Régression PLS1 - Méthode "prédictive"
Méthode robuste de modélisation d'un tableau comportant une variable « à prédire » Y en fonction d'un tableau de variables « prédictives » X basée sur un algorithme dérivé de N.I.P.A.L.S. qui consiste à :
rechercher des composantes orthogonales (structures « latentes ») de X, à la fois les plus « descriptives »`possible de X et les plus « explicatives » possible de Y
effectuer la régression de Y sur ces composantes
exprimer les coefficients de la régression en fonction des variables « prédictives » elles mêmes.
Choix des composantes significatives par validation croisée
Gestion des valeurs manquantes.
- Méthodes de filtrage des données : OSC, OPLS
- Régression PLS2 - Méthode "prédictive"
Méthode robuste de modélisation d'un tableau comportant plusieurs variables « à prédire » Y en fonction d'un tableau de variables « prédictives » X basée sur un algorithme dérivé de N.I.P.A.L.S.
- Analyse Discriminante P.L.S. - Méthode "prédictive"
Extension de la Régression P.L.S. au cas où le tableau des variables « à prédire » Y est constitué des indicatrices binaires des modalités d'une variable qualitative.
- Méthode S.I.M.C.A.(Soft Independant Modelling by Class Analogy) - Méthode "prédictive"
Cette alternative originale à l'Analyse Discriminante permet, après avoir caractérisé des classes prédéfinies d'observations en fonction d'un ensemble de variables « descriptives », de « prévoir » la probabilité d'appartenance à chaque classe de nouvelles observations « décrites » par le même ensemble de variables.
La phase de caractérisation consiste à réaliser une A.C.P. de chaque classe en utilisant l'algorithme N.I.P.A.L.S.
La phase « prédictive » consiste à calculer la distance entre chaque observation nouvelle et le modèle d'A.C.P. de chaque classe, et d'estimer la probabilité correspondante. Cette méthode permet de repérer des observations qui n'appartiennent à aucune des classes prédéfinies.