Méthodes PLS avec Simca (F-pls-00)

    

Maîtriser les possibilités du logiciel Simca dans la gestion, la manipulation et la pratique des méthodes statistiques multivariées. Simca permet de mettre en œuvre des analyses en composantes principales (ACP), des régressions PLS et OPLS, des analyses discriminantes PLS.


Public - Pré-requis - Méthode
Public : Toute personne souhaitant réaliser des analyses multivariées avec le logiciel Simca, décrire la structure ou modéliser des relations de causes à effets de tableaux « observations x variables » en particulier lorsque le nombre de variables est très important ou que le tableau comporte de nombreuses valeurs manquantes
Pré-requis : Il est conseillé d'avoir participé au préalable aux stages Pratique de la Statistique I, Pratique de la Statistique II et Analyse de Données ou d'avoir acquis par la pratique un niveau équivalent
Méthode : Alternance d'exposés, de manipulations et d'exercices pratiques mis en oeuvre dans le logiciel Simca.
Durée : 3 jour(s)
Prochaine(s) session(s) :
Lieu Du Au
Paris05/02/2018 07/02/2018
Paris13/06/2018 15/06/2018
Paris26/11/2018 28/11/2018

Frais d'inscription :
- Inter-entreprises : Prix unitaire par stagiaire(s) inscrit(s)
1 inscrit2 inscrits 3 inscrits et +
1500€ HT1350€ HT1200€ HT
- Intra-entreprise : Nous consulter
Programme
Présentation du logiciel SIMCA 14

Les rubans disponibles selon l’étape d’avancement du projet : SIMCA Import, Project Window, Model Window

Les étapes du déroulement d’une étude avec SIMCA

  • Démarrage du projet :
    • importation des données
    • mise en forme des données
    • gestion des valeurs manquantes
  • Visualisation, étude préliminaire des données
  • Détection des valeurs aberrantes
  • Choix des données à utiliser dans l’analyse
    • Définition d’un ‘Workset’, transformations des données
    • Filtres disponibles dans SIMCA
    • Construction de graphiques dans SIMCA
  • Ajustement d'un modèle
    • Analyse des données et interprétation des résultats : les indicateurs de la qualité du modèle disponibles dans SIMCA
    • Visualisation des scores et loadings
  • Utilisation des modèles établis pour de la prévision
NIPALS (Non Linear Iterative Partial Least Square)

Analyse en composantes principales (ACP) basée sur un mode de calcul qui permet d'utiliser toutes les données disponibles dans un tableau « observations x variables » présentant des valeurs manquantes, et non pas seulement les « cas complets » comme les méthodes « classiques ». Le nombre de composantes significatives à retenir est déterminé par validation croisée. Les observations atypiques sont repérées grâce à des tests et une carte de contrôle.

Régression PLS1

Méthode robuste de modélisation d'un tableau comportant une variable « à prédire » Y en fonction d'un tableau de variables « prédictives » X basée sur un algorithme dérivé de NIPALS qui consiste à :

  • rechercher des composantes orthogonales (structures « latentes ») de X, à la fois les plus « descriptives »`possible de X et les plus « explicatives » possible de Y
  • effectuer la régression de Y sur ces composantes
  • exprimer les coefficients de la régression en fonction des variables « prédictives » elles mêmes.
  • choisir le nombre de composantes significatives par validation croisée.
  • gérer les valeurs manquantes.
Méthodes de filtrage des données

  • OSC (Orthogonal Signal Correction)
  • OPLS, O2PLS (Orthogonal PLS)
Régression PLS2

Méthode robuste de modélisation d'un tableau comportant plusieurs variables « à prédire » Y en fonction d'un tableau de variables « prédictives » X basée sur un algorithme dérivé de NIPALS

Analyse discriminante PLS

Extension de la régression PLS au cas où le tableau des variables « à prédire » Y est constitué des indicatrices binaires des modalités d'une variable qualitative.

Méthode SIMCA (Soft Independent Modelling of Class Analogy)

Cette alternative originale à l'analyse discriminante permet, après avoir caractérisé des classes prédéfinies d'observations en fonction d'un ensemble de variables « descriptives », de « prévoir » la probabilité d'appartenance à chaque classe de nouvelles observations « décrites » par le même ensemble de variables.
La phase de caractérisation consiste à réaliser une ACP de chaque classe en utilisant l'algorithme NIPALS.
La phase « prédictive » consiste à calculer la distance entre chaque observation nouvelle et le modèle d'ACP de chaque classe, et d'estimer la probabilité correspondante. Cette méthode permet de repérer des observations qui n'appartiennent à aucune des classes prédéfinies.



Pour plus de renseignements, contactez :

- Tél : +33 (0) 1 72 92 05 58