Simca-P+ - Logiciel d'analyse multivariée des données - Sigma Plus
SIMCA-P + 12.0.1
Versions 32 et 64 bits
Le nouveau standard pour l'analyse
multivariée des données
Depuis de nombreuses années, SIMCA-P
+ est l'outil standard pour les scientifiques, les chercheurs, les responsables du développement de
nouveaux produits et les ingénieurs et globalement de tous ceux qui ont de grands volumes de données à analyser.
En quelques clics souris, les données sont transformées
en informations et cela permet de prendre rapidement des décisions en toute confiance.
Il y a trois principaux éléments qui font de SIMCA-P + un produit exceptionnel :
Facilité d'utilisation : Combiner des procédures analytiques avancées et la facilité d'utilisation n'est pas aisé,
mais cela est maintenant possible
avec la nouvelle version 12.0.1. Les outils performants de visualisation déjà présents dans SIMCA-P
+ sont maintenant accompagnés d'un assistant "Workset Wizard" et d'un
conseiller "Analysis Advisor" qui vous guident dans toutes les étapes menant des données aux informations.
Le générateur de rapports "Report Generator" vous permet alors
d'élaborer votre rapport contenant vos tableaux, graphiques et aides à l'interprétation.
Il ne vous suffit que d'y ajouter vos conclusions ! L'analyse des données n'a jamais été aussi facile.
Technologie à la pointe du progrès : SIMCA-P +
est comme toujours à la pointe du progrès dans le domaine de l'analyse multivariée, repoussant
les limites du possible. L'implémentation de la technologie OPLS dans sa nouvelle version est l'une des
fonctionnalités uniques qui contribuent à faire la différence entre SIMCA-P+
et ses éventuels compétiteurs.
Qualité : Pour satisfaire aux meilleurs standards de la qualité, SIMCA-P
+ est testé et validé de façon intensive et la rapport de validation est à la
disposition des utilisateurs du logiciel. La version 12.0.1 apporte un rapport d'audit "Audit Trail" encore plus complet.
SIMCA-P + est compatible avec la réglementation 21 CFR Part 11 (enregistrements électroniques). Les principales sociétés
pharmaceutiques ont audité le système qualité d'UMETRICS concernant le développement des logiciels et la validation des calculs. Le rapport d'audit des logiciels est piloté par
l'administrateur et protégé.
Brochures
Brochure descriptive des logiciels SIMCA-P + (pdf, 423 Ko)
Article paru dans "Scientific Computing World" (pdf, 214 Ko)
Voir également notre page "Téléchargement"
Quelques-unes des nouvelles fonctionnalités de la version 12.0.1
OPLS/O2PLS
La méthode PLS classique utilise la matrice X pour
modéliser Y, avec pour objectif de prévoir Y à partir de X. La méthode OPLS
est une modification récente de la méthode PLS qui a pour but de prendre en
compte la
variabilité de X qui est orthogonale ou non corrélée à Y. OPLS décompose la
variabilité de X en deux parties, l'une permettant de prévoir Y et l'autre étant
orthogonale à Y. Cette décomposition de X permet d'obtenir un modèle plus
facilement interprétable tout en ne modifiant pas la qualité de la prévision. O2PLS
est une généralisation de l'OPLS. A la différence des méthodes PLS et OPLS,
O2PLS est une méthode bidirectionnelle, c'est-à-dire X<=>Y, et donc X peut
être utilisé pour prévoir Y et Y peut être utilisé pour prévoir X. De plus,
avec O2PLS il est possible de décomposer la variabilité systématique de X et
de Y en trois parties, (i) la variabilité prédictive jointe X/Y, (ii) la
variabilité en X orthogonale à Y et (iii) la variabilité de Y non reliée à X.
Pour plus d'informations, cliquer ici (pdf, 309 Ko).
Classification et arbres PLS
Les grands ensembles de données sont presque toujours
formés de groupes. Pour trouver les relations dans de tels ensembles, un
découpage en groupes doit être effectué de façon à ce que chaque groupe
contienne des données à peu près homogènes. Pour analyser de grands et
complexes ensembles de données, une ou plusieurs méthodes de classification
sont nécessaires, de préférence en combinaison avec les méthodes PLS, OPLS et
O2PLS. Cette démarche est similaire à celle des arbres de régression (CART),
mais elle utilise les scores issus des modèles de régression PLS comme base
pour découper les classes, plutôt que les variables X d'origine. Lorsque cette
technique est appliquée à une paire de matrices X et Y, elle construit une
suite de découpages des données par rapport aux observations qui s'affiche
sous la forme d'un arbre de modèles PLS appelé dendrogramme. Ce dendrogramme
et les modèles PLS associés sont appelés "arbres PLS" dans SIMCA-P +.
Pour plus d'informations, cliquer ici (pdf, 272 Ko).
L'assistant "Workset Wizard"
Ce nouvel assistant "Workset Wizard" vous guide au travers de toutes les étapes nécessaires depuis l'importation de vos données jusqu'à la
création de votre modèle. Dans de nombreux cas, c'est tout ce que vous avez à faire avant d'ouvrir le générateur de rapports
"Report Generator". Vous n'avez plus besoin
de savoir comment mettre en oeuvre toutes ces étapes ni quelle méthode vous devez utiliser. SIMCA-P
+ le fait pour vous !
Le conseiller "Analysis Advisor"
Les utilisateurs occasionnels sont assistés même dans les travaux les plus complexes. Au fur et à mesure de votre avancement dans
l'analyse, le conseiller "Analysis Advisor" vous donne des explications sur les graphiques obtenus.
Vous obtenez même des suggestions immédiates pour la poursuite de votre analyse.
Que va-t-il arriver si ... (what if...)
Une des applications importantes de SIMCA-P
+ est l'analyse des processus et la SPC multivariée (MSPC). Les processus modernes génèrent de larges volumes de
données complexes que SIMCA-P + peut transformer en tableaux et graphiques informatifs.
Une fonctionnalité attractive est "Que va-t-il arriver si ..." (What Happens If...")
qui de façon interactive vous aide à comprendre le comportement multivarié
de votre processus lorsque des modifications sont introduites sur une ou plusieurs variables simultanément.
Affichage de la structure chimique
En modélisation QSAR (Quantitative Structure-Activity Relationships) ou en ADME/Tox (Absorbed, Distributed, Metabolized, Eliminated) la
connexion entre les résultats de l'analyse et la structure chimique est d'importance vitale. En permettant aux codes SMILES
d'être définis comme des identifiants secondaires
lors de l'importation des données, SIMCA-P + peut automatiquement afficher les structures chimiques lors du déroulement des analyses.
Il suffit de cliquer sur l'un des points d'un graphique pour afficher la structure chimique associée.
La conversion de la structure est réalisée par un add-in de la société OpenEye.
Plus d'informations en cliquant ici (pdf, 124 Ko).
Générateur de rapports
Cette nouvelle fonctionnalité vous permet de générer facilement des rapports au format HTML directement depuis vos projets SIMCA-P +. Cela
permet de partager vos résultats avec vos collègues et élimine les laborieux copier/coller.
Divers formats de rapports sont proposés, ils sont entièrement paramétrables
et mis à jour automatiquement par le logiciel lors du déroulement des analyses.
OPLS (Orthogonal PLS)
OPLS est une modification de la classique méthode PLS qui élimine les variations qui ne sont pas directement liées à la réponse. Les
résultats qui en découlent sont des modèles plus simples et plus faciles à interpréter.
OPLS est particulièrement intéressant en calibration spectroscopique, en modélisation QSAR
et dans toutes les analyses "omics". C'est une technique qui va devenir le standard dans toutes
les analyses de données multivariées. L'image ci-dessous montre comment OPLS
améliore la séparation des classes dans une étude sur des patients atteints du cancer.
OPLS est une méthode brevetée par UMETRICS.
Pour plus d'informations, cliquer ici (pdf, 392 Ko).
Analyse de lots
SIMCA-P + possède tous le outils spéciaux nécessaires à l'analyse et
à la modélisation de données provenant de lots. SIMCA-P + traite les lots découpés en phases, la notion de maturité
et permet de modéliser les niveaux bas (observations) et haut (lots).
Les modèles créés avec SIMCA-P + peuvent être transférés dans SIMCA-Batch On Line pour être exécutés en temps réel.
SIMCA-P + utilise une approche hiérarchique pour la modélisation des lots. Dans une première étape l'évolution
des lots est modélisée au niveau des observations
individuelles, puis dans une deuxième étape l'ensemble des lots,
en tant qu'unités statistiques, est modélisé. Ces modèles utilisent les conditions initiales plus les résumés
provenant de la première étape. Cela permet la modélisation, le tracé de cartes de contrôle, de graphiques des
contributions et une interprétation d'à la fois l'évolution
individuelle des lots au niveau des observations et des lots lorsqu'ils sont achevés.
Fonctionnalités techniques
(En rouge
et en italique les nouveautés de la version 12.0.1)
Général
Assistant pour l'interprétation des graphiques et pour suggérer les étapes suivantes de l'analyse
Générateur de rapports HTML paramétrables
Add-in pour l'affichage des structures chimiques (Smiles)
Fichier d'audit compatible CFR 21 Part 11
Import / Export
Formats supportés des fichiers
De EXCEL 5 à EXCEL 2007
SIMCA et MODDE (toutes versions Windows)
MATLAB 5.0
LOTUS (format wk1)
DIF et TEXT
UNSCRAMBLER ASCII
NSAS (Systèmes NIR) v 2.0
MVA CDF v 2.0
Brimrose et Galactic (*.spc) v 2.0
JCAMP-DX v 6.0
Andi Net-CDF (Chromatographie)
Export des modèles et des données depuis SIMCA-P+
Import direct depuis les bases de données via ODBC et MS Query.
Possibilité d'importer tout fichier formaté en utilisant une
DLL "plug-in"
Importation facilitée pour les fichiers CSV
Assistant d'importation
Visualisation des fichiers de données de SIMCA-P+.
Transposition de matrices.
Modification des noms des variables et des observations.
Modification des données par couper, copier, coller et insérer.
Variables qualitatives importées directement avec expansion automatique en variables indicatrices.
Affichage d'une carte des valeurs manquantes.
Jusqu'à 100 identifiants secondaires pour les variables et les observations.
Définition des variables X et Y à l'importation
Fusion de colonnes à l'importation
Zoom à l'importation
Fusion et concaténation de fichiers
Diminution du nombre d'observations, de lots
pendant ou avant l'importation
Assistant d'importation vous guidant jusqu'à l'ajustement du modèle
Les messages d'importation sont ajoutés dans le fichier d'audit
Possibilité d'ajouter des identifiants secondaires dans le jeu de données
Import par
copier/coller de tout le fichier
Gestion améliorée des dates et heures
Centrage local du jeu de données
Visualisation et prétraitement
Visualisation des données Fonctionnalités permettant un accès rapide à la visualisation des données:
Liste du nombre d'échantillons, du nombre de variables, du nombre de données
manquantes, du minimum, du maximum, de la moyenne, de la médiane, de l'écart-type, de
l'asymétrie, de l'aplatissement pour chaque ligne ou pour chaque colonne sélectionnée.
Histogramme d'effectifs.
Spectres et séries temporelles.
Corrélation et corrélation croisée.
Spectre de puissance.
Spectre de puissance pour ondelettes.
Structure en ondelettes.
Prétraitement par remplacement ou par "Winsorisation" de variables
individuelles ou de toutes les variables
Affichage d'une carte des données remplacées ou "Winsorisées"
Résumé des prétraitements
Les graphiques peuvent être créés directement depuis le
tableau des données en sélectionnant les colonnes et les observations
Possibilité de sélectionner des colonnes non contiguës
Affichage d'un spectre directement depuis le tableau des
données
"Quick Info" enrichi et accessible depuis toutes les listes et tous les graphiques
Le prétraitement par remplacement peut être réalisé sur une sous-partie (période de temps) des données d'une variable
Prétraitement
Correction orthogonale du signal (OSC).
Correction multiplicative du signal (MSC).
Transformation par filtrage de Barnes (SNV).
Débruitage de données spectrales par ondelettes.
Transformation et compression par ondelettes, sur les lignes ou sur les colonnes.
Ondelettes puis OSC
OSC puis ondelettes
Décimation
Dérivées première, seconde et troisième
EWMA
Savitsky-Golay
Combinaison de filtres
Débruitage des jeux de données secondaires
Plug-in pour le filtrage de spectres
Création de nouvelles variables
Variables comme fonctions de variables déjà présentes ou comme fonctions de variables
de résultats.
Opérateurs +,-,^,*,/.
Fonctions disponibles: Log10, Ln, Exp, Lag, Différences première, seconde et saisonnière,
Moyenne, Ecart-type, Somme, Génération de variables indicatrices.
Résultats issus du modèle: DModX, T, T-carré, U, TPS, etc.
Possibilité de définir ses propres fonctions mathématiques
Plus de fonctions intégrées disponibles
Tableau des données
Tableur des données avec "Quick Info" et outil de prétraitement par remplacement ou par "Winsorization" des
variables
Le tableur des données par défaut peut être changé
Outil amélioré de recherche des observations ou des variables
Les statistiques du tableur peuvent être calculées par classe ou par phase
Sélection du type de modèle via les boîtes de dialogue du tableur des données
Variables
Transformations: Log, Neglog, Logit, Puissance.
Visualisation de statistiques résumées dans la page des transformations
Exclusion de variables et définition des blocs X et Y.
Décalage de séries temporelles.
Termes carrés, croisés et cubiques.
Définition de l'échelle par variable et par bloc.
Centrage et réduction possible à partir des valeurs d'un identifiant secondaire
Blocs différents par classe pour les variables X et Y
Définition flexible des échelles par fichier ou manuellement
Moyenne et écart-type affichés dans la page des échelles
Support des variables Y qualitatives
Observations
Exclusion et inclusion d'observations.
Groupement d'observations par classes.
Possibilité de créer des classes à partir des valeurs des variables ou des scores.
Noms des classes définis par l'utilisateur
Analyse
Modèles
Nombre illimité de modèles dans un projet. Toutes les méthodes acceptent les données manquantes.
ACP, ACP de classes.
PLS, PLS de classes.
Analyse Discriminante PLS.
ACP et PLS pour des séries temporelles.
OPLS/O2PLS, OPLS/O2PLS de classes
Analyse discriminante OPLS/O2PLS
Classification et arbres PLS
Modèles hiérarchiques
Génération automatique des modèles hiérarchiques
après affectation des variables aux blocs
Ajustement automatique des modèles pour les classes
Intervalles de confiances pour les coefficients de régression, les scores, les poids et
les VIP.
Analyse d'images
PCA-XY, PCA-Y et PLS en un clic de souris
OPLS et OPLS par classe
Noms des variables plus informatifs pour les modèles hiérarchiques
Validation croisée améliorée pour l'ACP
Validation du modèle
Validation croisée.
Test des permutations
Possibilité de préciser comment les groupes pour la validation croisée doivent être constitués
Tableau de l'ANOVA
Visualiser les résultats du modèle au
travers de graphiques et de tableaux
Résumé de la qualité du modèle (Q2, R2).
Coordonnées des observations et des variables.
Diagnostics (Résidus, DModX, Observé/Prévu).
Diagnostics d'étalonnage (RMSEE, RMSEP).
Coefficients et mesures d'influence des variables.
Graphique des contributions affiché directement en cliquant sur les observations dans les graphiques.
Contribution des groupes
Coefficients et contributions pour les modèles
hiérarchiques
Intervalle de confiance par la méthode "jack-knife" pour les paramètres et les prévisions
Nombreuses options pour le paramétrage des graphiques
Coefficients après rotations
Profils Y en 'OPLS/O2PLS
Modification possible du titre du modèle dans la fenêtre du projet
Prévision
Graphiques et tableaux
Import d'un fichier de données pour les prévisions.
Classifications automatiques utilisant les modèles pour les classes.
Résultats des prévisions présentés sous forme de tableaux, de graphiques et de diagnostics.
Fichier de données pour les prévisions automatiquement utilisé comme fichier d'étalonnage en prétraitement
Listes colorées des prévisions en Analyse Discriminante PLS
Outil "what if ..." pour simuler différents scénarios
Amélioration du tableau résumé des classements en PLS-DA et classification SIMCA
Import des
valeurs pour les centrages pour le jeu de données des prévisions
Outil de
recherche lors de la création du jeu des données des prévisions
Nuages de points 3D avec rotation dynamique.
Coloration des points d'un nuage en fonction des valeurs des variables, des scores, des DModX, ...
Tout identifiant d'une observation ou d'une variable peut être utilisé comme libellé d'un point ou d'un axe.
Interaction entre les graphiques et les points.
Interface graphique aisée à utiliser
Graphiques interactifs permettant de supprimer ou d'agréger des observations dans les
plans factoriels.
Graphiques interactifs permettant de supprimer des termes du modèle directement à
partir du graphique factoriel des variables, des coefficients et des VIP.
Types de graphiques: nuage, courbe, bâton, histogramme, série temporelle, contour,
surface 3D, graphique de normalité, dendrogramme.
Cartes de contrôle des composantes et des variables individuelles: Shewhart, EWMA,
CuSum, EWMA/Shewhart, BSPC (MSP multivariée de lots).
Vaste ensemble de tableaux des résultats
Barre d'outils pour rapidement modifier le contenu des graphiques (composante, variable, modèle, ...)
Recherche d'une observation ou d'une variable à partir de sélections multiples
Graphique de tendance d'une variable par simple double-clic
Plus de flexibilité pour la sauvegarde des paramètres graphiques
Amélioration de la gestion des couleurs
Limites modifiables directement dans les graphiques
Mode plein écran
Plus d'options pour le tri des colonnes dans les graphiques
Tailles des points en fonction des valeurs d'une variable
Autres fonctionnalités
SIMCA-P + peut être démarré depuis un logiciel externe et les données importées et
exportées de façon automatique.
Rapport d'audit en accord avec les réglementations CFR 21 Part 11 de la FDA sur les
enregistrements électroniques
Nombre illimité d'observations et de variables.
Commande pour enregistrer les projets sous un format réduit
Seuls les modèles affectés sont supprimés après modifications du jeu de données
Les favoris incluent le jeu de données et le projet
Import et export des définition des favoris
Fonctionnalités pour le traitement des lots
Niveau observation
Outil flexible pour l'importation de données
Nombre illimité de phases
Conditions initiales lues avec les données primaires de niveau inférieur
Des variables différentes de maturité sont possibles pour les diverses phases
Des lots peuvent ne pas comporter certaines phases
Les phases peuvent comporter des variables différentes
Possibilité de supprimer, d'agréger et de renommer des phases
Suppression conditionnelle
Centrage local
Filtrage
Temps ou maturité défini par l'utilisateur
Variables de maturité différentes pour les diverses phases
Maturité monotone dans une phase et ascendante ou descendante
Ajustement automatique de toutes les phases
Validation croisée pour les lots
Outil pour exclure un lot entier
Possibilité de sélection des données par lot et par phase
Graphiques des lots alignés et non alignés
Graphiques de tous les vecteurs alignés
Graphiques de la maturité observée par rapport à la maturité lissée
Cartes de contrôle enrichies avec notamment la carte du T2 de Hotelling
Carte de contrôle du lot pour tout modèle
Alignements "à la volée" pour tout modèle
Graphique des hors contrôle
Carte de contrôle d'une variable affichable par simple double-clic
Contribution des groupes
Import des échelles à partir d'un fichier pour toutes les phases
Configuration du Temps / Maturité
Niveau lot
Création plus souple et améliorée du niveau lot
Modèles partiels automatiques au niveau supérieur
Onglets pour passer du niveau observation au niveau
supérieur
Fusion automatique des conditions initiales
L'OSC au niveau lot s'applique automatiquement aux données de prévision
Graphique des VIP des variables du lot disponible pour tous les types de modèles
Les graphiques des contributions au niveau lot
peuvent être affichés au niveau observation pour les variables d'origine
Option pour générer automatiquement les modèles au niveau des observations après suppression des points extrêmes au niveau lot
Génération automatique des modèles hiérarchiques au niveau lot
Plus de statistiques et de souplesse au niveau lot
Graphique des sources de variabilité
Identifiants
secondaires pris en compte au niveau des lots