Simca-P+ - Logiciel d'analyse multivariée des données - Sigma Plus

SIMCA-P + 12.0.1
Versions 32 et 64 bits

 Le nouveau standard pour l'analyse multivariée des données


Depuis de nombreuses années, SIMCA-P + est l'outil standard pour les scientifiques, les chercheurs, les responsables du développement de nouveaux produits et les ingénieurs et globalement de tous ceux qui ont de grands volumes de données à analyser. En quelques clics souris, les données sont transformées en informations et cela permet de prendre rapidement des décisions en toute confiance.
Il y a trois principaux éléments qui font de SIMCA-P + un produit exceptionnel :

Cliquer pour agrandir l'image.

  • Facilité d'utilisation : Combiner des procédures analytiques avancées et la facilité d'utilisation n'est pas aisé, mais cela est maintenant possible avec la nouvelle version 12.0.1.  Les outils performants de visualisation déjà présents dans SIMCA-P + sont maintenant accompagnés d'un assistant "Workset Wizard" et d'un conseiller "Analysis Advisor" qui vous guident dans toutes les étapes menant des données aux informations. Le générateur de rapports "Report Generator" vous permet alors d'élaborer votre rapport contenant vos tableaux, graphiques et aides à l'interprétation.  Il ne vous suffit que d'y ajouter vos conclusions !  L'analyse des données n'a jamais été aussi facile.
  • Technologie à la pointe du progrès :  SIMCA-P + est comme toujours à la pointe du progrès dans le domaine de l'analyse multivariée, repoussant les limites du possible. L'implémentation de la technologie OPLS dans sa nouvelle version est l'une des fonctionnalités uniques qui contribuent à faire la différence entre SIMCA-P+ et ses éventuels compétiteurs.

  • Qualité : Pour satisfaire aux meilleurs standards de la qualité, SIMCA-P + est testé et validé de façon intensive et la rapport de validation est à la disposition des utilisateurs du logiciel.  La version 12.0.1 apporte un rapport d'audit "Audit Trail" encore plus complet.

SIMCA-P + est compatible avec la réglementation 21 CFR Part 11 (enregistrements électroniques).  Les principales sociétés pharmaceutiques ont audité le système qualité d'UMETRICS concernant le développement des logiciels et la validation des calculs. Le rapport d'audit des logiciels est piloté par l'administrateur et protégé.

Brochures

  • Brochure descriptive des logiciels SIMCA-P + (pdf, 423 Ko)
  • Fonctionnalités du logiciel (pdf, 88 Ko)
  • Article paru dans "Scientific Computing World" (pdf, 214 Ko)
  • Voir également notre page "Téléchargement"

Quelques-unes des nouvelles fonctionnalités de la version 12.0.1

  • OPLS/O2PLS

La méthode PLS classique utilise la matrice X pour modéliser Y, avec pour objectif de prévoir Y à partir de X. La méthode OPLS est une modification récente de la méthode PLS qui a pour but de prendre en compte la variabilité de X qui est orthogonale ou non corrélée à Y. OPLS décompose la variabilité de X en deux parties, l'une permettant de prévoir Y et l'autre étant orthogonale à Y. Cette décomposition de X permet d'obtenir un modèle plus facilement interprétable tout en ne modifiant pas la qualité de la prévision. O2PLS est une généralisation de l'OPLS. A la différence des méthodes PLS et OPLS, O2PLS est une méthode bidirectionnelle, c'est-à-dire X<=>Y, et donc X peut être utilisé pour prévoir Y et Y peut être utilisé pour prévoir X. De plus, avec O2PLS il est possible de décomposer la variabilité systématique de X et de Y en trois parties, (i) la variabilité prédictive jointe X/Y, (ii) la variabilité en X orthogonale à Y et (iii) la variabilité de Y non reliée à X.

Pour plus d'informations, cliquer ici (pdf, 309 Ko).

  • Classification et arbres PLS

Les grands ensembles de données sont presque toujours formés de groupes. Pour trouver les relations dans de tels ensembles, un découpage en groupes doit être effectué de façon à ce que chaque groupe contienne des données à peu près homogènes. Pour analyser de grands et complexes ensembles de données, une ou plusieurs méthodes de classification sont nécessaires, de préférence en combinaison avec les méthodes PLS, OPLS et O2PLS. Cette démarche est similaire à celle des arbres de régression (CART), mais elle utilise les scores issus des modèles de régression PLS comme base pour découper les classes, plutôt que les variables X d'origine. Lorsque cette technique est appliquée à une paire de matrices X et Y, elle construit une suite de découpages des données par rapport aux observations qui s'affiche sous la forme d'un arbre de modèles PLS appelé dendrogramme. Ce dendrogramme et les modèles PLS associés sont appelés "arbres PLS" dans SIMCA-P +.

Pour plus d'informations, cliquer ici (pdf, 272 Ko).

  • L'assistant "Workset Wizard"

Ce nouvel assistant "Workset Wizard" vous guide au travers de toutes les étapes nécessaires depuis l'importation de vos données jusqu'à la création de votre modèle.  Dans de nombreux cas, c'est tout ce que vous avez à faire avant d'ouvrir le générateur de rapports "Report Generator".  Vous n'avez plus besoin de savoir comment mettre en oeuvre toutes ces étapes ni quelle méthode vous devez utiliser.  SIMCA-P + le fait pour vous !

  • Le conseiller "Analysis Advisor"

Les utilisateurs occasionnels sont assistés même dans les travaux les plus complexes.  Au fur et à mesure de votre avancement dans l'analyse, le conseiller "Analysis Advisor" vous donne des explications sur les graphiques obtenus.  Vous obtenez même des suggestions immédiates pour la poursuite de votre analyse.

Cliquer pour agrandir l'image.

  • Que va-t-il arriver si ... (what if...)

Une des applications importantes de SIMCA-P + est l'analyse des processus et la SPC multivariée (MSPC). Les processus modernes génèrent de larges volumes de données complexes que SIMCA-P + peut transformer en tableaux et graphiques informatifs.

Une fonctionnalité attractive est "Que va-t-il arriver si ..." (What Happens If...") qui de façon interactive vous aide à comprendre le comportement multivarié de votre processus lorsque des modifications sont introduites sur une ou plusieurs variables simultanément.

Cliquer pour agrandir l'image.

  • Affichage de la structure chimique

En modélisation QSAR (Quantitative Structure-Activity Relationships) ou en ADME/Tox (Absorbed, Distributed, Metabolized, Eliminated) la connexion entre les résultats de l'analyse et la structure chimique est d'importance vitale.  En permettant aux codes SMILES d'être définis comme des identifiants secondaires lors de l'importation des données, SIMCA-P + peut automatiquement afficher les structures chimiques lors du déroulement des analyses. Il suffit de cliquer sur l'un des points d'un graphique pour afficher la  structure chimique associée.

La conversion de la structure est réalisée par un add-in de la société OpenEye. Plus d'informations en cliquant ici (pdf, 124 Ko).

Cliquer pour agrandir l'image.

  • Générateur de rapports

Cette nouvelle fonctionnalité vous permet de générer facilement des rapports au format HTML directement depuis vos projets SIMCA-P +. Cela permet de partager vos résultats avec vos collègues et élimine les laborieux copier/coller.  Divers formats  de rapports sont proposés, ils sont entièrement paramétrables et mis à jour automatiquement par le logiciel lors du déroulement des analyses.

Cliquer pour agrandir l'image.

  • OPLS (Orthogonal PLS)

OPLS est une modification de la classique méthode PLS qui élimine les variations qui ne sont pas directement liées à la réponse. Les résultats qui en découlent sont des modèles plus simples et plus faciles à interpréter. OPLS est particulièrement intéressant en calibration spectroscopique, en modélisation QSAR et dans toutes les analyses "omics". C'est une technique qui va devenir le standard dans toutes les analyses de données multivariées. L'image ci-dessous montre comment OPLS améliore la séparation des classes dans une étude sur des patients atteints du cancer.  OPLS est une méthode brevetée par UMETRICS.

Pour plus d'informations, cliquer ici (pdf, 392 Ko).

Cliquer pour agrandir l'image.

  • Analyse de lots

SIMCA-P + possède tous le outils spéciaux nécessaires à l'analyse et à la modélisation de données provenant de lots. SIMCA-P + traite les lots découpés en phases, la notion de maturité et permet de modéliser les niveaux bas (observations) et haut (lots).

Les modèles créés avec SIMCA-P + peuvent être transférés dans SIMCA-Batch On Line pour être exécutés en temps réel.

SIMCA-P + utilise une approche hiérarchique pour la modélisation des lots. Dans une première étape l'évolution des lots est modélisée au niveau des observations individuelles, puis dans une deuxième étape l'ensemble des lots, en tant qu'unités statistiques, est modélisé. Ces modèles utilisent les conditions initiales plus les résumés provenant de la première étape. Cela permet la modélisation, le tracé de cartes de contrôle, de graphiques des contributions et une interprétation d'à la fois l'évolution individuelle des lots au niveau des observations et des lots lorsqu'ils sont achevés.

Cliquer pour agrandir l'image.

Fonctionnalités techniques

(En rouge et en italique les nouveautés de la version 12.0.1)

Général
  • Assistant pour l'interprétation des graphiques et pour suggérer les étapes suivantes de l'analyse
  • Générateur de rapports HTML paramétrables
  • Add-in pour l'affichage des structures chimiques (Smiles)
  • Fichier d'audit compatible CFR 21 Part 11
Import / Export
Formats supportés des fichiers
  • De EXCEL 5 à EXCEL 2007
  • SIMCA et MODDE (toutes versions Windows)
  • MATLAB 5.0
  • LOTUS (format wk1)
  • DIF et TEXT
  • UNSCRAMBLER ASCII
  • NSAS (Systèmes NIR) v 2.0
  • MVA CDF v 2.0
  • Brimrose et Galactic (*.spc) v 2.0
  • JCAMP-DX v 6.0
  • Andi Net-CDF (Chromatographie)
  • Export des modèles et des données depuis SIMCA-P+
  • Import direct depuis les bases de données via ODBC et MS Query.
  • Possibilité d'importer tout fichier formaté en utilisant une DLL "plug-in"
  • Importation facilitée pour les fichiers CSV
Assistant d'importation
  • Visualisation des fichiers de données de SIMCA-P+.
  • Transposition de matrices.
  • Modification des noms des variables et des observations.
  • Modification des données par couper, copier, coller et insérer.
  • Variables qualitatives importées directement avec expansion automatique en variables indicatrices.
  • Affichage d'une carte des valeurs manquantes.
  • Jusqu'à 100 identifiants secondaires pour les variables et les observations.
  • Définition des variables X et Y à l'importation
  • Fusion de colonnes à l'importation
  • Zoom à l'importation
  • Fusion et concaténation de fichiers
  • Diminution du nombre d'observations, de lots pendant ou avant l'importation
  • Assistant d'importation vous guidant jusqu'à l'ajustement du modèle
  • Les messages d'importation sont ajoutés dans le fichier d'audit
  • Possibilité d'ajouter des identifiants secondaires dans le jeu de données
  • Import par copier/coller de tout le fichier
  • Gestion améliorée des dates et heures
  • Centrage local du jeu de données
Visualisation et prétraitement
Visualisation des données
Fonctionnalités permettant un accès rapide à la visualisation des données:
  • Liste du nombre d'échantillons, du nombre de variables, du nombre de données manquantes, du minimum, du maximum, de la moyenne, de la médiane, de l'écart-type, de l'asymétrie, de l'aplatissement pour chaque ligne ou pour chaque colonne sélectionnée.
  • Histogramme d'effectifs.
  • Spectres et séries temporelles.
  • Corrélation et corrélation croisée.
  • Spectre de puissance.
  • Spectre de puissance pour ondelettes.
  • Structure en ondelettes.
  • Prétraitement par remplacement ou par "Winsorisation" de variables individuelles ou de toutes les variables
  • Affichage d'une carte des données remplacées ou "Winsorisées"
  • Résumé des prétraitements
  • Les graphiques peuvent être créés directement depuis le tableau des données en sélectionnant les colonnes et les observations
  • Possibilité de sélectionner des colonnes non contiguës
  • Affichage d'un spectre directement depuis le tableau des données
  • "Quick Info" enrichi et accessible depuis toutes les listes et tous les graphiques
  • Le prétraitement par remplacement peut être réalisé sur une sous-partie (période de temps) des données d'une variable
Prétraitement
  • Correction orthogonale du signal (OSC).
  • Correction multiplicative du signal (MSC).
  • Transformation par filtrage de Barnes (SNV).
  • Débruitage de données spectrales par ondelettes.
  • Transformation et compression par ondelettes, sur les lignes ou sur les colonnes.
  • Ondelettes puis OSC
  • OSC puis ondelettes
  • Décimation
  • Dérivées première, seconde et troisième
  • EWMA
  • Savitsky-Golay
  • Combinaison de filtres
  • Débruitage des jeux de données secondaires
  • Plug-in pour le filtrage de spectres

Création de nouvelles variables

  • Variables comme fonctions de variables déjà présentes ou comme fonctions de variables de résultats.
  • Opérateurs +,-,^,*,/.
  • Fonctions disponibles: Log10, Ln, Exp, Lag, Différences première, seconde et saisonnière,
    Moyenne, Ecart-type, Somme, Génération de variables indicatrices.
  • Résultats issus du modèle: DModX, T, T-carré, U, TPS, etc.
  • Possibilité de définir ses propres fonctions mathématiques
  • Plus de fonctions intégrées disponibles
Tableau des données
  • Tableur des données avec "Quick Info" et outil de prétraitement par remplacement ou par "Winsorization" des variables
  • Le tableur des données par défaut peut être changé
  • Outil amélioré de recherche des observations ou des variables
  • Les statistiques du tableur peuvent être calculées par classe ou par phase
  • Sélection du type de modèle via les boîtes de dialogue du tableur des données
Variables
  • Transformations: Log, Neglog, Logit, Puissance.
  • Visualisation de statistiques résumées dans la page des transformations
  • Exclusion de variables et définition des blocs X et Y.
  • Décalage de séries temporelles.
  • Termes carrés, croisés et cubiques.
  • Définition de l'échelle par variable et par bloc.
  • Centrage et réduction possible à partir des valeurs d'un identifiant secondaire
  • Blocs différents par classe pour les variables X et Y
  • Définition flexible des échelles par fichier ou manuellement
  • Moyenne et écart-type affichés dans la page des échelles
  • Support des variables Y qualitatives
Observations
  • Exclusion et inclusion d'observations.
  • Groupement d'observations par classes.
  • Possibilité de créer des classes à partir des valeurs des variables ou des scores.
  • Noms des classes définis par l'utilisateur

 

Analyse
Modèles
  • Nombre illimité de modèles dans un projet. Toutes les méthodes acceptent les données manquantes.
  • ACP, ACP de classes.
  • PLS, PLS de classes.
  • Analyse Discriminante PLS.
  • ACP et PLS pour des séries temporelles.
  • OPLS/O2PLS, OPLS/O2PLS de classes
  • Analyse discriminante OPLS/O2PLS
  • Classification et arbres PLS
  • Modèles hiérarchiques
  • Génération automatique des modèles hiérarchiques après affectation des variables aux blocs
  • Ajustement automatique des modèles pour les classes
  • Intervalles de confiances pour les coefficients de régression, les scores, les poids et les VIP.
  • Analyse d'images
  • PCA-XY, PCA-Y et PLS en un clic de souris
  • OPLS et OPLS par classe
  • Noms des variables plus informatifs pour les modèles hiérarchiques
  • Validation croisée améliorée pour l'ACP

Validation du modèle

  • Validation croisée.
  • Test des permutations
  • Possibilité de préciser comment les groupes pour la validation croisée doivent être constitués
  • Tableau de l'ANOVA
Visualiser les résultats du  modèle au travers de graphiques et de tableaux
  • Résumé de la qualité du modèle (Q2, R2).
  • Coordonnées des observations et des variables.
  • Diagnostics (Résidus, DModX, Observé/Prévu).
  • Diagnostics d'étalonnage (RMSEE, RMSEP).
  • Coefficients et mesures d'influence des variables.
  • Graphique des contributions affiché directement en cliquant sur les observations dans les graphiques.
  • Contribution des groupes
  • Coefficients et contributions pour les modèles hiérarchiques
  • Intervalle de confiance par la méthode "jack-knife" pour les paramètres et les prévisions
  • Nombreuses options pour le paramétrage des graphiques
  • Coefficients après rotations
  • Profils Y en 'OPLS/O2PLS
  • Modification possible du titre du modèle dans la fenêtre du projet
Prévision Graphiques et tableaux
  • Import d'un fichier de données pour les prévisions.
  • Classifications automatiques utilisant les modèles pour les classes.
  • Résultats des prévisions présentés sous forme de tableaux, de graphiques et de diagnostics.
  • Fichier de données pour les prévisions automatiquement utilisé comme fichier d'étalonnage en prétraitement
  • Listes colorées des prévisions en Analyse Discriminante PLS
  • Outil "what if ..." pour simuler différents scénarios
  • Amélioration du tableau résumé des classements en PLS-DA et classification SIMCA
  • Import des valeurs pour les centrages pour le jeu de données des prévisions
  • Outil de recherche lors de la création du jeu des données des prévisions
  • Nuages de points 3D avec rotation dynamique.
  • Coloration des points d'un nuage en fonction des valeurs des variables, des scores, des DModX, ...
  • Tout identifiant d'une observation ou d'une variable peut être utilisé comme libellé d'un point ou d'un axe.
  • Interaction entre les graphiques et les points.
  • Interface graphique aisée à utiliser
  • Graphiques interactifs permettant de supprimer ou d'agréger des observations dans les plans factoriels.
  • Graphiques interactifs permettant de supprimer des termes du modèle directement à partir du graphique factoriel des variables, des coefficients et des VIP.
  • Types de graphiques: nuage, courbe, bâton, histogramme, série temporelle, contour, surface 3D, graphique de normalité, dendrogramme.
  • Cartes de contrôle des composantes et des variables individuelles: Shewhart, EWMA, CuSum, EWMA/Shewhart, BSPC (MSP multivariée de lots).
  • Vaste ensemble de tableaux des résultats
  • Barre d'outils pour rapidement modifier le contenu des graphiques (composante, variable, modèle, ...)
  • Recherche d'une observation ou d'une variable à partir de sélections multiples
  • Graphique de tendance d'une variable par simple double-clic
  • Plus de flexibilité pour la sauvegarde des paramètres graphiques
  • Amélioration de la gestion des couleurs
  • Limites modifiables directement dans les graphiques
  • Mode plein écran
  • Plus d'options pour le tri des colonnes dans les graphiques
  • Tailles des points en fonction des valeurs d'une variable
Autres fonctionnalités
  • SIMCA-P + peut être démarré depuis un logiciel externe et les données importées et exportées de façon automatique.
  • Rapport d'audit en accord avec les réglementations CFR 21 Part 11 de la FDA sur les enregistrements électroniques
  • Nombre illimité d'observations et de variables.
  • Commande pour enregistrer les projets sous un format réduit
  • Seuls les modèles affectés sont supprimés après modifications du jeu de données
  • Les favoris incluent le jeu de données et le projet
  • Import et export des définition des favoris

Fonctionnalités pour le traitement des lots

Niveau observation

  • Outil flexible pour l'importation de données
  • Nombre illimité de phases
  • Conditions initiales lues avec les données primaires de niveau inférieur
  • Des variables différentes de  maturité sont possibles pour les diverses phases
  • Des lots peuvent ne pas comporter certaines phases
  • Les phases peuvent comporter des variables différentes
  • Possibilité de supprimer, d'agréger et de renommer des phases
  • Suppression conditionnelle
  • Centrage local
  • Filtrage
  • Temps ou maturité défini par l'utilisateur
  • Variables de maturité différentes pour les diverses phases
  • Maturité monotone dans une phase et ascendante ou descendante
  • Ajustement automatique de toutes les phases
  • Validation croisée pour les lots
  • Outil pour exclure un lot entier
  • Possibilité de sélection des données par lot et par phase
  • Graphiques des lots alignés et non alignés
  • Graphiques de tous les vecteurs alignés
  • Graphiques de la maturité observée par rapport à la maturité lissée
  • Cartes de contrôle enrichies avec notamment la carte du T2 de Hotelling
  • Carte de contrôle du lot pour tout modèle
  • Alignements "à la volée" pour tout modèle
  • Graphique des hors contrôle
  • Carte de contrôle d'une variable affichable par simple double-clic
  • Contribution des groupes
  • Import des échelles à partir d'un fichier pour toutes les phases
  • Configuration du Temps / Maturité

Niveau lot

  • Création plus souple et améliorée du niveau lot
  • Modèles partiels automatiques au niveau supérieur
  • Onglets pour passer du niveau observation au niveau supérieur
  • Fusion automatique des conditions initiales
  • L'OSC au niveau lot s'applique automatiquement aux données de prévision
  • Graphique des VIP des variables du lot disponible pour tous les types de modèles
  • Les graphiques des contributions au niveau lot peuvent être affichés au niveau observation pour les variables d'origine
  • Option pour générer automatiquement les modèles au niveau des observations après suppression des points extrêmes au niveau lot
  • Génération automatique des modèles hiérarchiques au niveau lot
  • Plus de statistiques et de souplesse au niveau lot
  • Graphique des sources de variabilité
  • Identifiants secondaires pris en compte au niveau des lots
Signature
Envoyer message
Plan du site Contact Rechercher