UNIWIN Plus version 8.1.2 française

UNIWIN Plus est un module complémentaire à STATGRAPHICS Centurion. Il est livré avec ce logiciel et lui ajoute seize méthodes d’analyse de données multivariées.

UNIWIN Plus peut également être utilisé avec Microsoft Excel. Il charge en effet les fichiers .xlsx, .xls, .xlsm et crée des rapports au format HTML.


L’analyse en composantes principales

La méthode d’Analyse en Composantes Principales permet d’étudier un tableau individus x variables dans le cas où toutes les variables sont quantitatives.

La méthode permet d’obtenir une carte des individus en fonction de leurs proximités et une carte des variables en fonction de leurs corrélations. Il est également possible d’obtenir une représentation simultanée (Biplot).

La possibilité d’analyser des individus et des variables supplémentaires (quantitatives ou qualitatives) est offerte.

Après affichage du tableau et de l’histogramme des inerties, vous pouvez choisir le nombre d’axes factoriels à extraire.

Tous les résultats sont automatiquement sauvegardés sur fichier.

acp

Un rapport général de synthèse est proposé ainsi que les graphiques des plans factoriels des individus, des cercles des corrélations, du Biplot, de ceux relatifs aux individus et variables supplémentaires ainsi que des graphiques des contributions, des cosinus carrés et des distances carrées à l’origine.

De nombreux outils d’aide à l’interprétation sont fournis, notamment contributions et cosinus carrés.

 


L’analyse factorielle des correspondances

L’Analyse Factorielle des Correspondances (Analyse des Correspondances Simples ou Binaires) permet de représenter graphiquement un tableau de contingence créé par le ou les croisements (tris croisés) de deux ou plusieurs variables qualitatives.  La méthode vise à rassembler sur un ou plusieurs graphiques (plan factoriel) la plus grande partie possible de l’information contenue dans le tableau en s’attachant non pas aux valeurs absolues mais aux correspondances entre les caractéristiques, c’est-à-dire aux valeurs relatives.

La possibilité d’analyse de points lignes ou colonnes supplémentaires est offerte.

Après affichage du tableau et de l’histogramme des inerties, vous pouvez choisir le nombre d’axes factoriels à extraire.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Un rapport général de synthèse est proposé ainsi que l’ensemble des graphiques des plans factoriels lignes, colonnes, simultanés, barycentriques, de ceux relatifs aux lignes et colonnes supplémentaires ainsi que des graphiques des contributions, des cosinus carrés et des distances carrées à l’origine.

De nombreux outils d’aide à l’interprétation sont fournis, notamment contributions et cosinus carrés.

 


L’analyse des correspondances multiples

L’Analyse des Correspondances Multiples permet d’analyser un tableau individus x variables lorsque les variables sont qualitatives. Cette méthode effectue une analyse des correspondances sur le tableau disjonctif complet obtenu en remplaçant dans le tableau d’origine chaque variable qualitative par l’ensemble des variables indicatrices des différentes modalités de cette variable.

La possibilité d’analyse d’individus ou de variables supplémentaires est offerte.

La transformation du tableau des données initiales en tableau disjonctif complet est automatiquement effectuée.

Après l’affichage du tableau et de l’histogramme des inerties, vous pouvez choisir le nombre d’axes factoriels à extraire.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Un rapport général de synthèse est proposé ainsi que l’ensemble des graphiques des plans factoriels individus, variables, simultanés, barycentriques et de ceux relatifs aux individus et variables supplémentaires.  De nombreux outils d’aide à l’interprétation sont fournis, notamment contributions, cosinus carrés, distances à l’origine, valeurs test.

 


L’analyse sur tableau de distances ou de dissimilarités

La méthode d’Analyse sur Tableau de Distances ou de Dissimilarités permet d’étudier un tableau carré symétrique (à diagonale nulle) individus x individus contenant à chaque intersection ligne-colonne la distance ou la dissimilarité entre cette ligne et cette colonne. Si le tableau n’est pas symétrique, il est symétrisé par la procédure et s’il ne définit pas une « vraie distance », une technique dite de «la constante additive» est utilisée.

La méthode permet d’obtenir une carte des individus en fonction de leurs proximités ou dissimilarités.

Après affichage du tableau et de l’histogramme des inerties, vous pouvez choisir le nombre d’axes factoriels à extraire et la méthode à utiliser si des valeurs propres sont négatives.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Un rapport général de synthèse est proposé ainsi que des graphiques des plans factoriels des individus.

De nombreux outils d’aide à l’interprétation sont fournis: contributions, cosinus carrés, distances calculées, écarts entre les distances d’origine et celles calculées.

 


La classification ascendante hiérarchique

La méthode de Classification Ascendante Hiérarchique permet de construire une typologie (ou partition) d’un ensemble d’individus en classes telles que les individus appartenant à une même classe sont proches alors que les individus appartenant à des classes différentes sont éloignés.

La méthode utilisée est celle de Ward , méthode dite des voisins réciproques. C’est une méthode ascendante partant d’un nombre de classes égal au nombre des individus et regroupant à chaque itération un (ou plusieurs) individus ou classes en fonction de la diminution de l’inertie inter-classes.

L’algorithme s’applique à des données quantitatives individus x variables (avec standardisation ou non), à un tableau de contingence ou à un tableau de variables qualitatives. Dans le cas d’un tableau de contingence, la classification peut se faire suivant les lignes ou les colonnes.

Un tableau résumé de la classification et le tracé de l’arbre de classification (avec zoom et troncature) et de nuages codifiés sont proposés ainsi que des outils d’analyse de la partition et des nœuds.

cah

Tous les résultats sont automatiquement sauvegardés sur fichier et un rapport général de synthèse est également proposé.

 


Les ellipses de confiance et de tolérance

Les Ellipses de Confiance et de Tolérance permettent de définir des régions autour de nuages de points décrivant les différentes catégories de variables supplémentaires dans un plan d’une analyse factorielle.

Plus généralement, elles permettent de définir les régions de confiance autour des centres de gravité de groupes définis par différentes catégories.

Ellipses de confiance et de tolérance sont proposées. Le choix du niveau de risque alpha est possible et pour les ellipses de confiance, les calculs peuvent se faire sous l’hypothèse d’un échantillon de taille finie ou de taille infinie.

Des graphiques permettent de visualiser les différentes ellipses, les centres de gravité, les codes des catégories et les numéros des points.

Tous les résultats sont automatiquement sauvegardés sur fichier et un rapport général de synthèse est proposé.

 


L’analyse factorielle multiple

L’Analyse factorielle multiple est spécialement conçue pour étudier une population d’individus caractérisés par un certain nombre de groupes de variables.

Ces groupes de variables peuvent être constitués de variables mesurées à différents instants, mais aussi de sous-tableaux issus d’un seul tableau: ces sous-tableaux correspondent alors à des regroupements de variables selon des critères.

Après l’affichage du tableau et de l’histogramme des inerties, vous pouvez choisir le nombre d’axes factoriels à extraire.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Un rapport général de synthèse est proposé ainsi que les graphiques des cercles factoriels, des plans factoriels du compromis, de l’interstructure, de l’intrastructure et des trajectoires des individus.

De nombreux outils d’aide à l’interprétation sont fournis, notamment coefficients de liaison, comparaison des projections du compromis et des groupes, contributions, cosinus carrés, distances à l’origine pour les individus et les groupes.

 


La méthode Statis

La méthode Statis (Structuration de Tableaux A Trois Indices de la Statistique) permet l’exploration simultanée de plusieurs tableaux de données.  Elle s’applique à des données quantitatives qui sont des tableaux de mesures recueillis en différentes occasions sur les mêmes individus, les variables pouvant être éventuellement différentes selon les tableaux.  Si le tableau croise les mêmes individus et les mêmes variables, il peut être intéressant de réaliser également une analyse par la méthode Statis duale.

Après l’affichage du tableau et de l’histogramme des inerties, vous pouvez choisir le nombre d’axes factoriels à extraire.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Un rapport général de synthèse est proposé ainsi que les graphiques des plans factoriels du compromis (individus), de l’interstructure (groupes des variables) et de l’intrastructure (individus et trajectoires des individus).

De nombreux outils d’aide à l’interprétation sont fournis, notamment normes et traces des groupes, coefficients RV, distances entre les groupes, décompositions de ces distances par individu, pondérations des groupes, résultats pour les groupes et le compromis (distances à l’origine, contributions, cosinus carrés) ainsi que pour les individus pour les divers groupes.

 


La méthode Statis duale

La méthode Statis duale (Structuration de Tableaux A Trois Indices de la Statistique) permet l’exploration simultanée de plusieurs tableaux de données.  Elle s’applique à des données quantitatives qui sont des tableaux de mesures recueillis en différentes occasions sur les mêmes variables, les individus pouvant être éventuellement différents selon les tableaux.  Si le tableau croise les mêmes variables et les mêmes individus, il peut être intéressant de réaliser également une analyse par la méthode Statis.

Après l’affichage du tableau et de l’histogramme des inerties, vous pouvez choisir le nombre d’axes factoriels à extraire.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Un rapport général de synthèse est proposé ainsi que les graphiques des plans factoriels du compromis (variables), de l’interstructure (groupes des variables) et de l’intrastructure (variables et trajectoires des variables).

De nombreux outils d’aide à l’interprétation sont fournis, notamment matrices des corrélations pour les groupes, inerties des groupes, normes des groupes, produits scalaires normés et distances entre les matrices des corrélations, décompositions de ces distances par variable, pondérations des matrices des corrélations, matrice des corrélations du compromis, produits scalaires et distances entre la matrice compromis et les matrices des groupes, résultats pour les groupes et le compromis (distances à l’origine, contributions, cosinus carrés) ainsi que pour les variables pour les divers groupes.

 


L’analyse factorielle de données mixtes

L’Analyse Factorielle de Données Mixtes est une méthode spécialement conçue pour permettre l’étude simultanée de variables quantitatives et qualitatives (données dites mixtes) mesurées sur une population d’individus en tant qu’éléments actifs dans une même analyse.

Cette analyse prend en compte les variables quantitatives comme une analyse en composantes principales normée (ACP) et les variables qualitatives comme une analyse des correspondances multiples (ACM).

Après l’affichage du tableau et de l’histogramme des inerties, vous pouvez choisir le nombre d’axes factoriels à extraire.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Un rapport général de synthèse est proposé ainsi que les graphiques des cercles factoriels, des représentations simultanées des variables quantitatives et qualitatives, des plans factoriels des individus et des modalités.

De nombreux outils d’aide à l’interprétation sont fournis, notamment pondérations des indicatrices des variables qualitatives, liaisons entre les variables initiales, contributions des variables à l’inertie et pour les plans factoriels les contributions et cosinus carrés.

 


L’analyse discriminante pas à pas

L’Analyse Discriminante Pas à Pas permet de sélectionner à partir d’un ensemble de variables quantitatives et d’une variable qualitative découpant la population en plusieurs groupes (2 ou plus), le sous-ensemble des variables quantitatives les plus explicatives des groupes qui seront alors utilisées pour définir des fonctions discriminantes robustes.

La méthode proposée permet de préciser les valeurs des Fisher pour l’entrée et la sortie d’une variable, les critères d’arrêt de l’algorithme (variation minimale du lambda de Wilks si plus de 2 groupes ou de la distance de Mahalanobis si 2 groupes, nombre maximal de variables à sélectionner, nombre maximal d’itérations).

La méthode itérative peut être «manuelle» (affiche toutes les étapes) ou «automatique» (affiche seulement le tableau final). L’algorithme est formé d’une succession d’étapes ascendantes (entrée d’une variable) et descendantes (sortie d’une variable).

Tous les résultats sont automatiquement sauvegardés sur fichier.

Un rapport général de synthèse est proposé: il permet de visualiser toutes les étapes de l’algorithme.

Cette méthode peut être complétée par une Analyse Discriminante Bayesienne ou par une Analyse Discriminante Géométrique.

 


L’analyse factorielle discriminante

L’Analyse Factorielle Discriminante est une méthode géométrique permettant de construire à partir d’un ensemble de variables quantitatives et d’une variable qualitative découpant la population en plusieurs groupes (2 ou plus), des fonctions discriminantes qui les séparent au mieux dans l’échantillon d’apprentissage (population de base).

La méthode réalise d’abord l’analyse sur une population de base, puis sur une population de test et enfin sur une population d’anonymes.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Des tableaux résumés et détaillés des classement sont calculés. Un rapport général de synthèse est proposé ainsi que des graphiques des plans factoriels.

 


L’analyse discriminante bayesienne

L’Analyse Discriminante Bayesienne (ou Stochastique) permet de construire à partir d’un ensemble de variables quantitatives et d’une variable qualitative découpant la population en plusieurs groupes (2 ou plus), des fonctions discriminantes qui définissent une règle de décision optimale à partir de laquelle on peut affecter des individus tests ou anonymes aux différents groupes. Cette technique suppose que l’on connaisse a priori les probabilités d’appartenance aux différents groupes et que les données suivent une loi multi-normale.

La méthode proposée permet de traiter les cas linéaire (égalité des matrices de variances) et quadratique (non-égalité des matrices de variances).

L’entrée des probabilités a priori est proposée. Par défaut le système utilise les probabilités issues des fréquences des groupes dans les données entrées.

La méthode réalise d’abord l’analyse sur une population de base, puis sur une population de test et enfin sur une population d’anonymes.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Des tableaux résumés et détaillés des classement sont calculés. Un rapport général de synthèse est proposé ainsi que des graphiques des plans factoriels.

 


L’analyse discriminante qualitative

L’Analyse Discriminante Qualitative est une généralisation de l’Analyse Factorielle Discriminante dans le cas où les variables explicatives sont qualitatives et non plus quantitatives. La première étape de l’analyse consiste à mettre en œuvre une Analyse des Correspondances Multiples des variables qualitatives. La deuxième étape remplace les variables qualitatives d’origine par les coordonnées sur les axes factoriels issus de l’ACM et effectue sur ces données une Analyse Factorielle Discriminante.

Les fonctions discriminantes sont ensuite exprimées en fonction des indicatrices des modalités des variables qualitatives d’origine.

La méthode réalise d’abord l’analyse sur une population de base, puis sur une population de test et enfin sur une population d’anonymes.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Des tableaux résumés et détaillés des classements sont calculés.  Un rapport général de synthèse est proposé ainsi que des graphiques des cercles et plans factoriels.

 


Scoring

Le Scoring est une technique permettant de classer des individus caractérisés par des variables descriptives qualitatives dans deux catégories préexistantes en leur affectant un score d’appartenance. La première étape de cette technique consiste à transformer les variables descriptives qualitatives d’origine en coordonnées sur les axes factoriels issus d’une Analyse des Correspondances Multiples des variables qualitatives. La deuxième étape est une Analyse Factorielle Discriminante de ces données, avec une possible sélection des axes factoriels significatifs de l’ACM. La fonction discriminante obtenue est ensuite exprimée en fonction des indicatrices des modalités des variables qualitatives d’origine et les coefficients de la fonction de score sont évalués. L’analyse se poursuit en calculant les scores des individus, la sensibilité, la spécificité, le niveau de qualité ROC et l’indice de Gini pour la courbe Lift.

Un rapport général de synthèse est proposé ainsi que des graphiques des coefficients de la fonction de score, des courbes de répartition (avec ou sans zone d’indécision), des courbes de densité, de la courbe ROC et de la courbe Lift.

Des tableaux résumés et détaillés des classements de l’Analyse Factorielle Discriminante et du Scoring sont calculés.

Une option Simulation permet de visualiser l’évolution du score d’un individu en fonction des modifications de ses modalités.

sco

Les principaux résultats du scoring peuvent être sauvegardés à la demande sur fichier.

L’étude d’une population nouvelle d’anonymes est également proposée.

 


La régression sur composantes principales

La méthode de Régression sur Composantes Principales est une technique de régression utile lorsque de fortes colinéarités entre les variables explicatives sont présentes et que l’on ne désire pas utiliser les algorithmes de régression pas à pas pour éliminer les variables corrélées entre elles ou la régression Ridge.

Cette technique utilise à la fois l’Analyse en Composantes Principales et la Régression Multiple pour élaborer un modèle dont les coefficients sont stables.

Après l’affichage du tableau et de l’histogramme des inerties, vous pouvez choisir le nombre d’axes factoriels à extraire.

Tous les résultats sont automatiquement sauvegardés sur fichier.

Un rapport général de synthèse est proposé contenant notamment les résultats de l’Analyse en Composantes Principales, les descriptions des différents modèles de régression et le tableau de l’analyse de la variance.

Les graphiques des cercles factoriels, des plans factoriels, des régressions, des composants et des résidus sont également disponibles.