Logiciel CORExpress - Régressions par composantes corrélées (CCR) - Sigma Plus

statistical_innovation.gif

CORExpress

Régressions par composantes corrélées
et sélection de variables

statistical_innovation.gif




Cliquer dans l'image pour afficher le tutoriel.

"CORExpress is the first professional software product specialized to predictor selection in high dimensional regression. I strongly recommend its use.

As all Statistical Innovations products, CORExpress is at the same time very powerful and very easy to use. In particular, I am sure that CCR will become the new standard for sparse PLS regression."

Michel Tenenhaus, Professeur émérite, HEC Paris

La modélisation par les méthodes de régression subit actuellement une révolution car les nombres de prédicteurs disponibles sont désormais fréquemment des centaines ou des milliers, notamment en génomique mais également dans d'autres secteurs.

Des problèmes avec les méthodes usuelles surviennent alors lorsque le nombre de prédicteurs approche ou dépasse le nombre d'observations. Dans ces cas de données à grandes dimensions, les modèles habituels deviennent peu fiables et les estimations des coefficients peuvent être impossibles.

La nouvelle technique de régression par composantes corrélées (CCR) apporte la solution à ces problèmes dans le logiciel CORExpress.

Qu'est-ce que que CORExpress ?

CORExpress met à disposition de nouvelles méthodes de régression et de classement par composantes corrélées (Component Correlated Regression ou CCR) pour :

  • la régression linéaire

  • la régression logistique

  • l'analyse discriminante linéaire

  • la régression de Cox (modèles de survie)

La régression PLS est présente et par utilisation des techniques de sélection de variables, une "sparse PLS regression" est également disponible.

COREXpress gère efficacement les multicolinéarités présentes lorsque les prédicteurs sont corrélés y compris dans les cas de données de grandes dimensions (plus de variables que d'observations).

Quelles propriétés des modèles de régression sont améliorées ?

 CORExpress améliore :

  • l'interprétation des coefficients de régression (voir le tutoriel 1 dans la page Téléchargement)

  • les prévisions pour de nouvelles observations (voir le tutoriel 2 dans la page Téléchargement)

  • le classement en analyse discriminante (voir le tutoriel 3 dans la page Téléchargement)

  • la sélection des variables (voir les tutoriels 1, 2 et 3 dans la page Téléchargement)

Comment fonctionne CORExpress ?

  • CORExpress élabore des modèles de régression en utilisant des techniques de régression par composantes corrélées (CCR). Ces techniques ont été développées par Dr. Jay Magidson pour, de façon simultanée, estimer les modèles de régression et sélectionner les prédicteurs dans un large ensemble de prédicteurs candidats. Des modèles fiables sont obtenus en utilisant un algorithme rapide incorporant la validation croisée à M blocs pour optimiser les paramètres de régularisation (nombres de composantes et de prédicteurs).

  • Les modèles obtenus peuvent même inclure plus de prédicteurs que d'observations, ce qui est impossible avec les régressions usuelles.

Comment en savoir plus sur CORExpress ?

Sélectionner dans le menu à gauche l'option Fonctionnalités pour un descriptif de la méthode de régression par composantes corrélées.

Sélectionner dans le menu à gauche l'option Téléchargement pour télécharger des tutoriels et articles, le manuel de l'utilisateur de CORExpress ainsi qu'une version d'évaluation du logiciel utilisant les fichiers d'exemples mis à disposition.

NOTE: Si vous souhaitez tester le logiciel sur vos propres données, merci de nous contacter par email à ccharles@sigmaplus.fr.
 


Envoyer message

Plan du site    Contact