Ce TP est basé sur un document initialement rédigé par Boris Hejblum et repris par Robin Genuer.
Charger mixOmics
et les données correspondant à notre étude
library(mixOmics)
data(liver.toxicity)
(Bushel, Wolfinger, and Gibson 2007)
Le schéma de l’étude est le suivant:
Mesure de l’expression de 3116 gènes et de 10 variables biochimiques chez 64 rats (mâles)
Les rats sont répartis en 3 groupes exposés à différentes doses d’acetaminophen (paracétamol) :
non toxique (50 or 150 mg/kg)
toxique (1500 mg/kg)
très toxique (2000 mg/kg)
Les prélèvements (dans le foie) ont eu lieu à 6, 18, 24 ou 48 heures après l’exposition.
On ne va considérer que le problème de régression. Il faut donc expliquer, pour les 64 rats, les 10 variables biochimiques en fonction des 3116 gènes, ou plutôt des gènes intéressants.
Pour celà on propose le protocole suivant :
Tuner les différents paramètres de façon adequat afin de considérer un modèle précis.
Commenter les performances de ce modèle et donner les représentations classiques de ce dernier :
Représentation des individus, discriminer visuellement les individus grâce aux conditions expérimentales (doses de paracétamol et dates de prélèvement).
Représentation des variables.
Utiliser une cim
si le temps vous le permet.
A chaque fois commenter les résultats obtenus.
Suivre ce protocole!
Bushel, Pierre R, Russell D Wolfinger, and Greg Gibson. 2007. “Simultaneous Clustering of Gene Expression Data with Clinical Chemistry and Pathological Evaluations Reveals Phenotypic Prototypes.” BMC Systems Biology 1 (1). BioMed Central: 15.