Science des données biologiques

Réalisé par le service d'Écologie numérique des Milieux aquatiques, Université de Mons (Belgique)

Préambule

Si vous n’avez jamais utilisé de tutoriel “learnr”, familiarisez-vous d’abord avec son interface ici.

Conformément au RGPD (Règlement Général sur la Protection des Données), nous sommes tenus de vous informer de ce que vos résultats seront collecté afin de suivre votre progression. Les données seront enregistrées au nom de l’utilisateur apparaissant en haut de cette page. Corrigez si nécessaire ! En utilisant ce tutoriel, vous marquez expressément votre accord pour que ces données puissent être collectées par vos enseignants et utilisées pour vous aider et vous évaluer. Après avoir été anonymisées, ces données pourront également servir à des études globales dans un cadre scientifique et/ou éducatif uniquement.

Objectifs

  • Comprendre les différentes variantes du test t de Student et être capable de l’utiliser pour résoudre des questions pratiques en biologie

  • Connaître également le test de Wilcoxon-Mann-Withney, et pouvoir déterminer quand l’utiliser à la place du test de Student

test de student

mCPP

Vous avez à votre disposition un jeu de données dont la thématique est la perte de poids. Des chercheurs se sont intéressés à l’effet du mCPP sur l’appétit de 2 groupes de patients obèses. Un groupe va recevoir le comprimé contenant le mCPP et le second un comprimé placébo. Chaque patient est pesé au début et à la fin de l’expérience pour déterminer la variation de poids. Aidez les chercheurs a déterminer si le mCPP a un effet sur la perte de poids.

weight <- c(0.00, -1.10, -1.60, -0.30, -1.10, -0.90, -0.50, 0.70, -1.20,
           -1.10, 0.50, 0.50, 0.00, -0.50, 1.30, -1.40, 0.00, -0.80,
           -1.10, -1.30, -1.00, -1.70, -1.40, - 0.10, - 0.50, -1.60, 0.50,
           0.00, 0.30, -0.60, -0.30, 0.70, 0.20, -0.60, -0.90, 2.00)
mcpp <- data_frame(weight = weight, gender = rep(c("M","F"), each = 18), treatment = rep(c("mcpp","placebo", "mcpp", "placebo"), each = 9), )
Warning: `data_frame()` is deprecated, use `tibble()`.
This warning is displayed once per session.
mcpp$gender <- factor(mcpp$gender, levels = c("M", "F"))
mcpp$treatment <- factor(mcpp$treatment, levels = c("placebo", "mcpp"))

mcpp
weight <- c(0.00, -1.10, -1.60, -0.30, -1.10, -0.90, -0.50, 0.70, -1.20,
           -1.10, 0.50, 0.50, 0.00, -0.50, 1.30, -1.40, 0.00, -0.80,
           -1.10, -1.30, -1.00, -1.70, -1.40, - 0.10, - 0.50, -1.60, 0.50,
           0.00, 0.30, -0.60, -0.30, 0.70, 0.20, -0.60, -0.90, 2.00)
mcpp <- data_frame(weight = weight, gender = rep(c("M","F"), each = 18), treatment = rep(c("mcpp","placebo", "mcpp", "placebo"), each = 9), )

mcpp$gender <- factor(mcpp$gender, levels = c("M", "F"))
mcpp$treatment <- factor(mcpp$treatment, levels = c("placebo", "mcpp"))

Le jeu de données mcpp comprend 3 variables dont la variable facteur treatment qui comprend 2 niveaux.

levels(mcpp$treatment)
[1] "placebo" "mcpp"   

Représentez graphiquement la masse en fonction du traitement adiminstré.

Le snippet pour réaliser une boite de dispersion est .cbbox et renvoit les instructions suivantes :

chart(data = DF, YNUM ~ XFACTOR) +
  geom_boxplot()
chart(data = mcpp, weight ~ treatment) +
  geom_boxplot()
#TODO

Le test de student a plusieurs conditions d’application que vous devez à chaque fois évaluer

  • échantillon représentatif (échantillonnage aléatoire et individus indépendants les uns des autres),
  • observations indépendantes les unes des autres,
  • distribution de la population :
    • normale, alors le test basé sur la distribution t de Student sera exact,
    • approximativement normale, le test sera approximativement exact,
    • non normale, le test sera approximativement exact si n est grand.

Réalisez un test de student afin d’aider les scientifiques dans cette étude en vous assurant de la validité des conditions d’applications

Le snippet pour réaliser un test de student d’indépendance est .hmtestindep et renvoit les instructions suivantes :

t.test(data = DF, YNUM ~ XFACTOR,
  alternative = "two.sided", conf.level = 0.95, var.equal = TRUE)

Attardez vous d’abord sur la compréhension de chacun des arguments de la fonction.

  • data = DF : vous devez spécifier le nom de jeu de données
  • YNUM ~ XFACTOR : vous devez spécifier sous forme de formule les variables que vous souhaitez étudier
  • alternative = “two.sided” : vous devez spécifier si le test est
    • un test bilatéral : “two.sided”
    • un test unilatéral à droite : “less”
    • un test unilatéral à gauche : “greater”
  • conf.level = 0.95 : vous devez spécifier l’intervalle de confiance de votre expérience.
  • var.equal = TRUE : Si les variances de vos sous populations sont équivalentes, indiquez var.equal = TRUE.

Lorsque les observations sont peu nombreuses (moins de 30 observations par groupe), il est conseillé d’employé le test de Welch qui est une variante du test de student lorsque la variance est considérée comme non homogènes (var.equal = FALSE)

t.test(data = mcpp, weight ~ treatment,
  alternative = "greater", conf.level = 0.95, var.equal = FALSE)
#TODO
Quiz

Dopamine

Ce neurotransmetteur a un effet sur la motivation, la curiosité (augmentation de la fréquence cardiaque,…) Une baisse de la dopamine peut être mise en corrélation avec la dépression, la phobie sociale,…Un taux anormalement haut de dopamine peut être mis en corrélation avec les addictions, la schizophrénie,…

Le toluène est une molécule organique très employée dans un ensemble de procédés chimiques. Ce composant affecte premièrement le système nerveux central. Les chercheurs ont étudié l’effet de ce dernier sur des rats. Ils ont dosé la dopamine comme indicateur de l’état de santé des rats. Le toluène a t’il donc un effet sur la concentration en dopamine dans le cerveau ? Sur 12 rats étudiés, 6 sont exposés au toluène et 6 sont utilisés comme contrôle.

dopamine <- data_frame(treatment = rep(c("Cont", "Tol"), each = 6), 
                      concentration = c(1.820, 1.843, 1.397, 1.803, 2.539, 
                                        1.990, 3.420, 2.314, 1.911, 2.464, 
                                        2.781, 2.803))
dopamine$treatment<- as.factor(dopamine$treatment)
dopamine
dopamine <- data_frame(treatment = rep(c("Cont", "Tol"), each = 6), 
                      concentration = c(1.820, 1.843, 1.397, 1.803, 2.539, 
                                        1.990, 3.420, 2.314, 1.911, 2.464, 
                                        2.781, 2.803))
dopamine$treatment<- as.factor(dopamine$treatment)

Le jeu de données dopamine comprend 2 variables dont la variable facteur treatment qui comprend 2 niveaux.

levels(dopamine$treatment)
[1] "Cont" "Tol" 

Réalisez un résumé des données en fonction du traitement administré.

[1] "sd"            "mean"          "summarise"     "dopamine"     
[5] "concentration" "group_by()"    "treatment"     "%>.%"         
dopamine %>.% 
  group_by(., treatment) %>.%
  summarise(., mean = mean(concentration), sd = sd(concentration))
#TODO

Réalisez un test de student afin de mettre en avant l’effet du toluène sur la concentration en dopamine.

Le snippet pour réaliser un test de student d’indépendance est .hmtestindep et renvoit les instructions suivantes :

t.test(data = DF, YNUM ~ XFACTOR,
  alternative = "two.sided", conf.level = 0.95, var.equal = TRUE)
t.test(data = dopamine, concentration ~ treatment,
  alternative = "two.sided", conf.level = 0.95, var.equal = FALSE)
#TODO
Quiz

Test de Wilcoxon-Mahn-Withney

Lorsque que vos observations ne sont peu nombreuses et que ces dernières ne suivent pas une distribution normal vous pouvez faire le choix de réaliser une version non-paramétrique du test de student. Il s’agit du test de Wilcoxon-Mahn-Withney.

Réalisez le test de Wilcoxon-Mahn-Withney sur les données lié à la perte de poids

Le snippet pour réaliser un test de student d’indépendance est .hnwilkindep et renvoit les instructions suivantes :

wilcox.test(data = DF, YNUM ~ XFACTOR,
  alternative = "two.sided", conf.level = 0.95)

Vous pouvez obsever que la structure de la fonction wilcox.test() est similaire à t-test().

wilcox.test(data = mcpp, weight ~ treatment,
  alternative = "greater", conf.level = 0.95)
#TODO
Quiz

Réalisez le test de Wilcoxon-Mahn-Withney sur les données lié à la concentration en dopamine

Le snippet pour réaliser un test de student d’indépendance est .hnwilkindep et renvoit les instructions suivantes :

wilcox.test(data = DF, YNUM ~ XFACTOR,
  alternative = "two.sided", conf.level = 0.95)
wilcox.test(data = dopamine, concentration ~ treatment,
  alternative = "two.sided", conf.level = 0.95)
#TODO

Puissance d’un test

Quiz

Conclusion

Bravo! Vous venez de terminer votre séance d’exercices dans un tutoriel “learnr”.

Laissez nous vos impressions sur cet outil pédagogique ou expérimentez encore dans la zone ci-dessous. Rappelez-vous que pour placer un commentaire dans une zone de code R, vous devez utilisez un dièse (#) devant vos phrases.

# Ajout de commentaires 
# ...
# Not yet...

Traitement des données I

Guyliann Engels & Philippe Grosjean