Science des données biologiques 2

Réalisé par le service d'Écologie numérique des Milieux aquatiques, Université de Mons (Belgique)

Préambule

Si vous n’avez jamais utilisé de tutoriel “learnr”, familiarisez-vous d’abord avec son interface ici.

Ne vous trompez pas dans votre adresse mail et votre identifiant Github

N’oubliez pas de soumettre votre réponse après chaque exercice

Conformément au RGPD (Règlement Général sur la Protection des Données), nous sommes tenus de vous informer de ce que vos résultats seront collecté afin de suivre votre progression. Les données seront enregistrées au nom de l’utilisateur apparaissant en haut de cette page. Corrigez si nécessaire ! En utilisant ce tutoriel, vous marquez expressément votre accord pour que ces données puissent être collectées par vos enseignants et utilisées pour vous aider et vous évaluer. Après avoir été anonymisées, ces données pourront également servir à des études globales dans un cadre scientifique et/ou éducatif uniquement.

Régression linéaire

Réalisez une régression linéaire simple sur le jeu de données df1 de la variable y en fonction de la vairable x

Vous avez à votre disposition le graphique suivant pour visualiser les données

# edition de l'exercice 
set.seed(42)

reg_lin <- function(x, a, b){
  y <- a*x + b
  y
}

vec1 <- seq(from = 5, to = 20, by = 0.25)
vec2 <- vec1 + rnorm(sd=0.5, n = length(vec1))

df1 <- tibble(
  x = vec2,
  y = reg_lin(vec2, 0.5, 0) + rnorm(sd=0.5, n = length(vec1)))
#
summary(df1)
#snippet
summary(lm. <- lm(data = DF, YNUM ~ XNUM))
lm. %>.% (function (lm, model = lm[["model"]], vars = names(model))
  chart(model, aes_string(x = vars[2], y = vars[1])) +
  geom_point() +
  stat_smooth(method = "lm", formula = y ~ x))(.)
#snippet 2
summary(lm. <- lm(data = DF, YNUM ~ XNUM + 0))
lm. %>.% (function (lm, model = lm[["model"]], vars = names(model))
  chart(model, aes_string(x = vars[2], y = vars[1])) +
  geom_point() +
  stat_smooth(method = "lm", formula = y ~ x + 0))(.)
summary(lm. <- lm(data = df1, y~ x+ 0))
lm. %>.% (function (lm, model = lm[["model"]], vars = names(model))
  chart(model, aes_string(x = vars[2], y = vars[1])) +
  geom_point() +
  stat_smooth(method = "lm", formula = y ~ x + 0))(.)
# TODO 

Suite à votre analyse répondez aux questions suivantes

Quiz

Régression linéaire multiple

Réalisez une régression linéaire simple sur le jeu de données df2 de la variable y en fonction de la variable x et x1

# edition de l'exercice 
set.seed(42)

vec <- seq(from = 1, to = 15, by = .2) 
x <- vec + rnorm(sd = 3, n = length(vec))

reg_lin_rand <- function(x, a, b, random = 0.5){
  y <- (a*x) + b + rnorm(sd=random, n = length(x))
  y 
}
reg_mutli3_rand <- function(x1, a1, x2, a2, x3, a3, b, random = 5){
  y <- a1*x1 + a2*x2 + a3*x3 + b + rnorm(sd=random, n = length(x1))
  y
}

df2 <- tibble::tibble(
  x = x,
  x0 = reg_lin_rand(x = x, a = 1.26, b = 2, random = 3.5),
  x1 = reg_lin_rand(x = x, a = 1.5, b = 1, random = 10),
  y = reg_mutli3_rand(x1 = x,
                x2 = x0, 
                x3 = x1,
                a1 = 0.2, a2 = 0.3, a3 = 1.1,
                b = 2))
# résumé des données 
df2
#
# Snippet
summary(lm. <- lm(data = DF, FORMULA))
summary(lm. <- lm(data = DF, formula =  Y  ~ VAR1 + VAR2))
summary(lm. <- lm(data = df2, formula = y ~ x + x1))
#TODO

Suite à votre analyse répondez aux questions suivantes :

Quiz

Conclusion

Vous venez de terminer votre séance d’exercice.

Laissez nous vos impressions sur cet outil pédagogique ou expérimentez encore dans la zone ci-dessous. Rappelez-vous que pour placer un commentaire dans une zone de code R, vous devez utilisez un dièse (#) devant vos phrases.

# Ajout de commentaires 
# ...
# Not yet...

Guyliann Engels & Philippe Grosjean