Science des données biologiques

Réalisé par le service d'Écologie numérique des Milieux aquatiques, Université de Mons (Belgique)

Préambule

Si vous n’avez jamais utilisé de tutoriel “learnr”, familiarisez-vous d’abord avec son interface ici.

Conformément au RGPD (Règlement Général sur la Protection des Données), nous sommes tenus de vous informer de ce que vos résultats seront collectés afin de suivre votre progression. Les données seront enregistrées au nom de l’utilisateur apparaissant en haut de cette page. Corrigez si nécessaire ! En utilisant ce tutoriel, vous marquez expressément votre accord pour que ces données puissent être collectées par vos enseignants et utilisées pour vous aider et vous évaluer. Après avoir été anonymisées, ces données pourront également servir à des études globales dans un cadre scientifique et/ou éducatif uniquement.

Objectifs

  • Vérifier l’acquisition des notions relatives aux remaniement des données avec les fonctions select(), filter(), mutate(), group_by(), summarise()
  • Vérifier l’acquisition des données relatives aux chainages des intructions

Remaniement des données & chainage

Le remaniement des données est indispensable lors d’une analyse de données. Pour vérifier l’acquisition de ces compétences, le jeu de données sur la biométrie des crabes est employée.

Calcule de nouvelles variables

Calculez :

  • le logarithme de la longueur de la carapace des crabes et nommez cette nouvelle variables length_log
  • la racine carrée de la largueur de la carapace et nommez cette nouvelle variable width_sqrt
  • Divisez la variable front par 1000 et nommez cette nouvelle variable front_m

Affichez ensuite les 6 premières lignes du tableau.

Nom du jeu de données et des variables importantes

variable <- c("crabs", names(crabs), "log()", "sqrt()", "*", "head()")
sample(variable)
 [1] "length"  "log()"   "front"   "depth"   "sex"     "species" "sqrt()" 
 [8] "head()"  "width"   "index"   "crabs"   "*"       "rear"   

remarque : l’ensemble des variables ci-dessus ne sont pas à employer dans cet exercice.

Vous devez obtenir le tableau ci-dessous :

# Mutate
crabs %>.% mutate(., 
                  length_log = log(length),
                  width_sqrt = sqrt(width),
                  front_m = front/1000) -> crabs
# Visualisation des premières lignes du tableau 
head(crabs)
# Not yet...

Filtre et sélection de données

Reprennons le jeu de données initial sur la biométrie des crabes

Réalisez les opérations suivantes

  • Retirer la variable index du jeu de données
  • Garder uniquement les individus mâles du jeu de données dont la longeur de la carapace est supérieur à 25 mm
  • Affichez ensuite les 6 premières lignes du tableau

Employez le chainage pour résoudre cette exercice.

Nom du jeu de données et des variables importantes

variable <- c("crabs", names(crabs), "filter", "select", "head" )
sample(variable)
 [1] "head"    "front"   "filter"  "length"  "index"   "rear"    "select" 
 [8] "sex"     "width"   "crabs"   "depth"   "species"

remarque : l’ensemble des variables ci-dessus ne sont pas à employer dans cet exercice.

Vous devez obtenir le tableau ci-dessous

crabs %>.%
  select(., - index) %>.%
  filter(., sex == "M" & length >= 25) %>.%
  head(.)
# Not yet...

Résumé des données

Reprennons le jeu de données initial sur la biométrie de crabes

Réalisez les opérations suivantes

  • Sélectionnez les individus dont la longueur est strictement supérieur à 25 mm
  • Résumez le jeu de données par le sex et par la variété de Leptograpsus variegatus
    • Calculez la moyenne de la largeur des carapaces par groupe
    • Dénombrez les individus par groupe
  • Formatez votre tableau avec la fonction kable()

Employez le chainage pour résoudre cette exercice.

Nom du jeu de données et des variables importantes

 [1] "front"      "species"    "kable()"    "filter()"   "depth"     
 [6] "n()"        "width"      "mean()"     "sex"        "index"     
[11] "length"     "crabs"      "rear"       "group_by()"

remarque : l’ensemble des variables ci-dessus ne sont pas à employer dans cet exercice.

Vous devez obtenir le tableau ci-dessous

species sex mean number
B F 36.51818 33
B M 39.57073 41
O F 40.18696 46
O M 39.04773 44
library(knitr)
crabs %>.%
  filter(., length > 25) %>.%
  group_by(., species) %>.%
  summarise(., mean = mean(width), number = n()) %>.%
  knitr::kable(.)
# Not yet...

Conclusion

Bravo! Vous venez de terminer votre séance d’exercices dans un tutoriel “learnr”.

Laissez nous vos impressions sur cet outil pédagogique ou expérimentez encore dans la zone ci-dessous. Rappelez-vous que pour placer un commentaire dans une zone de code R, vous devez utilisez un dièse (#) devant vos phrases.

# Ajout de commentaires 
# ...
# Not yet...

Traitement des données I

Guyliann Engels & Philippe Grosjean