Data Sciences en Biologie [DSB]
Séances et Documents - Année Universitaire 2021-2022
Espace Numérique de Travail (ENT) - Enseignement Numérique (EN)
|
|
|
|
|
|
|
|
|
Le billet de l'UE
Bonjour Ă toutes et Ă tous et bienvenue dans cette nouvelle UE Data Sciences en Biologie [DSB]!
Sauf contre-ordre de nos instances, l'enseignement aura lieu en présentiel.
En complément, quelques vidéos de cours sont proposés sur ce site. Ces vidéos sont consultables à n'importe quel moment ; il ne s'agit pas d’enseignement distanciel à heures fixées.
Notre premier rendez-vous en présentiel : jeudi 27 janvier à 13h30 à l'amphi F1 du Bât.452. Je vous ferai un cours introductif avant de vous répartir (en deux groupes) en salle info. Je vous expliquerai l'organisation de l'enseignement et vous parlerai des projets qui seront réalisés en équipe (équipes-projets).
Il me reste à vous souhaiter beaucoup de plaisir et de découvertes intéressantes dans cette nouvelle formation. Vous le verrez, nous aurons l'occasion de faire des jeux et de relever des défis (je vous expliquerai le principe du contrôle continu).
Comme vous devez vous en doutez, rien ne pourra se faire sans vous. Je compte sur votre précieuse complicité pour mener à bien notre aventure commune qui, vous le verrez, est très ambitieuse.
Bien Ă vous.
Votre enseignant,
Pascal RIGOLET
[dernière mise à jour le 22/01/2022]
PARTIE DU SITE EN COURS DE DEVELOPPEMENT - PROCHAINEMENT OPERATIONNEL
Les mots clés de la semaine :
Data Sciences ; machine learning ; apprentissage ;
Présentation de l'UE Data Sciences en Biologie [DSB]
|
Présentation de l'enseignement (fichier pdf) |
Plans des séances, diaporamas projetés en cours, vidĂ©os et documents associĂ©s
> Le découpage en séances proposé ici est indicatif et ne suit pas celui réellement suivi
> Chaque séance est couplée à un ou plusieurs compléments numériques à distance
|
SĂ©ance 1 - Introduction : Qu'est-ce que les data sciences? |
|
Vous avez entendu parler de Data Sciences mais vous vous demandez encore ce que cela peut bien être et ce qui se cache derrière ce concept. C’est vrai qu’avec la foison d’informations qui sont diffusées par les médias ou disponibles sur internet on a un peu de mal à faire la part des choses concernant cette approche multidisciplinaire émergente. On trouve un peu tout et n’importe quoi sur ce domaine.Cette section devrait vous aider à y voir plus clair et tenter de vous expliquer tout cela de la façon la concise et la plus simple qui soit. Ce sera l'occasion de revisiter les types de variables utilisées dans le traitement des données, notammment en statistique puis de découvrir comment sont codées et structurées les informations dans le chemin qui part des data et conduit jusqu'au Big Data. |
|
SĂ©ance 2 - Le/la data scientiste, un mouton Ă cinq pattes. |
|
Plutôt que d'aller chercher la perle rare qui maîtrise toutes les diciplines des data sciences, il vaut mieux réaliser que les data sciences regroupent un ensemble de disciplines complémentaires. Dès lors, qu'est-ce qu'on peu attendre d'une personne qui se présente avec l'étiquette de scientististe et quelle formation peut-on lui conseiller? |
|
SĂ©ance 3 - La part des logiciels |
|
Cette section est composée de petits ateliers qui vont vous permettre de vous former à quelques uns des logiciels employés par les data scientistes. |
|
Atelier 1 - Conception et traitement d'un jeu de données |
|
Cette section est composée d'un atelier pratique qui va vous permettre d'apprendre à concevoir un jeu de données dans différents formats et de le traiter avec les logiciels et outils statistques appropriés. Il nous faudra composer notammment avec les prérequis et se poser le question de la véracité des données, de la confiance qu'on peut leur accorder (sur plusieurs critères) avant de les analyser. Il faudra également être très vigilant sur la précision et les unités de ces données. Cetaines questions comme "qui, où, quand, quoi, comment?" seront de rigueur dans l'exploitation de ce premier jeu de données. Il faudra bien distinguer l'information à expliquer (souvent associée à des mesures) et l'information explicative (variables fixées ou considérées comme telles) et bien faire la part des tpyes de variables apparaissant dans le jeu de données. |
A propos des projets
Etc.....
Bon apprentissage!
Téléchargements des Logiciels
|
Rcommander (choisissez la langue de votre version) |
|
Jamovi (interface différent + options d'affichages. Environnement ressembant à celui de SPSS) |
Les Fichiers de Données
Scripts de commandes R
Fichiers EXCEL
Quelques tutoriaux
Fiches Pratiques
je recherche des volontaires pour réaliser ce lexique en espagnol, en portuguais, en allemand, en italien, en russe, en arabe et en chinois.
Les mots des semaines précédentes
|
Valorisation des données |
Annonces
|
Les jeudi, l'enseignement aura lieu à 14h00 en salle 306 du bât 625 |
Autres
Vous pouvez également visiter ma chaine biostatistique sur Youtube
(entrez "chaine biostatistique Youtube" dans Google)
Organisation du travail : vous allez comprendre au fil du temps que la meilleure façon de procéder est de créer un répertoire où vous rangerez vos scripts R, un autres ou vous rangerez vos données brutes, un autre répertoire pour les résultats et enfin un répertoire pour sauvegarder les fichiers images résultant de l'analyse graphique....
conseil : vous pouvez consulter la partie "Examen Pratique" même si cela ne correspond pas tout à fait à ce que nous allons faire ensemble (onglet "Contrôle des connaissances") et vous entraîner sur les problèmes proposés (travail en groupe de 2 à 4 étudiants conseillé)
Rentrée : mardi 8 janvier 2021 - salle 2, bât 3
< De nouveaux documents seront proposés au fil du temps> |