Biostatistique
objectifs
espace_L2
defis_L2
je_vous_recommande
supports_cours
projets
contrôle des connaissances
examen_distant
Data Sciences
Data Base
Base on Web
Web Design
Machine_Learning
sondages
forum
video teaching
exercices
tables
Séances_salles_info
divers
autoformation
datafiles
autoform_database

Data Sciences en Biologie [DSB]

Séances et Documents - Année Universitaire 2021-2022

Espace Numérique de Travail (ENT) - Enseignement Numérique (EN)

Cette partie d'auto apprentissage est aussi importante que l'enseignement présentiel et nécessite d'y conscarer du temps, environ 1 à 2 heures par séance (vous le savez bien : on n'a rien sans rien!). Cela vous initie à l'enseignement numérique qui devient incontournable à notre époque et sera une des composante de l'Université Paris-Saclay.

Le billet de l'UE

Bonjour Ă  toutes et Ă  tous et bienvenue dans cette nouvelle UE Data Sciences en Biologie [DSB]!

Sauf contre-ordre de nos instances, l'enseignement aura lieu en présentiel.

En complément, quelques vidéos de cours sont proposés sur ce site. Ces vidéos sont consultables à n'importe quel moment ; il ne s'agit pas d’enseignement distanciel à heures fixées.

Notre premier rendez-vous en présentiel : jeudi 27 janvier à 13h30 à l'amphi F1 du Bât.452. Je vous ferai un cours introductif avant de vous répartir (en deux groupes) en salle info. Je vous expliquerai l'organisation de l'enseignement et vous parlerai des projets qui seront réalisés en équipe (équipes-projets).

Il me reste à vous souhaiter beaucoup de plaisir et de découvertes intéressantes dans cette nouvelle formation. Vous le verrez, nous aurons l'occasion de faire des jeux et de relever des défis (je vous expliquerai le principe du contrôle continu).

Comme vous devez vous en doutez, rien ne pourra se faire sans vous. Je compte sur votre précieuse complicité pour mener à bien notre aventure commune qui, vous le verrez, est très ambitieuse.

Bien Ă  vous.

Votre enseignant,

Pascal RIGOLET

[dernière mise à jour le 22/01/2022]

PARTIE DU SITE EN COURS DE DEVELOPPEMENT - PROCHAINEMENT OPERATIONNEL

Les mots clés de la semaine :

Data Sciences ; machine learning ; apprentissage ;

Présentation de l'UE Data Sciences en Biologie [DSB]

Présentation de l'enseignement (fichier pdf)
Présentation vidĂ©o de l'UE (vidéo de 5 minutes)

Plans des séances, diaporamas projetés en cours, vidĂ©os et documents associĂ©s

> Le découpage en séances proposé ici est indicatif et ne suit pas celui réellement suivi

> Chaque séance est couplée à un ou plusieurs compléments numériques à distance

  SĂ©ance 1 - Introduction : Qu'est-ce que les data sciences?
  Vous avez entendu parler de Data Sciences mais vous vous demandez encore ce que cela peut bien ĂŞtre et ce qui se cache derrière ce concept. C’est vrai qu’avec la foison d’informations qui sont diffusĂ©es par les mĂ©dias ou disponibles sur internet on a un peu de mal Ă  faire la part des choses concernant cette approche multidisciplinaire Ă©mergente. On trouve un peu tout et n’importe quoi sur ce domaine.Cette section devrait vous aider Ă  y voir plus clair et tenter de vous expliquer tout cela de la façon la concise et la plus simple qui soit. Ce sera l'occasion de revisiter les types de variables utilisĂ©es dans le traitement des donnĂ©es, notammment en statistique puis de dĂ©couvrir comment sont codĂ©es et structurĂ©es les informations dans le chemin qui part des data et conduit jusqu'au Big Data.
Les data sciences - Qu'est-ce que c'est ? A quoi ça sert? (vidéo mp4 de 4 minutes)
Types des Variables : tout ce qu'il faut savoir (vidéo mp4 de 11 minutes)
Fiche résumé sur les types de variables (fichier pdf)
Des data au Big Data - Codage et structuration des donnĂ©es (vidéo mp4 de 53 minutes)
Le diaporame sur l'analyse des données et les data sciences (fichier pdf)
  SĂ©ance 2 - Le/la data scientiste, un mouton Ă  cinq pattes.
  PlutĂ´t que d'aller chercher la perle rare qui maĂ®trise toutes les diciplines des data sciences, il vaut mieux rĂ©aliser que les data sciences regroupent un ensemble de disciplines complĂ©mentaires. Dès lors, qu'est-ce qu'on peu attendre d'une personne qui se prĂ©sente avec l'Ă©tiquette de scientististe et quelle formation peut-on lui conseiller?
Comment devenir Data Scientist? (vidéo mp4 de 75 minutes)
Disciplines, mĂ©thodes et outils employĂ©s en data science (vidéo mp4 de 75 minutes)
  SĂ©ance 3 - La part des logiciels
  Cette section est composĂ©e de petits ateliers qui vont vous permettre de vous former Ă  quelques uns des logiciels employĂ©s par les data scientistes.
Prise en main du logiciel R, vos tous premiers pas avec R ( vidéo pour les Ă©tudiants dĂ©couvrant R)
R - environnement de travail (pour les Ă©tudiants ne connaissant pas R; fichier pdf)
Quelques fonctions graphiques R (fichier pdf)
De l'utilisation d'un logiciel de stat (R) (vidéo mp4 de 4 minutes)
Installation de l'interface R_Commander [Rcmdr] (vidéo mp4 de 5 minutes)
Prise en main de JAMOVI - Tuto pour apprendre JAMOVI (vidéo mp4 de 62 minutes)
  Atelier 1 - Conception et traitement d'un jeu de donnĂ©es
  Cette section est composĂ©e d'un atelier pratique qui va vous permettre d'apprendre Ă  concevoir un jeu de donnĂ©es dans diffĂ©rents formats et de le traiter avec les logiciels et outils statistques appropriĂ©s. Il nous faudra composer notammment avec les prĂ©requis et se poser le question de la vĂ©racitĂ© des donnĂ©es, de la confiance qu'on peut leur accorder (sur plusieurs critères) avant de les analyser. Il faudra Ă©galement ĂŞtre très vigilant sur la prĂ©cision et les unitĂ©s de ces donnĂ©es. Cetaines questions comme "qui, oĂą, quand, quoi, comment?" seront de rigueur dans l'exploitation de ce premier jeu de donnĂ©es. Il faudra bien distinguer l'information Ă  expliquer (souvent associĂ©e Ă  des mesures) et l'information explicative (variables fixĂ©es ou considĂ©rĂ©es comme telles) et bien faire la part des tpyes de variables apparaissant dans le jeu de donnĂ©es.
PrĂ©sentation de l'atelier (vidéo mp4 de 5 minutes)
Jeu de donnĂ©es (vidéo mp4 de 5 minutes)
Fiches conseils (vidéo mp4 de 5 minutes)
Pratique du traitement avec 2 logiciels (vidéo mp4 de 5 minutes)

 

A propos des projets

Présentation succinte des projets en équipe et des compétences associées (fichier pdf)

 

Etc.....

Bon apprentissage!

 

Téléchargements des Logiciels

Logiciel R - [The R Project for Statistical Computing] (choisissez la langue de votre version)
R studio (interface différent + options d'affichages. Environnement ressembant à celui de Stata)
Rcommander (choisissez la langue de votre version)
Jamovi (interface différent + options d'affichages. Environnement ressembant à celui de SPSS)


Les Fichiers de Données

i1 Fichier de données "morphology" (fichier txt)

Scripts de commandes R

Pour récupérer les données d'un fichier dans R (fichier txt)

Fichiers EXCEL

i1 Fichier de données "agronomy" (fichier xlsx)

Quelques tutoriaux

R - Fiche tutoriale 3 : s'initier Ă  la programmation avec R : concevoir et appeler une fonction (fichier pdf)

Fiches Pratiques

Petit lexique franco-anglais de biostaistique (fichier pdf)

je recherche des volontaires pour réaliser ce lexique en espagnol, en portuguais, en allemand, en italien, en russe, en arabe et en chinois.

Les mots des semaines précédentes

qcm1 Valorisation des données

 

Annonces

qcm1 Les jeudi, l'enseignement aura lieu à 14h00 en salle 306 du bât 625

Autres

 

Vous pouvez également visiter ma chaine biostatistique sur Youtube

(entrez "chaine biostatistique Youtube" dans Google)

 

Organisation du travail : vous allez comprendre au fil du temps que la meilleure façon de procéder est de créer un répertoire où vous rangerez vos scripts R, un autres ou vous rangerez vos données brutes, un autre répertoire pour les résultats et enfin un répertoire pour sauvegarder les fichiers images résultant de l'analyse graphique....

conseil : vous pouvez consulter la partie "Examen Pratique" même si cela ne correspond pas tout à fait à ce que nous allons faire ensemble (onglet "Contrôle des connaissances") et vous entraîner sur les problèmes proposés (travail en groupe de 2 à 4 étudiants conseillé)

Rentrée : mardi 8 janvier 2021 - salle 2, bât 3

< De nouveaux documents seront proposés au fil du temps>