Biostatistique
objectifs
espace_L2
defis_L2
je_vous_recommande
supports_cours
projets
contrôle des connaissances
examen_distant
Data Sciences
Data Base
Base on Web
Web Design
Machine_Learning
sondages
forum
video teaching
exercices
tables
Séances_salles_info
divers
autoformation
datafiles
autoform_database

Séances et documents

Autoformation en Bases de Données, site web et Data Sciences [ABDS]

Niveau : LMD

Une étroite complicité entre l'enseignant et les étudiants est la clé du succès de cette formation. Je vous souhaite beaucoup de plaisir dans cette UE.

Espace Numérique de Travail (ENT) - Enseignement Numérique (EN)

Cette partie d'auto apprentissage est aussi importante que l'enseignement présentiel et nécessite d'y conscarer du temps, environ 1 à 2 heures par séance (vous le savez bien : on n'a rien sans rien!). Cela vous initie à l'enseignement numérique qui devient incontournable à notre époque et sera une des composante de l'Université Paris-Saclay.

[dernière mise à jour le 20/02/2020]

(L'enseignement a lieu les mardi et jeudi de janvier en salle 209 Ă  14h00)

Les mots de la semaine et de la semaine dernière :

data sciences ; valorisation des données ; statistique descriptive ; variance ;

corrélation ; dépendance ; histogramme ; association ; variable aléatoire continue ;

tableau de contingences ; phénomène déterministe ; phénomène stochastique ;

dispertion ; distribution ; lois de probabilités (Bernoulli, binomiale ; Poisson ; normale ...)

corrélation ; dépendance ; histogramme ; association ; variable aléatoire continue ;

coefficients de corréiation de Pearson et de Spearman ;

Présentation du module ABDS

Présentation du module (fichier pdf)
Présentation vidĂ©o du module d'autoformation (fichier mp4) [durée : 5 min. 15] 

 

Plans des séances, photos de tableaux et diaporamas du cours en ligne

> Ce module sera associé à 2 séance de 2 heures en présentiel pour celles et ceux qui le souhaitent :

- une séance d'introduction et de présentation des caractéristiques, du déroulé et de la certification du module

- une séance de conclusions et questions

Une formation de 3 heures et 30 minutes (pour l'instant / Objectif : 25 heures)

 

Séance 1 - Bienvenue! - Introduction et présentation de l'enseignement

[0h25] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Une autre façon de présenter le module A2SB (fichier pdf)
Les data sciences - Qu'est-ce que c'est ? A quoi ça sert? (vidéo mp4 de 4 minutes)
Types des Variables : tout ce qu'il faut savoir (vidéo mp4 de 11 minutes)
Fiche résumé sur les types de variables (fichier pdf)
Prise en main du logiciel R, vos tous premiers pas avec R ( vidéo de 10 minutes pour ceux qui dĂ©couvrent R)
R - environnement de travail (pour les Ă©tudiants ne connaissant pas R; fichier pdf)
Résumé sur les types de variables (fichier pdf)
 

SĂ©ance 2 - Ca y est, c'est parti! - Une petite initiation aux data sciences

[0h10] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

La Statistique Descriptive, qu'est-ce que c'est ? (apprentissage vidéo de 10 minutes)
Fiche de synthèse sur la statistique descriptive (développé en cours, fichier pdf)
Calcul des paramètres statistiques et de leurs estimations (développé en cours, fichier pdf)
Le diaporame sur l'analyse des données et les data sciences (fichier pdf à transformer en vidéo)
Loi normale : origine, propriĂ©tĂ©s, quantiles, fonctions de densitĂ© et de rĂ©partition (vidéo de 10 minutes)
Table de la Loi Normale : apprendre Ă  l'utiliser ( vidéo de 6 minutes)
Vous retrouverez les défis (y compris ceux du week-end) dans l'onglet "Les défis à relever"
 

Séance3 - Full action - Repérer, décrire et relier les informations entre elles

[0h24] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Enregistrement vidĂ©o sĂ©ance 3 - partie 1/2 - synthèse rivière 1 (vidéo mp4 de 7 minutes 30)
Enregistrement vidĂ©o sĂ©ance 3 - partie 2/2 - synthèse rivière 2 (vidéo mp4 de 11 minutes)
Tableaux les plus significatifs de la séance (fichier pdf)
Installation de l'interface R_Commander [Rcmdr] (vidéo mp4 de 5 minutes)
Fichier de données "nitrates" (fichier EXCEL)
Exercice d'autoévaluation (QCS)
Vocabulaire statistique (fichier pdf)
 

Séance4 - We are the champions! - Une analyse statistique rigoureuse des données

[0h20] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Script R drawing (fichier script R)
Fichier de données "nitraphos" (fichier EXCEL)
Quelques fonctions graphiques R (fichier pdf)
Estimation statistique : estimations ponctuelles et estimateurs ( vidéo de 10 minutes)
 

SĂ©ance5 - On ne change pas une Ă©quipe qui gagne! - Exploiter toute l'info d'un fichier

[1h25] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Il va y avoir des JEUX (oui vous avez bien lu!) et des points à gagner (forcément) dans cette séance !!!!
La Pvalue : l'élément incontournable des statistiques inférentielles (fichier pdf)
Jeu N°1 (fait en classe par équipes de 3 sous pseudos; rapportant 1,5 point - fichier pdf)
Enregistrement vidéo séance 5 >> extrait 1/7 correction détaillée défi 7 sans montage (mp4 de 30 minutes)
Enregistrement vidéo séance 5 >> extrait 2/7 correction défi 7 sans montage (mp4 d'1 minute)
Enregistrement vidéo séance 5 >> extrait 3/7 sans montage analyse nitraphos (mp4 de 16minutes)
Enregistrement vidéo séance 5 >> extrait 4/7 sans montage analyse nitraphos (mp4 de 6 minutes)
Enregistrement vidéo séance 5 >> extrait 5/7 sans montage analse nitraphos ( mp4 de 4 minutes)
Enregistrement vidéo séance 5 >> extrait 6/7 sans montage analyse nitraphos (mp4 de 3 minutes)
Enregistrement vidéo séance 5 >> extrait 7/7 sans montage analyse nitraphos (mp4 de 21 minutes 30)
Quelques photos de Tableaux significatifs de la séance 5 (fichier pdf)
 

Séance6 - On transforme l'essai - L'analyse multivariée : Chi2, ANOVA, Modèle Linéaire

[0h55] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Fichier de données "sexratio_fishes" (fichier EXCEL)
Fondements de l'analyse bivariée (fichier pdf)
Une petite introduction Ă  la Statistique InfĂ©rentielle (apprentissage vidéo de 2 minutes 20sec)
A quoi sert l'ANOVA (ANalysis Of VAriance)? (vidéo de 3 minutes)
PropriĂ©tĂ©s des estimateurs ( vidéo de 12 minutes)
De l'utilité des estimateurs; statistique de test; ex du test de conformité (fichier pdf)
Enregistrement vidéo séance 6 : de l'estimateur à la statistique de test (test-conformité) (mp4 de 26 minutes)
Le principe du test de Shapiro-Wilk (vidéo de 2 minutes)
La boîte à moustaches ou boîte de distribution - boxplot (vidéo de 3 minutes)
Quelques photos de Tableaux significatifs de la séance 6 (fichier pdf)
Jeu N°2 (fait en classe par équipes de 3 ; rapportant 1,5 point - fichier pdf)
 

Séance7 - On y est presque - Vers une étude en data sciences rondement menée

[0h10] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Les tests d'hypothèse comparant deux moyennes (vidéo de 7 minutes)
Fichier de données "analyse_eau" (fichier csv)
Photos des Tableaux les plus significatifs de la séance 7 (fichier pdf)
La régression linéaire : concentration de métal dépendant de la distance à la source (fichier pdf)
Extrait vidéo de la séance 7 : petite synthèse de la régression linéaire effectuée (mp4 de 3 minute 30)
 

Séance8 - Vous pouvez désormais voler de vos propres ailes

[0h10] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Il va encore y avoir des jeux dans cette séance! Si, si!
Fichier de données "Culture Bio" (fichier EXCEL)
Fichier de données "regioselect" (fichier EXCEL)
  Contact
(fichier pdf)

 

Bon apprentissage!

 

Téléchargements des Logiciels

Logiciel R - [The R Project for Statistical Computing] (choisissez la langue de votre version)
R studio (interface différent + options d'affichages. Environnement ressembant à celui de Stata)
Installation de l'interface R_Commander [Rcmdr] (vidéo mp4 de 5 minutes)


Les Fichiers de Données

i1 Fichier de données "dataset1" (fichier txt)
Fichier de données "Culture Bio" (fichier txt)
Fichier de données "proteines3.txt" (fichier txt)
Fichier de données "proteines4.txt" (fichier txt)
Fichier de données "biotech1.dat" (fichier texte)
Fichier de données "Inhibition compétitive" (fichier txt, format csv)
Fichier de données "Analyses de l'eau" (fichier txt)
i1 Fichier de données "conc_500" (fichier txt)
Fichier de données "Couleur préférée" - illustrant le test du chi-deux (fichier txt)
Fichier de données "Nuage de points croisance bactérienne" (fichier txt)
Fichier de données "Croissance bactérienne mesures multiples" (fichier txt)
i1 Fichier de données "agronomy" (fichier txt)
i1 Fichier de données "startup" (fichier txt)
i1 Fichier de données "micropipettes" (fichier txt)
i1 Fichier de données "ess" (fichier csv)
i1 Fichier de données "diabetic_data" (fichier txt)
i1 Fichier de données "ozone" (fichier txt)
i1 Fichier de données "morphology" (fichier txt)
i1 Fichier de données "melons" (fichier txt)
i1 Fichier de données "’epaisseur_intima-media" (fichier xls)
i1 Fichier de données "cereals" (fichier txt)
i1 Fichier de données "river_B" (fichier txt)
Fichier de données "parcelles bio" (fichier csv)

 

Scripts de commandes R

Pour récupérer les données d'un fichier dans R (fichier txt)
Script R enquête pollution rivière (fichier txt)
Script R pour commencer l'analyse des données de culture biologique (fichier txt)

 

Fichiers EXCEL

Histogrammme et Statistique descriptive sur les données de culture biologique (fichier EXCEL)
i1 Fichier de données "agronomy" (fichier xlsx)

Quelques tutoriaux

R - Diaporama Prise en Main du Logiciel R (fichier pdf)
R - environnement de travail (fichier pdf)
R - Fiche tutoriale 1 : importer - éditer - exporter les données d'un fichier (fichier pdf)
R - Fiche tutoriale 2 : créer/éditer/exécuter un fichier script (fichier pdf)
R - Fiche tutoriale 3 : s'initier Ă  la programmation avec R : concevoir et appeler une fonction (fichier pdf)
EXEL Vidéo_Tuto : graphe simple d'une courbe de croissance avec EXCEL (fichier html/avi)

Fiches Pratiques

Vocabulaire statistique (fichier pdf)
Quelques fonctions graphiques R (fichier pdf)
De l'utilité des estimateurs; statistique de test; ex du test de conformité (fichier pdf)
Petit lexique franco-anglais de biostistique (fichier pdf)

je recherche des volontaires pour réaliser ce lexique en espagnol, en allemand, en italien, en russe

Les mots des semaines précédentes

qcm1 Valorisation des données

 

Annonces

qcm1 Les mardi et jeudi l'enseignement aura lieu à 14h00 en salle 319 du bât 336

Autres

qcm1 fichier notes cc (provisoire)

 

 

Vous pouvez également visiter ma chaine biostatistique sur Youtube

(entrez "chaine biostatistique Youtube" dans Google)

 

Organisation du travail : vous allez comprendre au fil du temps que la meilleure façon de procéder est de créer un répertoire où vous rangerez vos scripts R, un autres ou vous rangerez vos données brutes, un autre répertoire pour les résultats et enfin un répertoire pour sauvegarder les fichiers images résultant de l'analyse graphique....

conseil : vous pouvez consulter la partie "Examen Pratique" même si cela ne correspond pas tout à fait à ce que nous allons faire ensemble (onglet "Contrôle des connaissances") et vous entraîner sur les problèmes proposés (travail en groupe de 2 à 4 étudiants conseillé)

Rentrée : mardi 7 janvier 2020 - salle 209, bât 336

< De nouveaux documents seront proposés au fil du temps>