Biostatistique
objectifs
espace_L2
defis_L2
je_vous_recommande
supports_cours
projets
contrôle des connaissances
examen_distant
Data Sciences
Data Base
Base on Web
Web Design
Machine_Learning
sondages
forum
video teaching
exercices
tables
Séances_salles_info
divers
autoformation
datafiles
autoform_database

Séances et documents

Autoformation en Analyse Statistique des Données [AASD]

Niveau : LMD

Une étroite complicité entre l'enseignant et les étudiants est la clé du succès de cette formation. Je vous souhaite beaucoup de plaisir dans cette UE.

Espace Numérique de Travail (ENT) - Enseignement Numérique (EN)

Cette partie d'auto apprentissage est aussi importante que l'enseignement présentiel et nécessite d'y conscarer du temps, environ 1 à 2 heures par séance (vous le savez bien : on n'a rien sans rien!). Cela vous initie à l'enseignement numérique qui devient incontournable à notre époque et sera une des composante de l'Université Paris-Saclay.

[dernière mise à jour le 20/02/2020]

(L'enseignement a lieu les mardi et jeudi de janvier en salle 209 Ă  14h00)

Les mots de la semaine et de la semaine dernière :

data sciences ; valorisation des données ; statistique descriptive ; variance ;

corrélation ; dépendance ; histogramme ; association ; variable aléatoire continue ;

tableau de contingences ; phénomène déterministe ; phénomène stochastique ;

dispertion ; distribution ; lois de probabilités (Bernoulli, binomiale ; Poisson ; normale ...)

corrélation ; dépendance ; histogramme ; association ; variable aléatoire continue ;

coefficients de corréiation de Pearson et de Spearman ;

Présentation du module A2SD

Présentation du module (fichier pdf)
Présentation vidĂ©o du module d'autoformation (fichier mp4) [durée : 5 min. 15] 

 

Plans des séances, photos de tableaux et diaporamas du cours en ligne

> Ce module sera associé à 2 séances de 2 heures en présentiel (pour celles et ceux qui le souhaitent) :

- une séance d'introduction et de présentation des caractéristiques, du déroulé et de la certification du module / ("amphi de présentaion") doublé d'une vidéo de présentation en ligne [30']

- une séance de conclusions et questions

Une formation de 3 heures et 30 minutes (pour l'instant / Objectif : 25 heures)

 

Etape 1 - Bienvenue! - Présentation de l'enseignement

[0h25] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Présentation du module (fichier pdf)
Présentation vidĂ©o du module d'autoformation (fichier mp4) [durée : 5 min. 15] 
Une autre façon de présenter le module A2SB (fichier pdf)
   
 

Etape 2 - Commençons par situer les choses - Introduction générale et à la data science

[0h25] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Les data sciences - Qu'est-ce que c'est ? A quoi ça sert? (vidéo mp4 de 4 minutes)
Le diaporame sur l'analyse des données et les data sciences (fichier pdf à transformer en vidéo)
Petit Quizz
   
 

Etape 3 - Ca y est, c'est parti! - Des types des variables Ă  la Statistique Descriptive

[0h25] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Il va y avoir des JEUX (oui vous avez bien lu!) et des points à gagner dans cette séance !!!!
Vous retrouverez les défis (y compris ceux du week-end) dans l'onglet "Les défis à relever"
Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Types des Variables : tout ce qu'il faut savoir (vidéo mp4 de 11 minutes)
Fiche résumé sur les types de variables (fichier pdf)
Vocabulaire statistique (fichier pdf)
La Statistique Descriptive, qu'est-ce que c'est ? (apprentissage vidéo de 10 minutes)
Fiche de synthèse sur la statistique descriptive (développé en cours, fichier pdf)
Calcul des paramètres statistiques et de leurs estimations (développé en cours, fichier pdf)
Les graphiques adaptés à chaque type de variable
Exercice
Correction exercice (pdf ou/et vidéo)
Petit Quizz
Jeu N°1 (fait en classe par équipes de 3 sous pseudos; rapportant 1,5 point - fichier pdf)
Jeu N°2 (sur le calcul de paramètres - fichier pdf)
Auto-Ă©valuation 1
   
 

Etape 4 - Continuons sur notre lancée - Lois de probabilité

(Lois de probabilités les plus souvent rencontrées en analyse des données)

[0h25] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Il va encore y avoir des jeux dans cette séance! Si, si!
Vous retrouverez les défis (y compris ceux du week-end) dans l'onglet "Les défis à relever"
Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Loi de Bernoulli, une des lois les plus simples (vidéo de 10 minutes)
Loi binomiale : origine, propriĂ©tĂ©s, quantiles, fonctions de densitĂ© et de rĂ©partition (vidéo de 10 minutes)
Loi de Poisson, la loi des Ă©vènements rares (vidéo de 10 minutes)
Loi normale : origine, propriĂ©tĂ©s, quantiles, fonctions de densitĂ© et de rĂ©partition (vidéo de 10 minutes)
Table de la Loi Normale : apprendre Ă  l'utiliser ( vidéo de 6 minutes)
Le thĂ©orème cental limite - s'il n'existait pas, il faudrait l'inventer (vidéo de 12 minutes)
Exercice
Correction exercice (pdf ou/et vidéo)
Petit Quizz
Jeu N°3 (Loi de poisson / par équipes de 3 ; rapportant 1,5 point - fichier pdf)
Auto-Ă©valuation 2
   
 

Etape 5 -What we need to work efficiently - Rcmdr, notre outil de travail

[0h25] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Prise en main du logiciel R, vos tous premiers pas avec R ( vidéo de 10 minutes pour ceux qui dĂ©couvrent R)
R - environnement de travail (pour les Ă©tudiants ne connaissant pas R; fichier pdf)
Installation de l'interface R_Commander [Rcmdr] (vidéo mp4 de 5 minutes)
Petit Quizz
Exercice
Correction exerci e (pdf ou/et vidéo)
Jeu N° (sur R - fichier pdf)
Auto-Ă©valuation 3
   
 

Etape 6 - Sur les rails - Atelier R#1 (lecture d'un fichier EXCEL/CSV + Stat Descriptive)

[0h10] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Vidéo R#1a avec R
Vidéo R#1b avec ECXEL
Vidéo R#1c avec SPSS
   
 

Etape 7 - Ca roule - Atelier R#2: Graphiques et analyse des données

[0h10] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Vidéo R#2 Graphiques : box plots; nuages de points; histogrammes; courbes en secteurs, tracés continus, ...
Vidéo R#3 Un atelier de test non paramétrique (vidéo YouTube)
   
 

Etape 8 - Full action - Repérer, décrire et relier les informations entre elles

[0h24] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Enregistrement vidĂ©o sĂ©ance 3 - partie 1/2 - synthèse rivière 1 (vidéo mp4 de 7 minutes 30)
Enregistrement vidĂ©o sĂ©ance 3 - partie 2/2 - synthèse rivière 2 (vidéo mp4 de 11 minutes)
Tableaux les plus significatifs de la séance (fichier pdf)
Fichier de données "nitrates" (fichier EXCEL)
Exercice d'autoévaluation (QCS)
Exercice
Correction exercice (pdf ou/et vidéo)
Petit Quizz
Jeu N° (sur - fichier pdf)
Auto-Ă©valuation
   
 

Etape 9 - We are the champions! Vers une analyse statistique rigoureuse des données

[0h20] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Script R drawing (fichier script R)
Fichier de données "nitraphos" (fichier EXCEL)
Quelques fonctions graphiques R (fichier pdf)
La Pvalue : l'élément incontournable des statistiques inférentielles (fichier pdf)
Estimation statistique : estimations ponctuelles et estimateurs ( vidéo de 10 minutes)
PropriĂ©tĂ©s des estimateurs ( vidéo de 12 minutes)
Exercice
Correction exercice (pdf ou/et vidéo)
Petit Quizz
Jeu N° (sur - fichier pdf)
Auto-Ă©valuation
   
 

Etape 10 - On ne change pas une Ă©quipe qui gagne! - Exploiter toute l'info d'un fichier

[1h25] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Enregistrement vidéo séance 5 >> extrait 1/7 correction détaillée défi 7 sans montage (mp4 de 30 minutes)
Enregistrement vidéo séance 5 >> extrait 2/7 correction défi 7 sans montage (mp4 d'1 minute)
Enregistrement vidéo séance 5 >> extrait 3/7 sans montage analyse nitraphos (mp4 de 16minutes)
Enregistrement vidéo séance 5 >> extrait 4/7 sans montage analyse nitraphos (mp4 de 6 minutes)
Enregistrement vidéo séance 5 >> extrait 5/7 sans montage analse nitraphos ( mp4 de 4 minutes)
Enregistrement vidéo séance 5 >> extrait 6/7 sans montage analyse nitraphos (mp4 de 3 minutes)
Enregistrement vidéo séance 5 >> extrait 7/7 sans montage analyse nitraphos (mp4 de 21 minutes 30)
Quelques photos de Tableaux significatifs de la séance 5 (fichier pdf)
Exercice
Correction exercice (pdf ou/et vidéo)
Petit Quizz
Jeu N° (sur - fichier pdf)
Auto-Ă©valuation
   
 

Etape 11 - On transforme l'essai - L'analyse multivariée: Chi2, ANOVA, Modèle Linéaire

[0h55] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Fichier de données "sexratio_fishes" (fichier EXCEL)
Fondements de l'analyse bivariée (fichier pdf)
Une petite introduction Ă  la Statistique InfĂ©rentielle (apprentissage vidéo de 2 minutes 20sec)
Les tests d'hypothèse pour les nuls - Principe et revue des différents types de tests (vidéo de 5 minutes)
Etapes d'un test d'hypothèse (vidéo de 4 minutes 30sec)
Le test d'indépendance du chi-deux (vidéo de 12 minutes 30 sec)
Les tests d'hypothèse comparant deux moyennes (vidéo de 7 minutes)
A quoi sert l'ANOVA (ANalysis Of VAriance)? (vidéo de 3 minutes)
R pour les nuls - Test de Mann-Whithey avec R (vidéo de 27 minutes)
De l'utilité des estimateurs; statistique de test; ex du test de conformité (fichier pdf)
Enregistrement vidéo séance 6 : de l'estimateur à la statistique de test (test-conformité) (mp4 de 26 minutes)
Le principe du test de Shapiro-Wilk (vidéo de 2 minutes)
La boîte à moustaches ou boîte de distribution - boxplot (vidéo de 3 minutes)
Quelques photos de Tableaux significatifs de la séance 6 (fichier pdf)
Exercice
Correction exercice (pdf ou/et vidéo)
Petit Quizz
Jeu N° (sur - fichier pdf)
Auto-Ă©valuation
   
 

Etape 12 - On y est presque - Vers une étude en data sciences rondement menée

[0h10] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Fichier de données "analyse_eau" (fichier csv)
Photos des Tableaux les plus significatifs de la séance 7 (fichier pdf)
La régression linéaire : concentration de métal dépendant de la distance à la source (fichier pdf)
Extrait vidéo de la séance 7 : petite synthèse de la régression linéaire effectuée (mp4 de 3 minute 30)
Exercice
Correction exercice (pdf ou/et vidéo)
Petit Quizz
Jeu N° (sur - fichier pdf)
Auto-Ă©valuation
   
 

Etape13 - Vous pouvez désormais voler de vos propres ailes

[0h10] + [10 minutes travail perso en lecture] + [1 défi = 20 minutes de travail]

Vidéo de présentation de la séance (1 à 2 minutes - Qu'allons nous apprendre dans cette partie/séance ?)
Fichier de données "Culture Bio" (fichier EXCEL)
Fichier de données "regioselect" (fichier EXCEL)
Exercice
Correction exercice (pdf ou/et vidéo)
Petit Quizz
Jeu N° (sur - fichier pdf)
Auto-Ă©valuation
   
  Contact
(fichier pdf)

 

Bon apprentissage!

 

Téléchargements des Logiciels

Logiciel R - [The R Project for Statistical Computing] (choisissez la langue de votre version)
R studio (interface différent + options d'affichages. Environnement ressembant à celui de Stata)
Installation de l'interface R_Commander [Rcmdr] (vidéo mp4 de 5 minutes)


Les Fichiers de Données

i1 Fichier de données "dataset1" (fichier txt)
Fichier de données "Culture Bio" (fichier txt)
Fichier de données "proteines3.txt" (fichier txt)
Fichier de données "proteines4.txt" (fichier txt)
Fichier de données "biotech1.dat" (fichier texte)
Fichier de données "Inhibition compétitive" (fichier txt, format csv)
Fichier de données "Analyses de l'eau" (fichier txt)
i1 Fichier de données "conc_500" (fichier txt)
Fichier de données "Couleur préférée" - illustrant le test du chi-deux (fichier txt)
Fichier de données "Nuage de points croisance bactérienne" (fichier txt)
Fichier de données "Croissance bactérienne mesures multiples" (fichier txt)
i1 Fichier de données "agronomy" (fichier txt)
i1 Fichier de données "startup" (fichier txt)
i1 Fichier de données "micropipettes" (fichier txt)
i1 Fichier de données "ess" (fichier csv)
i1 Fichier de données "diabetic_data" (fichier txt)
i1 Fichier de données "ozone" (fichier txt)
i1 Fichier de données "morphology" (fichier txt)
i1 Fichier de données "melons" (fichier txt)
i1 Fichier de données "’epaisseur_intima-media" (fichier xls)
i1 Fichier de données "cereals" (fichier txt)
i1 Fichier de données "river_B" (fichier txt)
Fichier de données "parcelles bio" (fichier csv)

 

Scripts de commandes R

Pour récupérer les données d'un fichier dans R (fichier txt)
Script R enquête pollution rivière (fichier txt)
Script R pour commencer l'analyse des données de culture biologique (fichier txt)

 

Fichiers EXCEL

Histogrammme et Statistique descriptive sur les données de culture biologique (fichier EXCEL)
i1 Fichier de données "agronomy" (fichier xlsx)

Quelques tutoriaux

R - Diaporama Prise en Main du Logiciel R (fichier pdf)
R - environnement de travail (fichier pdf)
R - Fiche tutoriale 1 : importer - éditer - exporter les données d'un fichier (fichier pdf)
R - Fiche tutoriale 2 : créer/éditer/exécuter un fichier script (fichier pdf)
R - Fiche tutoriale 3 : s'initier Ă  la programmation avec R : concevoir et appeler une fonction (fichier pdf)
EXEL Vidéo_Tuto : graphe simple d'une courbe de croissance avec EXCEL (fichier html/avi)

Fiches Pratiques

Vocabulaire statistique (fichier pdf)
Quelques fonctions graphiques R (fichier pdf)
De l'utilité des estimateurs; statistique de test; ex du test de conformité (fichier pdf)
Petit lexique franco-anglais de statistique (fichier pdf)
Petit lexique franco-espagnol de statistique (fichier pdf)

je recherche des volontaires pour réaliser ce lexique en espagnol, en allemand, en italien, en russe

Les mots des semaines précédentes

qcm1 Valorisation des données

 

Annonces

qcm1  

Autres

qcm1  

 

 

Vous pouvez également visiter ma chaine biostatistique sur Youtube

(entrez "chaine biostatistique Youtube" dans Google)

 

Organisation du travail : vous allez comprendre au fil du temps que la meilleure façon de procéder est de créer un répertoire où vous rangerez vos scripts R, un autres ou vous rangerez vos données brutes, un autre répertoire pour les résultats et enfin un répertoire pour sauvegarder les fichiers images résultant de l'analyse graphique....

conseil : vous pouvez consulter la partie "Examen Pratique" même si cela ne correspond pas tout à fait à ce que nous allons faire ensemble (onglet "Contrôle des connaissances") et vous entraîner sur les problèmes proposés (travail en groupe de 2 à 4 étudiants conseillé)

Rentrée : mardi 7 janvier 2020 - salle 209, bât 336

< De nouveaux documents seront proposés au fil du temps>