Biostatistique
objectifs
espace_L2
defis_L2
je_vous_recommande
supports_cours
projets
contrôle des connaissances
examen_distant
Data Sciences
Data Base
Base on Web
Web Design
Machine_Learning
sondages
forum
video teaching
exercices
tables
Séances_salles_info
divers
autoformation
datafiles
autoform_database

Séances et documents - Année 2022 - 2023

BADE - M2 PCGE ; M2 BEE et M1 EGG

Je vous souhaite beaucoup de plaisir à suivre cette UE.

Espace Numérique de Travail (ENT) - Enseignement Numérique (EN)

Cette partie d'auto apprentissage est aussi importante que l'enseignement présentiel et nécessite d'y conscarer du temps, environ 1 à 2 heures par séance (vous le savez bien : on n'a rien sans rien!). Cela vous initie à l'enseignement numérique qui devient incontournable à notre époque et sera une des composante de l'Université Paris-Saclay.

[dernière mise à jour le 15/09/2022]

Présentation de l'UE BADE

Présentation de l'UE BADE (fichier pdf)
Présentation vidéo de l'UE BADE (veuillez excuser l'aspect artisanal de cette vidéo , nouvelle version bientôt)

Plans, documents, fichiers, diaporamas, photos de tableaux et vidéos associés à l'ENT qui est organisé en corpus de cours et en ateliers

  Corpus 1 - Introduction aux bases de données
Support n°1 de la séance (fichier pdf)
Support n°2 de la séance (fichier pdf)
Fichier arbres utilisé lors de la séance introductive (fichier csv)
Synthèse des informations extraites du fichier arbres.csv (structure, contenu, données manquantes) (pdf)
qcm1 Corpus 2 - Les informations dans les bases de données sont detinées à être exploitées
  (Séance distancielle remplaçant en partie le cours annulé du mercredi 16 septembre)
Vidéo à visionner >>> Les data sciences - Qu'est-ce que c'est ? A quoi ça sert? (vidéo mp4)
Vidéo à visionner >>> Types des variables dans les bases de données (vidéo mp4)
Fiche résumé sur les types de variables (fichier pdf)
Le role central des bases de données dans le traitement et l'analyse des données (fichier pdf)
qcm1 Corpus 3 - Codage des données : des data au Big Data
 

Dans cette vidéo, nous allons découvrir comment les données sont codées (en binaire), révèlant l'architecture des données jusqu'au bit au big data.

qcm1 Codage des données : des data au Big Data (vidéo mp4)
qcm1 Diaporama sur le codage des données : des data au Big Data (fichier pdf)
qcm1 Corpus 4 - Traitement et analyse des données
 

Les informations contenues dans une base de données sont destinées à être explotées. Dans cette partie nous allons rappeler l'essentiel de la statistique descriptve et de l'analyse uni, bi et multivariée. Nous entrerons ainsi dans l'univers des data sciences. Vos projets devront s'en inspirer.

La Statistique Descriptive, qu'est-ce que c'est ? (apprentissage vidéo de 10 minutes)
Fiche de synthèse sur la statistique descriptive (développé en cours, fichier pdf)
Calcul des paramètres statistiques et de leurs estimations - patie 1 sur 3 (développé en cours, fichier pdf)
Calcul des paramètres statistiques et de leurs estimations - patie 2 sur 3 (développé en cours, fichier pdf)
Une petite introduction à la Statistique Inférentielle (apprentissage vidéo de 2 minutes 20sec)
La statistique expliquée à mon chat : chaîne qui vaut le détour! (certains d'entre vous connaissent bien sûr)
Vocabulaire statistique (fichier pdf)
Exercice d'autoévaluation (QCS)
Loi normale : origine, propriétés, quantiles, fonctions de densité et de répartition (vidéo de 10 minutes)
A quoi sert l'ANOVA (ANalysis Of VAriance)? (vidéo de 3 minutes)
La boîte à moustaches ou boîte de distribution - boxplot (vidéo de 3 minutes)
La Pvalue : l'élément incontournable des statistiques inférentielles (fichier pdf)
Le Théorème Central Limite (La statistique expliquée à mon chat -YT) (vidéo recommandée de 6 minutes)
Test d'indépendance du chi-deux ( vidéo de 12 minutes)
Les tests d'hypothèse comparant deux moyennes (vidéo de 7 minutes)
Synthèse des étapes de la réalisation d'un test d'hypothèses (vidéo de 7 minutes)
Vidéo édifiante sur les microplastiques (sur YouTube)
Le principe du test de Shapiro-Wilk (vidéo de 2 minutes)
Fondements de l'analyse bivariée (fichier pdf)
  Pour les plus curieux...
Vidéo recommandée sur les débris spatiaux (sur ARTE)
Propriétés des estimateurs ( vidéo de 12 minutes)
De l'utilité des estimateurs; statistique de test; ex du test de conformité (fichier pdf)
Enregistrement vidéo en live : de l'estimateur à la statistique de test (test-conformité)(mp4 de 26 minutes)
qcm1 Corpus 5 - Traitement et analyse des données
 

Dans cette vidéo, nous allons découvrir comment les données sont codées en binaire, révèlant l'architecture des données jusqu'au bit au big data.

qcm1 Codage des données : des data au Big Data (vidéo mp4)
qcm1 Diaporama sur le codage des données : des data au Big Data (fichier pdf)
  Atelier 0 - La part des logiciels
  Cette section est composée de petits ateliers qui vont vous permettre de vous former à quelques uns des logiciels employés par les data scientistes.
Prise en main du logiciel R, vos tous premiers pas avec R ( vidéo pour les étudiants découvrant R)
R - environnement de travail (pour les étudiants ne connaissant pas R; fichier pdf)
Quelques fonctions graphiques R (fichier pdf)
De l'utilisation d'un logiciel de stat (R) (vidéo mp4 de 72 minutes)
Installation de l'interface R_Commander [Rcmdr] (vidéo mp4 de 5 minutes)
Prise en main de JAMOVI - Tuto pour apprendre JAMOVI (vidéo mp4 de 62 minutes)
qcm1 Atelier 1 - Comment démarrer la réalisation d'une base de données (exemple simple)
 

Nous allons apprendre à créer une base de données et à la réaliser sous ACCESS en procédant par étapes. Ce n'est pas si compliqué que ça; il suffit d'être méthodique et d'appliquer des règles simples en s'appropriant un minimum de vocabulaire et de réflexes dans ce travail créatif (et ludique). Cette séance est consacrée à la première étape : l'établissement du Modèle Conceptuel des Données. L'exemple choisi s'attache à gérer les notes obtenues par les étudiants aux examens passés dans différentes matières. Notez bien les codes couleurs employés et essayer de prendre quelques notes au fil des vidéos. Enfin, essayez de recréer par vous même le Modèle Conceptuel de Données de l'exemple choisi en appliquant la méthode proposée. Cela devrait vous aider à commencer l'élaboration de la base de données de votre projet.

qcm1 Un peu de méthode (fichier pdf)
Vidéo à visionner >>> Atelier 1 - Construction du Modèle Conceptuel des données [MCD] (vidéo mp4)
qcm1 Fichier de notes ASCII (premier fichier utilisé, format txt) bouton droit souris > Enregistrer le lien sous...
qcm1 A propos du fichier des notes (fichier pdf)
qcm1 Fiche de synthèse du Modèle Conceptuel des données MCD (fichier pdf)
qcm1 Atelier 2 - Vers le Modèle Logique des Données (MLD)
 

Dans cette séquence nous allons apprendre à passer du Modèle Conceptuel des Données au Modèle Logique des Données. Nous apprendrons notamment à réaliser une liaison "un à plusieurs" en concevant une première version du Modèle Logique des Données (MLD). Nous procéderons par bloc. Le premier bloc s'attachera à construire la liaison entre les entités Matière et Enseignant. Nous suivrons ce modèle pour réaliser une première version de la base sous Access.

qcm1 Première expérience sous ACCESS (vidéo mp4)
qcm1 Version 1 de la base de données des notes (fichier ACCESS; format accdb)
qcm1 Du MCD au MLD > Atelier 2A : Modèle Logique des Données & Pratique sous ACCESS (vidéo mp4)
qcm1 Du MCD au MLD > Atelier 2B : construction de la liaison 1 à plusieurs et réalisation sous ACCESS (vid. mp4)
qcm1 Atelier 3 - Modèle Logique des Données (MLD)
 

Dans ces séances nous allons réaliser par étape la base de données sur la pollution des sols (Brain storming, Modèle conceptuel des données, Modèle Logique des Données, version ACCESS fonctionnelle). Nous apprendrons notamment à réaliser une liaison "plusieurs à plusieurs", une requête et une macro visual basic. Il va falloir organiser tous vos fichiers . Vous allez comprendre au fil du temps que la meilleure façon de procéder est de créer un répertoire où vous rangerez vos fichiers bases de données, un autres ou vous rangerez vos données brutes, un autre répertoire pour les résultats et enfin un répertoire pour sauvegarder les fichiers images importées dans la base de données ou résultant de l'analyse graphique.

qcm1 Développement complet de la base Pollution des Sols (fichier pdf)
qcm1 Version 3 de la base de données pollution des sols (fichier ACCESS; format accdb)
qcm1 Atelier 4 - Requêtes et Macro(commandes)
 

Cours distant essentiellement consacré à la création de requêtes ainsi qu'à l'export des données et à l'élaboration de macros (commandes) sous ACCESS. Ces vidéos vous permettront de revisiter à votre rythme certaines parties très "techniques". (Merci aux participants à ce cours qui a rencontré quelques problèmes techniques)

qcm1 Cours Teams M1EGG du 09/10/2020 video 1 (sur 2) (vidéo mp4)
qcm1 Cours Teams M1EGG du 09/10/2020 video 2 (sur 2) (vidéo mp4)
  Atelier 5 - Interfaçage et diffusion de la base <Pollution des sols> // & Projets
qcm1 Image pour formulaire polluant (format jpg)
qcm1 Matrice formulaire accueil (format access)
qcm1 Dernière version de la base de données pollution des sols (fichier ACCESS; format accdb)
qcm1 Une autre version de la base de données pollution des sols (fichier ACCESS; format accdb)
 

Autres cours en vidéo (ces vidéos seront prochainement améliorées par une étape de montage)

qcm1 Cours Teams M1EGG du 14/10/2020 video 1 (sur 2) (vidéo mp4)
qcm1 Cours Teams M1EGG du 14/10/2020 video 2 (sur 2) (vidéo mp4)
qcm1 Cours Teams M1EGG du 16/10/2020 video 1 (sur 2) (vidéo mp4)
qcm1 Cours Teams M1EGG du 16/10/2020 video 2 (sur 2) (vidéo mp4)
qcm1 Cours Teams M1EGG du 05/11/2021 video 1 (sur 2) (vidéo mp4)
qcm1 Cours Teams M1EGG du 05/11/2021 video 2 (sur 2) (vidéo mp4)
qcm1 Comment créer un interface d'interrogation cartographique sous ACCESS (vidéo mp4)

 

  Au plaisir de vous revoir en présentiel ou en distanciel

Organisation du travail : vous allez comprendre au fil du temps que la meilleure façon de procéder est de créer un répertoire où vous rangerez vos fichiers bases de données, un autres ou vous rangerez vos données brutes, un autre répertoire pour les résultats et enfin un répertoire pour sauvegarder les fichiers images résultant de l'analyse graphique....

 

Projets (à rendre par binôme)

Il s'agit de réaliser une Base de données Access (ou OpenOffice ou PHP-MySQL) d’application Ecologie/Environnement/Evolution (thématiques également acceptées : Géologie/Pollution Chimique/Santé) par binôme. Il vous faudra :

- Définir la base et son objectif en une phrase ou deux

- Rendre le « brain storming », schéma organisationnel et relationnel fait à la main sur papier et d’aspect brouillon)

- Réaliser la structure de la base (de 5 à 6 tables au minimum) dans Access

- Entrer les données pour une dizaine d'enregistrements

- Réaliser au moins une requête

- Réaliser un formulaire d’accueil (très simple)

- Réaliser des formulaires d’entrée des données

- Ecrire un rapport de 10 à 12 pages (15 pages maximum)

présentant le travail réalisé, son intérêt et l'explmoitation du contenu de la base de données.

(n'oubliez pas de donner un nom à votre base de données et à votre startup et un titre explicite à votre rapport)

---------------------------------------------------------------------------------------------------------------------

Ce rapport pourra être découpé comme suit :

(attention : toutes les pages devront être numérotées)

> Page 1 : page de titre

> Page 2 : index avec numéro des pages

> Pages suivantes :

I/ Introduction

(incluant notament la présentation de l'activité de votre startup et le but du travail, par ex : Le but de ce travail va consister à élaborer une base de données qui va rassembler des informations concernant la pollution des sites répertoriés (échelle à définir) et tenter d’apporter des solutions techniques pour dépolluer totalement ou partiellement les zones polluées.)

II/ Conception de la base de données

- Brain Storming (photo de votre brouillon incluse)

- Tableau de mise en place du contexte (Sujet+Verbe+Complément) faisant apparaître des verbe comme liaisons

- Phrase synthétique de contexte permattant de démarrer le projet

(par ex : le site zoneX est contaminé par le polluant truc émis par le pollueur machin

- Modèle Logique des Données

S'appuyant sur des copies d'écran ou photos accompagnées de textes rédigés dans un style correct

III/ Création de la base de données sous Access

(dont rapide description des répertoires et fichiers créés, interfaçage et mode d'emploi)

S'appuyant sur des copies d'écran accompagnées de textes rédigés dans un style correct

IV/ Utilisation et exploitation de la base de données

(dont requêtes, macros, exportations et proposition de traitement statistique des données)

S'appuyant sur des copies d'écran accompagnées de textes rédigés dans un style correct

IV/ Discussion

(apprenez à communiquer, essayer de bien "vendre" votre travail (votre produit numérique)

- Rappel de l'intérêt et de l'utilité de la base de données développée dans le cadre de votre startup

- Difficultés rencontrées et fonctionnalités à ajouter dans une future version

- Synthèse sur l'analyse (analyse statistque ou machine learning) des données de cette base de données

- Développement futur, mise à jour, améliorations entrevues et maintenance de la base de données

- Proposition pour rendre la base accessible sur le réseau

- Une ligne ou deux de conclusion

> Dernière page = 4ème de couv'

(En 3 langues dont Français, Anglais et une 3ème langue au choix)

4 lignes de présentaion de chaque étudaint(e) du binôme

+ 4 à 5 lignes résumant le projet de la base de données

---------------------------------------------------------------------------------------------------------------------

N'oubliez pas d'imprimer votre rapport et de me le remettre et d'envoyer par e-mail le lien de téléchargement du fichier compressé (Zip ou Rar) comprenant votre base de données et votre rapport ainsi que les éventuels fichiers connexes à : pascal.rigolet@u-psud.fr (utiliser l'utilitaire fichiers volumineux de l'université Paris-sud)

Le travail rendu doit être de qualité professionnelle Coefficients prévus : 3 pour la base de données ; 2 pour le rapport écrit ; 2 pour la présentation orale (ces coefs sont susceptibles de subir des variations)

Pour résumer, vous devez rendre: une base de donnée origiale par binôme ; un rapport indépendant par binôme (pour la base de données développée) d'une dizaine de pages

Délais accordé : environ 8 à 10 semaines au total pour rendre ce travail

Bonne inspiration et bon courage!

Les exemples de projets présentés ci-dessous ne se sont là qu'à titre d'illustration de ce que l'on peut faire. S'il vous plaît ne cherchez pas à copier ou à imiter ces projets! Laissez parler votre inspiration et votre talent (et à en juger aux thématiques que vous avez choisies, vous en avez!)

Chaque projet a sa particularité, il n'y a aucune raison que 2 projets se ressemblent.

Visez la qualité plutôt que la quantité. Et surtout, ayez confiance en vous!

> Bibliothèque de projets consultables :

- Gestion d'un zoo : zoo (fichier ACCESS )

- Dispensaire oiseaux blessés/mazoutés (peu élaboré mais dispose d'un tutorial) : dispensaire_oiseaux

   > voici le tutoriel réalisé par une de mes étudiantes à l'époque (soyez indulgents) : tuto_base_dispensaire

- Isolation écologique : isolation (fichier ACCESS)

- Base de données observation d'oiseaux sauvages de l’estuaire de Seine : [base] oiseauxestuaire seine (fichier ACCESS / compressé zip)

- Rapport de la base oiseaux sauvages de l’estuaire de Seine : [rapport] oiseaux_estuaire_seine (fichier pdf)

- Base de données agriculture, impacts, solutions : [base] agriculture_impacts_solutions (fichier ACCESS / compressé zip)

- Rapport de la base agriculture, impacts, solutions : [rapport] agriculture_impacts_solutions (fichier pdf)

- Base de données gestion différentiée environnement : [base] gestion différentiée (fichier ACCESS)

- Rapport de la base gestion différentiée environnement  : [rapport] gestion différentiée (fichier pdf)

- Recensement des captages d’eaux souterraines : captages_eaux_souterraines (fichier ACCESS)

- Bagage des oiseaux : bagage_des_oiseaux (fichier ACCESS / compressé zip)

- Impact de l'agriculture sur le déclin du hamster d'Europe en Alsace : déclin_hamster_Alsace (fichier ACCESS / compressé rar)

- Gestion des déchets radioactifs  : déchets radioactifs (fichier ACCESS / compressé zip)

- Eau de boisson : de la source au rejet : eaux de boisson (fichier ACCESS / compressé zip)

- Ouvrages géologiques sur le Bassin versant de la Rivière des Pluies: BD_Riviere_des_Pluies (fichier ACCES / compressé zip)

 

> Quelques projets plus récents :  

- Base de données sur la gestion des sentiers du Grand Pic Saint Loup : gestion_des_sentiers (archive compressée zip)

- Water-quality Assessment of Rivers : Water-quality Assessment of Rivers (archive compressée zip)

- Gestion d’une banque de graines : Gestion d’une banque de graines (archive compressée zip)

> d'autres exemples seront bientôt disponibles (l'ensemble des projets sera sûrement géré dans une base de données!) ....

 

(Signalez moi SVP les lien non fonctionnels)

 

 

Organisation du travail : vous allez comprendre au fil du temps que la meilleure façon de procéder est de créer un répertoire où vous rangerez vos fichiers bases de données, un autres ou vous rangerez vos données brutes, un autre répertoire pour les résultats et enfin un répertoire pour sauvegarder les fichiers images résultant de l'analyse graphique....

< De nouveaux documents seront proposés au fil du temps>