# 10 20 30 40 50 60 70 80 90 ########################################################################################### # Fichier : script_culture_bio_step1.txt # # Traitement des données issues du fichier culture_bio1.txt # # Orsay, Bât 336 [08/01/2015] # # Objet du script : Stats Univariées # # A/ Statistique descriptive # # (réaliser notamment un histogramme des données réparties en classes) # # B/ Statistique inférentielle (fera l'objet d'un autre script) # # (Comparaisons, inférence, induction, tests d'hypothèse et Intervalles de confiance) # ########################################################################################### # 1 - Rénitialiser les variables (objets) # --------------------------------------- rm(list=ls(all=TRUE)) # 2 - Définir l'espace de travail (working directory) # --------------------------------------------------- # (les adresses de tous les fichiers seront relatives au répertoire défini avec setwd) #setwd("F:/enseignement_L2S4-ALL2/seance1") # 3 - Recupérer les données # ------------------------- cult<-read.table("./culture_bio3.csv",h=TRUE,sep=";",dec=",",na.strings=c("", "NA")) cult # pour visionner les infos récupées (!!!si trp de valeurs à afficher) cult=na.omit(cult) attach(cult) # permet l'utilisation des entêtes de colonnes comme autant de variables names(cult) # listing des variables # 4 - Statistique descriptive #_________________________________________________________________________________________ # Calculs sur des vecteurs (distributions d'échantillons) # mean : pour calculer une moyenne (des valeurs contenues dans une liste) # var et sd : pour calculer respectivement la variance et l’écart type d’une distribution # length : pour connaître l’effectif des valeurs contenues dans un vecteur # Summary : pour donner la moyenne, la médiane et les quartiles # Rq :l'instruction View(cult) permet d'éditer l'info récupérée en mode feuille de calcul #_________________________________________________________________________________________ # Les quartilles et la moyenne summary(cult) summary(Rendement) # Les extrema min(Rendement) max(Rendement) #Taille de l'échantillon / de la variable length(Rendement) # Calcul de la moyenne sum(Rendement)/length(Rendement) mean(Rendement) # écart type (non biaisé) sd(Rendement) # tri des valeurs sort(Rendement) # quelques stats bivariées Rendement[Exploitant=="dupont"] mean(Rendement[Exploitant=="dupont"]) # 5 - Definir la fenêtre graphique (on la divisera en 2 parties pour contenir 2 graphes) # -------------------------------- par(mfrow=c(1,2)) # essayez : par(mfrow=c(2,1)) # 6 - Dessin de l'HISTOGRAMME # --------------------------- hist(Rendement) # 7 - Dessin de la boîte de Tukey # (boxplot, boîte à moustache) # ------------------------------- boxplot(Rendement) boxplot(Rendement~Exploitant) # ANOVA AOV(Rendement~Exploitant) anova1=aov(Rendement~Exploitant) summary(anova1) t.test(Rendement[Exploitant=="duchesne"],Rendement[Exploitant=="dupont"]) # 8 - Sortie du/des grphiques dans un fichier image (pdf, PNG, JPEG, ...) # (boxplot, boîte à moustache) # ------------------------------- png(file="graph1.png") par(mfrow=c(1,2)) hist(Rendement) boxplot(Rendement) dev.off() #(nous allons dans une 2ème étape apprendre à réaliser des graphes plus précis) ########################### # F I N D U S C R I P T # ###########################