#         10        20        30        40        50        60        70        80       90   
###########################################################################################
# Fichier : script_culture_bio_step1.txt                                                  #
# Traitement des données issues du fichier culture_bio1.txt                               #
# Orsay, Bât 336  [08/01/2015]                                                            #
# Objet du script : Stats Univariées                                                      #
# A/ Statistique descriptive                                                              #
#   (réaliser notamment un histogramme des données réparties en classes)                  #
# B/ Statistique inférentielle  (fera l'objet d'un autre script)                          #
#    (Comparaisons, inférence, induction, tests d'hypothèse et Intervalles de confiance)  #
###########################################################################################

# 1 - Rénitialiser les variables (objets)
# ---------------------------------------
rm(list=ls(all=TRUE))

# 2 - Définir l'espace de travail (working directory)
# ---------------------------------------------------
# (les adresses de tous les fichiers seront relatives au répertoire défini avec setwd)

#setwd("F:/enseignement_L2S4-ALL2/seance1")

# 3 - Recupérer les données
# -------------------------

cult<-read.table("./culture_bio3.csv",h=TRUE,sep=";",dec=",",na.strings=c("", "NA"))
cult               # pour visionner les infos récupées (!!!si trp de valeurs à afficher)
cult=na.omit(cult)
attach(cult)       # permet l'utilisation des entêtes de colonnes comme autant de variables
names(cult)        # listing des variables 
# 4 - Statistique descriptive
#_________________________________________________________________________________________
# Calculs sur des vecteurs (distributions d'échantillons)
# mean : pour calculer une moyenne (des valeurs contenues dans une liste)
# var et sd : pour calculer respectivement la variance et l’écart type d’une distribution
# length : pour connaître l’effectif des valeurs contenues dans un vecteur
# Summary : pour donner la moyenne, la médiane et les quartiles
# Rq :l'instruction  View(cult) permet d'éditer l'info récupérée en mode feuille de calcul 
#_________________________________________________________________________________________
# Les quartilles et la moyenne

summary(cult)
summary(Rendement)
# Les extrema
min(Rendement)
max(Rendement)
#Taille de l'échantillon / de la variable
length(Rendement)
# Calcul de la moyenne
sum(Rendement)/length(Rendement)
mean(Rendement)
# écart type (non biaisé)
sd(Rendement)
# tri des valeurs 
sort(Rendement)
# quelques stats bivariées
Rendement[Exploitant=="dupont"]
mean(Rendement[Exploitant=="dupont"])

# 5 - Definir la fenêtre graphique (on la divisera en 2 parties pour contenir 2 graphes)
# --------------------------------

par(mfrow=c(1,2))     # essayez : par(mfrow=c(2,1))

# 6 - Dessin de l'HISTOGRAMME
# ---------------------------

hist(Rendement)

# 7 - Dessin de la boîte de Tukey
# (boxplot, boîte à moustache)
# -------------------------------

boxplot(Rendement)
boxplot(Rendement~Exploitant)
# ANOVA
AOV(Rendement~Exploitant)
anova1=aov(Rendement~Exploitant)
summary(anova1)
t.test(Rendement[Exploitant=="duchesne"],Rendement[Exploitant=="dupont"])

# 8 - Sortie du/des grphiques dans un fichier image (pdf, PNG, JPEG, ...)
# (boxplot, boîte à moustache)
# -------------------------------

png(file="graph1.png")
par(mfrow=c(1,2))
hist(Rendement)
boxplot(Rendement)
dev.off()

#(nous allons dans une 2ème étape apprendre à réaliser des graphes plus précis)

###########################
# F I N  D U  S C R I P T #
###########################