#-------------------------------------------------------------------------------------- # Exercice « Séquence Random » # On considère une chaîne polypeptidique de n acides aminés générée de façon aléatoire. # Orsay - Novembre 2007 # Attention : ce listing doit être subdivisé en 3 scripts (graphes ne pouvant être superposés) #-------------------------------------------------------------------------------------- # #............................................................................ #. est une fonction R donnant la densité de probabilité . #. d'une distribution binomiale . #. Dans le cas d'une binomiale B(n,p) . #. - pour obtenir p(X=k) , il faut invoquer la commande >dbinom(k,n,p) . #. - pour obtenir la distribution pour toutes les valeurs de X entre 0 et k . . #. il faut invoquer la commande >dbinom(0:k,n,p) . #............................................................................ # # Soit n=50, taille de la séquence # Hypothèse de départ : on considèrera les 20 acides aminés essentiels # -Q1/ Quelle est la probabilité de trouver plus de 50% de résidus proline dans cette séquence aléatoire? # def des VA : X = "nombre de résidus PRO dans une séquence aléatoire de 50 aa" # Po = "proportion de résidus PRO dans une séquence aléatoire de 50 aa" # P( Po > 0.5) = P( X > 25) # Po et X suivent une B (50, 0,05) # Variable de Bernouilli associée //// Présence Proline associée à X=1 ; P(X=1)=1/20 p=1/20 n=50 k=25 etendue=(k+1):50 etendue selection=dbinom(etendue,n,p) proba1=sum(selection) proba1 # # -Q2/ Tracer l'histogramme de la ditribution : # all=0:50 all px=dbinom(all,50,0.05) plot(px~all,type="h",lwd=4,col="red",xlab="X=k",ylab="P(X=k)",las=1) lines(all,px,col="grey",lwd=1) # # -Q3/ Quelle est la probabilité de trouver le tripeptide ‘LLL’ dans cette séquence polypeptidique ? # # Soit Nt : nombre de tripeptides dans une séquence de n résidus d'acides aminés ntri=n-3+1 # Variable de Bernouilli / Probabilité élémentaire : # Pour chaque tripeptide considéré dans la séquence # Présence de LLL , W=1 P(W=1)=(1/20)3=0.000125 # Absence de LLL , W=0 P(W=0)=1-0.000125=0.999875 # Soit la V.A. Y : "nombre de tripeptides LLL dans la séquence aléatoire de 50 résidus d'aa" # Y suit une loi binomiale B (48, 0.000125) # {Présence de LLL dans la séquence} = (Y > 0) # P (Y > 0) = 1 – P(Y=0) proba2=1-dbinom(0,ntri,0.000125) proba2 # -Q4/ Tracer l'histogramme de cette nouvelle ditribution : # tout=0:ntri tout px2=dbinom(tout,ntri,0.000125) plot(px2~tout,type="h",lwd=4,col="red",xlab="X=k",ylab="P(X=k)",las=1) # -Q4/ Quelle est la probabilité d'obtenir un poly L , # c’est à dire une séquence polypeptidique constituée uniquement du résidu leucine ? # proba3=(1/20)^n proba3