Fiches DATACAMP

Algèbre linéaire
Matrices Matrices usuelles Multiplication matricielle

Une matrice carrée d'ordre n est dite 2 −2 1 −1 5
Une matrice est un tableau de nombre diagonale lorsque, pour tout i ≠ , on a Le produit de matrices A et B (noté AB) n’est
défini que si le nombre de colonnes de A est
= −3 6 8 = 1 2
disposés en m lignes et n colonnes. On dit =0
5 2 1
égal au nombre de lignes de B. 3 4
matrice de taille (m, n) et on note : −2 0 0
= 0 −3 0 −1 10
C’est-à-dire A doit être de taille (m, p) et B de
⋯ 0 0 5 = = 33 29
⋮ ⋱ ⋮ taille (p, n). Dans ce cas, AB est de taille (m,
=( ) ,…, =
n).
0 33
,…, ⋯ La matrice unité est la matrice
diagonale avec que des 1 (∀ = En effet, l’élément qui se trouve au
De plus, soient et les termes généraux
Le terme est situé à la è
ligne de la è 1, … , ; = 1) croisement de la 1ère ligne er la 1ère
respectifs de A et B, alors le terme général de
colonne de la matrice A. 1 0 0 C = AB est et on le définit par : colonne est obtenu :
= 0 1 0
Exemples 0 0 1 = ∑
On considère : =
−2 1 −2 La matrice nulle est la matrice carrée = 2 x (-1) + (-2) x 1 + 1 x 3 = -1
= 8 −3 ; = −3 d’ordre n dont tous les coefficients sont
1 3 5 nuls.
Le produit matriciel n’est pas commutatif
3 −1 0 0 0
= (3 −1 6); = = 0 0 0
4 −3
0 0 0 Propriétés
A est une matrice de taille (3, 2) Le produit est distributif par rapport à l’addition. C’est-à-dire :
B est une matrice de taille (3, 1) Opérations de Base
C est une matrice de taille (1, 3) ( + )= +
D est une matrice de taille (2, 2) Soient A et B deux matrices de même ( + ) = +
taille (m, n) de termes généraux respectifs Le produit est associatif, c’est-à-dire : ABC = A(BC) = (AB)C
Une matrice (m, 1) est dite matrice colonne. et et ; λ un nombre réel.
Une matrice (1, n) est dite une matrice ligne. Soit A une matrice de taille (m, n) alors = =
Une matrice (n, n) est dite une matrice A = B si et seulement si = Le produit de deux matrices peut être nul sans qu’aucune des deux matrices ne soit la matrice
carrée d’ordre n. 1 0 −1 1 0 −1
La somme de A et B est la matrice de nulle, exemple : 2 0 −1 × 2 0 −1 =
On appelle transposée de A (et on note ), terme général + 3 0 0 3 0 0
la matrice dont les lignes sont les colonnes
de A, et dont les colonnes sont les lignes de Le produit de A par λ est la matrice de Systèmes linéaires Inverse
A. terme général λ .
Exemples Grâce au produit matriciel, on peut représenter un système linéaire par
Exemples une équation matricielle. Une matrice
−2 1 Soit le système linéaire de n équations et n inconnues carrée A d’ordre n
−2 8 1 + +⋯+ = est dite inversible
= 8 −3 => = 5 2 −4 1
1 −3 3 = ; = ; λ =3 + + ⋯+ = lorsqu’il existe
1 3 6 1 1 −3
une matrice B
Propriétés + + ⋯+ = telle que : AB =
On peut le représenter par AX = B. .
( + ) = + 1 3 15 6
+ = λA = ⋯
( ) =
7 −2 18 3 Dans ce cas, B est
= ⋮ ⋱ ⋮ ; = ⋮ ; = ⋮ notée
⋯
Algèbre linéaire
Déterminant Matrice symétrique Orthogonalité
Soit A = ( ) une matrice carrée d'ordre 2. Deux vecteurs x et y sont dits orthogonales si <x,y> = 0. On note x ⊥ y.
Une matrice carrée A d'ordre n est
Le déterminant de A est le réel noté det(A)
symétrique lorsque = . Une famille de vecteurs est dite orthogonale si tous ses vecteurs sont deux à deux
tel que :
Si A est symétrique, alors : orthogonaux. Toute famille orthogonale ( ) { ,…, } vérifie le théorème de Pythagore :
( )= = − - A a des valeurs propres réelles.
- A est diagonalisable.
Soient A = ( ) et B = ( ) deux matrices - Il existe P telle que = d'où ≤ || ||
d'ordre n et λ ∈ R. On a : = .
- det(AB) = det(A) det(B) = det (BA)
- det( ) = det(A) Soit E un espace muni d'un produit scalaire et X une partie de E. On appelle orthogonale de X
- det(λ A) = λ det(A) Produit scalaire et on note l'ensemble : = ∈ | (∀ ∈ ), < , > = 0.
- Si A est diagonale, alors det(A) = Soit x, y, z trois vecteurs de et λ un
… scalaire. On définit par produit scalaire On dit que ( ) { ,…, } est une base orthonormée de E si et seulement si :
- det( ) = 1 (qu'on note <.,.>) toute application qui
- A est inversible si, et seulement si, - si + + ⋯+ = 0, ∀ ∈ {1, … , }, =0
vérifie les propriétés suivantes :
det(A) ≠ 0
- (∀ ∈ )(∃ , ,…, ∈ ), = + +⋯+
- Si det(A) ≠ 0, alors det( )= ( ) - <x+ λy, z> = <x,z> + λ <y,z>
- <x,y+ λ z> = <x,z> + λ <x,z> - est orthogonale à . Pour tout i ≠ j.
- <x,y> = <y,x>
Diagonalisation - <x,x> ≥ 0 - ∀ ∈ {1, … , }, | | =1
- <x,x> = 0 => x = 0
VALEUR PROPRE / VECTEUR PROPRE Projection orthogonale Matrice orthogonale
Une valeur propre de A est un scalaire λ Le produit scalaire classique et usuel est : Soit M une matrice carrée d'ordre n.
tel qu'il existe un vecteur colonne non-nul Soit x un vecteur d'ensemble muni d'un
V vérifiant : AV = λ V On dit que M est une matrice orthogonale
< , >= ∗ produit scalaire E.
si elle vérifie :
V est appelé vecteur propre de A associé à
Soit F un sous-ensemble de E, x s'écrit de
λ. = = .
façon unique sous la forme = +
Norme
DIAGONALISATION ù ∈ ∈ . Le déterminant d'une matrice orthogonale
On appelle norme associée à un produit est égal à ± 1.
Une matrice carrée A d'ordre n est scalaire, le réel | | = √< , >. On dit que f est le projeté orthogonal de x
diagonalisable lorsqu'il existe une matrice sur F et on note = ( ). L'ensemble des valeurs propres de M est
Elle vérifie les propriétés suivantes :
diagonale D et une matrice inversible P inclus dans l'ensemble {0,1}.
- <x,y>| ≤||x||*||y|| (Inégalité de Pour x,y de E, on a < ( ),y> = <x, ( )> .
telles que :
Cauchy-Schwartz)
Propriétés :
= - ||x+y|| ≤||x|| +||y|| (Inégalité Si ( , , … , ) est une base orthonormée,
triangulaire) alors : - Une matrice orthogonale se
D est constituée des valeurs propres de A.
- ||x|| ≥ 0 avec égalité si x = 0 caractérise par la propriété :
P est obtenue par la concaténation des - || λ x|| = | λ |*||x|| ( ) ( − ) = 0,
( )= < , >.
vecteurs propres de A. - ||x + y|| = ||x|| + ||y|| + 2 < ,
, > ∈
Si les valeurs propres de A sont distinctes, Notons que : || − ( )|| = || − ||
Un vecteur est dit unitaire ou normé si ||x|| ∈ - P est symétrique positive donc
alors A est diagonalisable.
= 1. diagonalisable.
Fondements de probabilité
Quelques définitions Partitions Mesure Probabilité
- On appelle épreuve E toute expérience La famille d’événements forme une partition Soit E un ensemble muni d’une tribu R. On Soit E un ensemble muni d’une tribu R. On
probabiliste. de si : appelle mesure toute application appelle probabilité toute application
⋃∈ = Ω et ∩ = ∅ ; ∀ ≠ m : R R telle que : m : R R telle que :
- On appelle univers de E l’ensemble,
généralement noté, de tous les résultats Une partition remarquable est la famille qui - m(∅)= 0 - P(∅)= 0
possibles de l’épreuve E (appelés contient l’événement A et son
‘’événements élémentaires ‘’) complémentaire. - Si ( ) est une suite d’éléments de R - Si ( ) est une suite d’éléments de R deux
Lancer une paire de dés équilibrés est une
deux à deux disjoints alors : à deux disjoints alors :
épreuve. )=∑ ( ) )=∑ ( )
Tribus et boréliens (⋃ (⋃
Ω= {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
COMMENT POUVONS-NOUS
QUALIFIER L’ENSEMBLE DES Tribus et boréliens
ÉVÉNEMENTS?
Une tribu est une famille < de parties d’un Soit A et B deux événements. Les propriétés
ensemble qui vérifie les propriétés suivantes suivantes sont toujours vraies:
: 1- P(A) = 1 − P(A)
Evénements — Ω∈
— Si ( ) est une suite dénombrable 2- P(B)=P(A ∩ B)+P(A ∩ B)
Un événement est un sous-ensemble de Ω.
d’éléments de R, alors ∪ ( ) ∈
- L’intersection de A et B, notée A ∩ B, est un 3- Si A ⊂ B alors P(A) ≤P(B)
Si A est un élément de R, alors son
événement. Il est réalisé uniquement si A et B
comportement l’est aussi 4- 0 ≤ P(A) ≤ 1
se produisent.
De plus, si est une tribu, alors:
- La réunion de A et B, notée A∪B, est un 5- P(A ∪ B)=P(A)+P(B)-P(A∩ B)
—∅∈
événement. Il est réalisé si A ou B se produit.
— Si ( ) est une suite d’éléments de , De plus, considérant une suite Si ( )
Deux événements remarquables sont à
alors d’événements. On a alors :
retenir:
∩( )∈
— L’événement certain Ω
— L’événement impossible ∅ ;
EXEMPLE DE TRIBUS ( ) = lim ( ))
- Tous les éléments qui n’appartiennent pas à
Commençons par le cas discret. →
A appartiennent à un événement que l’on
On considère l’expérience " Lancer une
appelle le complémentaire de A. On le
pièce de monnaie équilibrée ". ( ) lim (
note A. →
On notera : P " PILE apparaît" et F " FACE
- On dit que deux événements A et B sont
apparaît ".
incompatibles s’ils ne peuvent pas être ( ( )) ≤ ( )
Dans ce Cas, l’univers est l’ensemble {P,F} et
réalisés en même temps.
={ Ω, ∅,P,F} est une tribu.
Si A, B et C sont des événements de Ω, les
En général, l’ensemble des parties est une
propriétés suivantes sont toujours vérifiées: Et si :
tribu (classique).
—A ∪ A = et A ∩ A = ∅
Pour le cas continu, les intervalles du type
— A ∩ B = A ∪ B et A ∪ B = A ∩ B (lois de =Ω
[a,+∞[ ; ]a,+ ∞ [; ]- ∞,a[; ]- ∞,a] sont des
Morgan)
tribus. Alors :
— A∩ (B∪ C) = (A ∩B) ∪ (A∩C)
Nous les appelons DES BORELIENS.
— A∪ (B ∩C) = (A ∪ B) ∩ (A∪C)
( )= ( ∩ )
Fondements de probabilités
P. Conditionnelles Indépendance Variable aléatoire
Mettons-nous d’accord sur un constat, le Deux événements A et B sont dits Une variable aléatoire est un nombre qui dépend du résultat d’une expérience aléatoire.
passé est derrière nous, nous ne pouvons indépendants si et seulement si : Chaque exécution de l’expérience génère une réalisation de la variable aléatoire.
le modifier. Et des fois, ce passé impacte le
Mathématiquement, on définit une variable aléatoire X comme une fonction X : AR qui
présent. ( ∩ )= ( ) ( )
associe à chaque résultat de l’expérience s, un réel X(s)
Par exemple, si nous arrivons en retard en En d’autres termes, deux événements sont Par exemple, dans une queue pour la caisse d’un magasin, le nombre de clients est
cours, il y a de fortes chances que le indépendants si le résultat de l’un une variable aléatoire. La durée de traitement de chaque requête aussi.
professeur ne soit pas content. n’influence aucunement l’aboutissement de
l’autre. Remarquons que la première est un nombre entier. On dit qu’elle est à support
En théorie des probabilités, nous nous
discret. Alors que la deuxième est une durée (un nombre réel). On dit qu’elle est à
intéressons souvent au comportement
L’indépendance littéraire se traduit support continu
d’un aléa, sachant qu’un autre événement
est déjà passé. mathématiquement par une séparation de
la probabilité conjointe en produit.
C’est ce que nous appelons Les Qu’est- ce qui caractérise une variable aléatoire ?
Probabilités Conditionnelles. Sous condition d’indépendance de A et B, la
Considérant deux événements non- notion de la probabilité conditionnelle Fonction de répartition Probabilité ponctuelle / Densité
impossibles A et B, la probabilité tombe à l’eau, car les événements évoluent
conditionnelle de A sachant que B est l’un sans se soucier de l’autre.
Une VA traduit le résultat d’une CAS DISCRET : Probabilité ponctuelle
réalisé (couramment dit A sachant B) est : Ceci se traduit par :
expérience aléatoire en nombre réel. La
( ∩ ) fonction de répartition transporte le La probabilité ponctuelle est la fonction qui
( \ )= ( )
( \ )= calcul des probabilités concernant les décrit les sauts de la fonction de répartition :
( )
( \ )= ( ) réalisations de la VA
Des fois, nous souhaitons voir à quoi aurait ( = )= ( ≤ )− ( ≤ − )=
ressemblé le présent si le passé avait été C’est la fonction définie par :
différent. Notons que si A est indépendant de B, il le 0.5
sera par rapport à son complémentaire

( )= ( ≤ )
C’est-à-dire, voir comment aurait été le également. Et vice versa. 0.2 0.3 ∑ =
passé sachant que le présent est ce qui est.
On pourrait graphiquement reconnaître
TRÈS PHILOSOPHIQUE !!! Redescendons En général, pour une suite
une fonction de répartition par : 1 3 7
sur terre alors et examinons les maths : ( ) d’événements indépendants, on a :
Par commutativité de l’intersection nous ∀ ; ≤ ( )≤ CAS CONTINU : densité de probabilité
avons : ( ∩ ) = ( ∩ ) ( )= ( )= ( )… ( )
F est une fonction croissante La densité est la fonction qui décrit les
Et donc en utilisant la formule ci-haut:
variations de la fonction de répartition :
( \ ) ( )= ( \ ) ( ) Gardez religieusement cette dernière ( )= et ( )=
→ →
formule dans un endroit bien rangé de votre
D’où alors : tête. Nous la reverrons en statistique. ( )= ( )
( \ ) ( )
( \ )= NE PAS CONFONDRE
( )
INDÉPENDANCE ET
C’est ce que nous appelons : INCOMPATIBILITÉ DES
Cas discret Cas continu
=
LA FORMULE DE BAYES ÉVÉNEMENTS.
Moments Couples aléatoires A mémoriser Lois usuelles
La fonction , ( , ) = ( ≤ ∩ ≤ Soient U, V, X et Y des variables
ESPÉRANCE
) est dite distribution conjointe de X aléatoires et a, b, c et d des
L’espérance d’une variable aléatoire Ce tableau récapitule les lois usuelles que vous pourrez
et Y. constantes réelles.
est sa valeur attendue. C’est une Dans le cas continu, la fonction rencontrer dans différents cours du master.
mesure de localisation de la définie par : ESPÉRANCE
distribution. ( + )= ( )+ ( )
Dans le cas discret : , ( , )== , ( , ) ( )= Lois discrètes
Est une densité conjointe du Loi X Support Densité E(X) V(X)
( )= . ( = )
VARIANCE Bernoulli B(p) {0,1} ( = 1) = = 1 − ( = 0) p p(1-p)
∈ couple(X,Y).
)= ² ( ) ( Binomiale B(n,p) {0,….,n} P(X = k) = (1 − ) np np(1-p)
Alors que dans le cas continu : On a donc : Poisson P(λ) N
( )=
( = )=
( )= . ( ). ( + )= ( )+ ( )+ ( , ) !
, ( , )= , (, ) ( − )= ( )+ ( )− ( , )
∈
THEOREME DE TRANSFERT
Dans le cas discret, on définit la COVARIANCE
( ( )) = φ( ). ( = ) fonction de fréquences conjointes : ( , )= ( , )
∈ Lois continues
= , = = ( + , + )= ( , )
Loi X Support Densité E(X) V(X)
( ( )) = φ( ). ( ). Et on a donc : ( + , )= ( , )+ ( , ) Uniforme U[a,b] [a,b] 1 + ( − )
∈ ( )= 1[ , ] ( )
= ( , + )= ( , )+ ( , ) − 2 12
VARIANCE ,
Exponentielle E(λ) ( )= 1 ( ) 1 1
: : ( + , + )= ( , )+
La variance d’une variable aléatoire λ λ
LOI MARGINALE Normale N( , σ²) R 1
décrit la dispersion de la variable ( , )+ ( , )+ ( , )
( ) ( ) σ²
On définit la loi marginale de X :
aléatoire autour de sa valeur moyenne √2
Chi-deux à n 1
(son espérance). Elle est définie par : ( )= ( , ) degrés de liberté
( )= 1 ( )
, 2 Γ
ꭓ (n>0) 2
( )= ( )− ( )
= (( − ( ) ) Dans le cas continu, ou encore : Vecteurs aléatoires Student à n R ( )
degrés de liberté 1
Sa racine carrée est appelée écart- ( )= Un vecteur aléatoire est un n-uplet τ(n)(n>0)
=
1
(1 + )
√ ,
type et notée généralement : formé de variables aléatoires. On 2 2
Fisher à (p,q)
( )= ( ) Dans le cas discret. note( , , … , )
1
degrés de liberté 1 ( )
CENTRAGE ET REDUCTION (De même on peut définir la densité F(p,q)(p,q>0) ( , )
2 2 ( + )
marginale de Y) L’espérance est toujours linéaire.
Le centrage consiste à localiser la
Si X et Y sont indépendants, alors : Pour une suite ( ) { ,.., } de réels,
distribution autour de l’origine et la
, ( , )= ( ) ( ) on a : Γ( ) = ∫ désigne la fonction Gamma d’Euler
réduction consiste à normaliser la
COVARIANCE
dispersion. La technique est simple : La covariance mesure l’intensité de la ( + + ⋯+ ( ) ( )
− ( ) B(x, y) = Γ( ) = ∫ (1 − ) = désigne la
= relation linéaire entre deux variables )= ( )+ ( ) +⋯+
( )
( ) aléatoires X et Y. fonction Béta
MOMENTS D’ORDRE r: ( , )= ( )− ( ) ( ) ( )
Le moment d’ordre r est défini par : Nous allons souvent rencontrer les lois grisées dans les Tests
Si X et Y sont indépendants, alors :
= ( ) Pour les variables indépendantes, statistiques. Là encore, connaître les densités ne servirait pas à
Le moment centré d’ordre r est défini ( , )=0 on a : grand-chose, mais ceci nous évitera de parler de lois dont nous
ainsi = (( − ( )) ) Attention : La réciproque n’est pas ne connaissons pas la tête.
V( + +. . + )= ( ) +⋯+
vraie ( )
Vecteurs Aléatoires Notions de Convergence
INDEPENDANCE DEUX A DEUX Si l’on pense à des données, vues comme réalisation de variables aléatoires
Les variables , … , sont deux à deux indépendantes si et , … , . Il serait intéressant de se poser la question de savoir comment évolue
seulement si : cette suite lorsque n tend vers l’infini.
Convergence en Loi
Convergence presque sûre Convergence en probabilité
∀ ≠ ; sont mutuellement indépendantes
On dit que ( ) converge en
On dit que ( ) converge On dit que ( ) converge en
Indépendance mutuelle presque sûrement vers X et on probabilité vers X et on note loi vers X et on note si
. et seulement si :
note si et seulement si : → si et seulement si :
Les variables , … , sont mutuellement indépendantes si et ⎯⎯⎯
→
seulement si : P( = , … , = )= P( = ) ∗ … ∗ ( = P({ = }) = (∀ > ); P(| − |> )--> 0 Où dénote la fonction de
→
) répartition de X
L’INDÉPENDANCE MUTUELLE IMPLIQUE Convergence en M.Q

L’INDÉPENDANCE DEUX À DEUX. On dit que ( ) converge en
moyenne quadratique vers X et
LA RÉCIROQUE EST FAUSSE. .
on note ⎯ si et seulement
Si , … , sont mutuellement indépendantes, alors pour si :
(( − ) )→
toute famille de fonctions réelles ( ) , on a : ( ( ),…, ( ( )
Cette définition peut se
sont indépendantes. généraliser jusqu’à l’ordre n,
mais nous n’en aurons pas
ESPÉRANCE ET VARIANCE-COVARIANCE besoin.
Soit X=( , … , ) un vecteur aléatoire. Dans le cas Loi faible des Loi forte des
multidimensionnel, l’espérance scalaire est remplacée par un Théorème Central Limite
grands nombres grands nombres
vecteur << espérance>>.
Soit , … , une suite Soit , … , une suite Soit , … , une suite de
E(X)= ( ( ), … , ( ))
de variables aléatoires de variables aléatoires variables aléatoires
La variance unidimensionnelle est remplacée par la matrice indépendantes et de indépendantes et de indépendantes et de
de variance-covariance. Elle contient les variances en même loi telle que : même loi telle que : même loi telle que :
diagonale et les covariances ailleurs. On la note
( )= ( )= ( )= ( )= ( )= ( )=
généralement ∑ .
Alors : Alors : Alors :
( ) … ( , )
.
= ⋮ ⋱ ⋮ ∑ → ∑ → √ ( , )
( , ) ⋯ ( )
Statistique inférentielle
Echantillon / Estimateur Estimateur convergent Construction d’un estimateur
Le point de départ est un vecteur (ou un tableau
Un estimateur est dit convergent s’il Méthode du maximum de vraisemblance
dans le cas multidimensionnel) de données.
converge en probabilité vers le La méthode de maximum de vraisemblance consiste à affecter la valeur qui maximise la
Ces données peuvent être vues comme les paramètre à estimer : probabilité d’observer ( , , … , ) lorsque l’aléa du vecteur ( , , … , ) tombe. Sans trop
réalisations ( , ,…, ) d’une variable → rentrer dans la théorie de la vraisemblance, nous allons présenter un algorithme en cinq
aléatoire X qui dépend d’un certain paramètre étapes pour calculer cet estimateur (qui présente des propriétés assez séduisantes) :
En pratique, tout estimateur sans biais
que nous allons chercher à estimer.
et dont la variance tend vers 0 est Etape 1 : Calculer la fonction de vraisemblance :
convergent.
Pour ce faire, nous allons construire un ( , )= ∏ ( ) dans le cas continu, ou ( , ) = ∏ ( = ) dans le cas discret.
échantillon de cette variable. Un échantillon
( , , … , ) est un n-uplet de variables Estimateur optimal Etape 2 : Calculer le log-vraisemblance :
aléatoires indépendantes et qui suivent tous la Il s’agit de calculer un maximum, ce qui revient à dériver. Il s’agit ici d’un produit de n facteurs
même loi (celle de X). Qualité d’un estimateur
ce qui rend la dérivation assez coriace. La fonction logarithmique présente des propriétés
La qualité d’un estimateur est mesurée à assez sympas pour faciliter cette tâche.
Ceci dit, un estimateur de est une fonction = travers son erreur quadratique moyenne
( , , … , ) de notre échantillon de base et Etape 3 : Calculer la dérivée de la log-vraisemblance.
définie par :
dont on connaît la loi de probabilité. Etape 4 : Résoudre l’équation d’inconnue ∶:
=( , ) +
Lorsque l’aléa tombe, = ( , , … , ) est une (ln( ))
Comme nous cherchons tout le temps = 0 => =
estimation de . Le but de ce cours est de
construire le meilleur estimateur possible de . (presque) des estimateurs sans biais, il reste à
Etape 5 : Vérifier qu’il s’agit d’un maximum : effectivement en s’assurant que :
comparer les variances.
Un estimateur est meilleur que si : (ln( ))
Estimateur sans biais < ( )
< 0
Méthode des moments

Pour que l’estimation soit bonne, il faut que Inégalité de Rao-Cramer/ Efficacité
soit proche de . Comme = ( , , … , ) Comme le paramètre à estimer intervient dans la densité de probabilité, les moments
est une variable aléatoire, on ne peut imposer On définit la quantité d’information théoriques sont souvent en fonction de ce paramètre. Ainsi la méthode des moments consiste
de condition qu’à sa valeur moyenne. apportée par l’estimateur par : à égaliser les moments théoriques (espérance, variance) à leurs équivalents empiriques et à en
dégager une estimation ponctuelle.
On définit ainsi le biais :
= − En pratique, il faut résoudre l’(les) équation(s) : ( ) = et ( ) = avec :
, = −
1 1
Un estimateur est dit sans biais si , = 0. Où ( , ) = ∏ ( ) est la vraisemblance. = ; = ( − )
(nous reviendrons sur sa définition)
C’est-à-dire :
Méthode des moindres carrés
L’inégalité de Rao-Cramer postule que la
=
variance d’un estimateur ne peut pas aller en Lorsqu’il s’agit de prendre une mesure avec un appareil doté d’une imprécision , alors le
delà d’un certain seuil : problème d’estimation peut s’écrire : = +
1 La méthode des moindres-carrés ordinaires consiste à trouver le paramètre qui minimise la

≥ somme des carrées des erreurs :
Un estimateur est optimal (ou efficace) si sa = ( )= ( ( − ) )

variance vérifie le cas d’égalité.
Statistique inférentielle
Intervalles de confiance
Un intervalle de confiance [ , ] de niveau 1 − est un intervalle qui a la probabilité 1 − de contenir le
paramètre à estimer . Formellement, on écrit : ( ) ≤ ( ,…, ) ≤ ( ) = ( ≤ ≤ ) = 1 −
Test d’hypothèses
En test d’hypothèse, nous cherchons à faire valoir une hypothèse en dépit d’une autre, qui lui est contradictoire.
On appellera la première (celle dont le rejet à tort sera le plus préjudiciable) « Hypothèse nulle » et la deuxième « Hypothèse alternative ».
Réalité
vraie fausse
Garder Risque de
1−
Décision deuxième espèce
Rejeter
1−
Risque de Puissance du test

première espèce
Les calculs qui se cachent derrière le choix de l’hypothèse à garder sont compliqués. Mais BONNE NOUVELLE, la machine fera tour à notre place. Il suffit
juste de suivre correctement la méthode :
Etape 1 : Choisir judicieusement les hypothèses à évaluer et fixer le risque .
Etape 2 : Choisir le test adapté à la procédure.

Etape 3 : Rentrer la commande correspondante sur R et exécuter.
Etape 4 : Lire dans les sorties la p-value . si elle est supérieure à α on accepte H . Si elle lui est inférieure, on rejette H
Le tableau qui va suivre est à lire avec la plus grande des attentions.
Constructions d’Intervalles de confiance
Construction d’intervalles de confiance usuels

Pour les paramètres d’une loi ( , )
Pour Pour Pour une proportion p
Avec connu Avec inconnu Avec connu Avec inconnu
L’EMV de est : L’EMV de p est ̂ = , où
L’EMV de est : L’EMV de est : L’EMV de est : ~ ( , ) (loi binomiale).
2
= ∑ , ~ ( , ) 1 1 2
2 = ( − )2 = ( − )
= ∑ , ~ ( , ) Comme inconnu, on −1 Pour n assez grand ( ≥ 30), on
=0 =0
On a: √
−
~ (0, 1) l’estime avec son équivalent ( −1) a : → ( , (1 − ))
On a: ~ 2
On a: ~ 2−1
empirique.
= ∑ =0( − )2 Donc :
Nous allons donc utiliser les Nous allons donc utiliser les Nous allons donc utiliser les ̂−
fractiles d’une loi normale On a: √
−
~ ( − 1) fractiles d’une loi de Khi- fractiles d’une loi de Khi- √ ~ (0,1)
centrée réduite. (1 − )
Nous allons donc utiliser les deux à n degrés de liberté. deux à n-1 degrés de liberté. −
− ≤√ ≤ =
−
fractiles d’une loi de student (1− )
2
− ≤√ ≤ à n-1 degrés de liberté. ( − 1) ′2 1−
≤ ≤ =1− 2 ≤ 2
≤ =1− Ceci donne :
=1−
− Ceci donne : Ceci donne : (1 − )
Ceci donne : − ≤√ ≤ ̂− ≤
′
2 2
=1− 2 − 1) ′2 2 − 1) ′2 ≤ ̂+
(1 − )
− ≤ ≤ ≤ =1− ≤ ≤
√ Ceci donne : 2 1 2 1
=1−
≤ + =1−
√ ′ Et donc un intervalle de Comme p (à l’intérieur de
=1− −
√
≤ confiance pour de niveau Et donc un intervalle de l’intervalle) est inconnu, on
′ de confiance 1 − est : confiance pour de niveau l’estime avec son équivalent
Et donc un intervalle de
≤ + de confiance 1 − est : empirique ̂ .
√
confiance pour de niveau =1− [ , ] − 1) − 1)
de confiance 1 − est : 2 1
[ , ] Un intervalle de confiance
Et donc un intervalle de 2 1 pour p de niveau de
confiance pour de niveau Où ( respectivement ) est confiance 1 − est :
[ − , + ] de confiance 1 − est :
√ √ le fractile d’ordre 1 − Où ( respectivement ) est
(1 − ) (1 − )
[ − , + ] ( respectivement ) d’une loi le fractile d’ordre 1 − [ ̂− , ̂+ ]
Où est le fractile d’ordre √ √ ( respectivement ) d’une loi

de Khi-deux à n degrés de
Où est le fractile d’ordre Où est le fractile d’ordre
1 − d’une loi normale liberté. de Khi-deux à n-1 degrés de
centrée réduite. 1 − d’une loi de student à liberté. 1 − d’une loi normale
n-1 degrés de liberté. centrée réduite.
Nombres complexes
Définition Module et conjugué d’un complexe Notation exponentielle
Un nombre complexe z s’écrit de façon unique
On appelle module du nombre complexe z=a+bi, a ϵ R, b ϵ R, le réel positif | z | = √ + On note + =
sous la forme a+bi ; a ϵ R, b ϵ R. On dit que a+bi
est la forme algébrique du nombre complexe z. | z |=0 ⇔ z = 0 ; |- z |=| z | ; | z + z’ | ≤ | z | + | z’ | Et ( + )=
a est la partie réelle de z on note a = Re(z). | | On a :
| z z’ |=| z || z’ | ; =| ; =|
b est la partie imaginaire de z on note a=Im(z). | |
On appelle conjugué du nombre complexe z=a+bi, a ϵ R, b ϵ R, le nombre complexe =a-bi. ´ ( ´)

. =
Propriétés
 = ; | |=| z | ; Si z ≠ 0 = 1 −
Le nombre complexe i est tel que i² =-1. | |² = =
 . = | | donc . est un réel positif
Les complexes de la forme bi avec b ϵ R, sont appelés
imaginaires purs. = ( − ´)
 + = + ; − = − ; = . ´
Deux nombres complexes sont égaux si et seulement

si ils ont même partie réelle et même partie
imaginaire.  Si z’≠ 0 = ; =
( ) =
Equations du 2 degré nd
´ ´
L’équation az²+bz+c = 0, où a, b et c sont  Re (z) = Im (z) =
des réels (avec a ≠ 0) admet dans C deux  est réel ⇔ = ; est imaginaire pur ⇔ = −
solutions (éventuellement confondues).
Soit ∆= ² − le discriminant de
l’équation. ∆ est un nombre réel.
Forme trigonométrique
Si ∆≥ 0, les deux solutions sont réelles
Dans le plan rapporté à un repère orthonormal, au nombre complexe z=a+bi,
√∆ √∆
= et = On peut associer le point M (a,b). z=a+bi est l’affixe de M.
Tout nombre complexe non nul z peut être écrit sous la forme
Si ∆≤ 0, on peut écrire ∆= ( ) ² avec
= ( + ) , avec ϵ R et r ϵ R*+
les deux solutions sont alors des nombres
C’est la forme trigonométrique de z.
complexes, (conjugués l’un de l’autre)
r est le module de z. r=| z | .
= et = Si = ( + ) alors :
Le trinôme az²+bz+c se factorise sous la  = ( (− ) + (− ))
forme a(z- )(z- )  − = ( ( + )+ ( + ))
Programmation sous R
Avoir de l’aide Vecteurs Programmation
Accéder à l’aide Créer des vecteurs BOUCLE for BOUCLE for
?fonction : Accéder à l’aide d’une fonction. Commande Retour Commentaire for (variable in sequence) { while (condition) {
Rassembler des instructions} instructions}
Help.search(‘fonction’) : Chercher de
c(2,4,6) 246 éléments dans un
l’aide d’une fonction.
vecteur
Help (package = ‘MASS’) : Trouvez de 234 Créer une
2 :6
l’aide pour un package. 56 séquence d’entiers
Créer une
En savoir plus sur un objet 2.0
seq(2,3, séquence entre 2
2.5
Str (objet) : Avoir un résumé sur un objet. by=0.5) et 3 avec un pas de CONDITION if BOUCLE for
3.0
0.5
Class(objet) : Connaitre la classe de if (condition) { nom_de_fonction ← function (variable){
rep(1:2, 121 Répéter le vecteur
l’objet. instructions instructions
times = 3) 212 1:2 3 fois.
} else { return (nouvelle_variable) }
Répéter chaque
rep(1:2, 111 Instructions différentes}
élément du vecteur
Packages each = 3) 222
1:2 3 fois.
Créer des vecteurs
install.packages (‘MASS’) : Télécharger et
sort(x) : Trier le vecteur x.
installer un package.
rev(x) : Renverser le vecteur x.
library (‘MASS’) : Importer un package et table(x) : Compter les occurrences. Ecrire et lire les données
rendre toutes ses fonctions accessibles. unique(x) : Cherche les valeurs uniques.
Lecture Ecriture Description
MASS :: select : Utiliser une fonction Sélectionner les éléments d’un vecteur
particulière. df ← read.table (‘fichier.txt’) write.table (‘fichier.txt’) Lire / Ecrire un fichier.
Par position
data (iris) : Importer un dataset de R (ici iris). x[4] :Retourner le 4ème élément.
x[-4] :Retourner tout sauf le 4ème élément. Lire / Ecrire un fichier csv
x[2:4] :Retourner les éléments du 2ème au df ← read.csv (‘fichier.csv’) write.csv (df, ‘fichier.csv’) (comma seperated value). C’est
4ème. un cas particulier de read/write.
x[-(2:4)] :Retourner tout sauf les éléments du Lire / Ecrire un fichier avec une
Répertoire 2ème au 4ème . load (‘file.RData’) save (df, file = ‘file.RData’) extension .R C’est un type de
x[c(1,5)] :Retourner les 1ér et 5ème éléments. fichier particulier à R.
getwd () : Trouver le répertoire de travail . Par position
setwd (‘C://fichier/chemin’) : Changer le x[x == 4] :Retourner les éléments égaux à 10.
répertoire de travail courant. x[x<0] :Retourner les éléments négatifs.
x[x%in%c(1,2,5)] :Retourner les éléments Conditions
contenus dans la liste. a == b Est-ce que a est égal à b ? is.na(a) Y’a-t-il une valeur manquante dans a ?
Par nom
a != b Est-ce que a est différent à b ? is.null(a) Y’a-t-il du contenu dans a ?
Aller sur le menu (Projects) sur Rstudio x[‘apple’] :Retourner les éléments qui
s’appellent ‘apple’. a > b Est-ce que a est strictement supérieur à b ? a >= b Est-ce que a est supérieur ou égale à b ?
pour régler le répertoire de travail.
a < b Est-ce que a est strictement inférieur à b ? a <= b Est-ce que a est inférieur ou égal à b ?
Programmation sous R
Types Matrices Data Frames Facteurs
Commande Retour Commentaire m ← matrix ( x, nrows =3, ncols = 3) cut(x, breaks = 4)
Créer une matrice 3x3 à partir des éléments df ← data.frame (x= 1:3, y = c(‘a’,’b’,’c’) factor(x)
Retourne des valeurs Un dataframe est une liste particulière où
as.logical T, F, T de x. Transforme un
booléennes. tous les éléments ont la même longueur. Transforme x en vecteur numérique
Pour les valeurs facteur. en facteurs à 4
m[2,] : Sélectionner la 2ème ligne.
as.numeric 1, 0, 1 numériques (entières modalités.
Extraction (de listes)
ou réelles)
m[,1] : Sélectionner la 1ère colonne.
Chaine de caractères
as.character
‘1’, ‘0’,
(préférable aux
Statistiques
‘1’ df$x df[[2]]
facteurs) m[2,3] : Sélectionner le croisement de
lm(y ~ x, data = df) : Modèle linéaire.
Chaine de caractères la 2ème ligne et la 3ème colonne.
‘1’, ‘0’, glm(y ~ x, data = df) : Modèle linéaire
particulières avec généralisé.
‘1’ t(m) : Transposée de m.
as.factor des modalités summary : Avoir des informations sur un
levels : m%*%n : Multiplication matricielle. Mieux connaître le df
(fortement utilisées modèle.
‘1’, ‘0’ solve(m, n) : Résoudre l’équation mx = n.
en statistique) View (df) : Voir le dataframe. t.test(x, y) : Test de student sur la différence
solve(m) : Inverser m. Head (df) : Voir les 6 premières lignes. de moyenne.
Fonctions mathématiques nrow (df) : Nombre de lignes dans df. prop.test : Analyse de la variance.
ncol (df) : Nombre de colonnes dans df. aov : Test sur la différence de proportions.
log (x) : Logarithme de x. Listes dim (df) : Taille de la matrice df. pairwise.t.test : Test de student pour les
exp (x) : Exponentielle de x. lst ← list ( x = 1:5, y = c(‘a’, ‘b’)) données appariées.
max (x) : Plus grand élément de x. Une liste est une collection de données qui Extraction (de matrices)
min (x) : Plus petit élément de x. peuvent ne pas être du même type. Distributions
round (x, n) : Arrondit x à n décimales. lst[[2]] : Retourne le 2ème élément de lst.
signif (x, n) : Arrondit x à n valeurs significatives. lst[1] : Retourne une nouvelle liste avec le
corr (x, y) : Coefficient de corrélation entre x et y. 1er élément de lst. Fonction Fonction
Quantile
sum (x) : Somme des éléments de x. lst$x: Retourne l’élément x de lst. densité de rép.
median (x) : Médiane des éléments de x. lst[‘y’]: Retourne une nouvelle liste avec
Normale dnorm pnorm qnorm
quantile (x) :Quantiles. l’élément y de lst.
rank (x) : Rangs des éléments de x. Combinaison
Poisson dpois ppois qpois
var (x) : Variance des éléments de x. Chaînes de Caractères
sd (x) : Ecart-type des éléments de x. Binomiale dbinom pbinom qbinom
paste(x, y, sep = ’’ ) : Uniforme dunif punif qunif
Affectation des variables Joint les deux vecteurs x et y.
paste(x, collapse = ’’ ) : Student dt pt qt
Joint les éléments du vecteur x.
ls() : Liste toutes les variables de . Khi-deux dchisq pchisq qchisq
grep(pattern, x) :
l’environnement. Trouve les occurrences d’une expression
rm(x) : Supprime la variable x de dans x. Graphiques
l’environnement. gsub(pattern, replace, x) :
Remplacer les occurrences de «pattern» par
rm(list = ls() ) : Supprime toutes les variables de «replace» dans x.
l’environnement. toupper(x) : Transforme en majuscules.
tolower(x) : Transforme en minuscules.
Sur l’interface de Rstudio, nous pouvons utiliser
toupper(x) : Transforme en majuscules.
la rubrique «environnement» pour mieux le
nchar(x) :Compte le nombre de caractères
gérer.
dans une chaîne.
Programmation sous Python
Variables et Types Listes Librairie
a = ‘is’ Importer les librairies
Affectation
b = ‘nice’
my_list1 = [‘my’, ‘list’, a, b] import numpy Importe la librairie Numpy.
x=5
my_list2 = [[4, 5, 6, 7], [3, 4, 5, 6]] Import numpy as np Importer NumPy avec un nom Data Analysis Machine Learning
x
Extraire les éléments d’une liste raccourci.
>>> 5
Calculs my_list1[1] Extraire l’élément d’indice 1. Importation de fonctions particulières
my_list1[-3] Extraire le troisième dernier élément.
x+2 Addition my_list1[1:3] Extraire les éléments ’indices 1 et 2. from math import pi Calcul scientifique Graphiques en 2D
>>> 7 my_list1[1:] Extraire les éléments après l’indice 0.
x–2 Soustraction
>>> 3
my_list1[:3] Extraire les éléments avant l’indice 3. Installation de python
my_list1[:] Copier la liste.
x*2 Multiplication my_list1[1][0] Extraire le premier élément de la sous-
>>> 10 liste d’indice 1.
x ** 2 Puissance Opérations sur les listes
>>>25 my_list Concatène la liste deux fois.
x%2 Reste my_list * 5 : Concatène la liste cinq fois.
>>> 1 Opérations avancées
x / float (2) Division Par position Platforme ouverte dédiée Environnement de Application web pour le
>>> 2.5 my_list.index(a) Extraire l’indice d’un élément. aux sciences des données développement développement
Types et conversion my_list.count ( a ) Compter les occurrences d’un développée sous Python inclus dans Anaconda
str () Convertit en ch de caractères élément.
int () Convertit en entiers my_list.append ( ‘!’ ) Ajouter un élément.
my_list.remove ( ‘!’ ) Supprimer un élément.
Tableaux
float () Convertit en réels
bool () Convertit en booléens del ( my_list [0 : 1 ] ) Supprimer les éléments my_list = [1, 2, 3, 4]
d’indices 0 et 1. my_array = np.array (my_list)
my_list.reverse ( ) Renverser la liste ( sens inverse ). my_2darray = np.array ([1, 2, 3], [4, 5, 6])
Aide my_list.pop ( -1 ) Supprimer le premier élément. Extraction d’éléments
my_list.insert ( 0 , ‘!’ ) Ajouter un élément en première my_array[1] Extraire l’élément d’indice 1.
>>> help (str)
position. my_array[0:2] Extraire les éléments ’indices 0 et 1.
my_list.sort ( -1 ) Trier la liste. my_2darray[:, 0] Extraire les éléments d’indice 1 de chaque axe du tableau.
Opérations sur les tableaux
Chaînes de caractères my_array > 3 Tester si chaque élément du tableau est strictement supérieur à 3.
array([FALSE, FALSE, FALSE, TRUE]).dtype = bool )
my_string = ‘ThisStringIsAwesome’ my_string [3] my_array * 2 : Calculer le double de chaque élément du tableau.
my_string ‘s’ array([2, 4, 6, 8])
‘ThisStringIsAwesome’ my_string [4:9] my_array + np.array ([5, 6, 7, 8]) : Additionner les tableaux terme à terme.
‘String’ array([6, 8, 10, 12])
Opérations Méthodes Fonctions de tableaux
Par position
my_string * 2 my_string.upper Tranformer en majuscules. my_array.shape Retourne les dimensions du tableau.
‘ThisStringIsAwesomeThisStringIsAwesome’ my_string.lower Tranformer en miniscules. np.append (other_array) Ajouter de nouveaux éléments au tableau.
my_string + ‘Innit’ my_string.count (‘w’) Compter le nombre d’apparitions np.insert(my_array, 1, 5) np.delete(my_array, [1]) Insérer/Supprimer des éléments au tableau.
‘ThisStringIsAwesomeInnit’ du caractère précisé ( ). np.mean(my_array) np.median(my_array) np.std(my_array) Calculer la
‘m’ in my_string my_string.replace (‘e’, ‘i’) Remplacer des caractères. moyenne/médiane/écart type des éléments du tableau ).
TRUE my_string.strip Enlever des espaces. my_array.corrcoef () Calculer le coefficient de corrélation.
Traitements de données sous Python
Pandas Extraction Manipulations de Base
Pandas est une librairie basée sur Accéder à un élément Supprimer des éléments
NumPy. Elle fournit des structures e s[‘b’]
données faciles à l’usage et des outils s.drop([‘a’, ‘c’]) Supprimer une valeur à partir d’une ligne.
-5 s.drop(‘Country’, axis = 1) Supprimer une valeur à partir d’une colonne.
pour le traitement et la fouille des df[1:]
données. Trier & Ranger
Import pandas as pd Country Capital Pop df.sort_index() Trier en fonction des indices / labels.
1 China Pekin 1303171035 df.sort_values(by = ‘Country’) Trier en fonction des modalités de la variable ‘Country’.
Structure de Données 2 France Paris 87847528 df.rank() Affecter un rang à chaque élément.
Series
Ils équivalent les listes sous R. Extraire un élément Récupérer des données
Une série est une structure de df.shape Retourne le nombre de lignes et de colonnes.
données unidimensionnelle et df.iloc[[0], [0]] Extraire un élément par ses coordonnées.
df.index Retourne le vecteur des indices.
indexée qui supporte tous les ‘Belgium’
df.columns Retourne le vecteur des colonnes du dataframe.
types de données. df.iat[[0], [0]] Idem.
df.info() Retourne des informations sur le dataframe.
s = pd.series ([3, -5, 7, 4], ‘Belgium’
df.count() Compter le nombre de données non-manquantes.
index = [ ‘a’, ‘b’, ‘c’, ‘d’]) df.iloc[[0], [‘Country’]] Extraire un élément par son label.
Data frame ‘Belgium’
df.sum() Calculer la somme des valeurs.
data = {‘Country’ :[‘Belgium’, ‘China’, df.at[[0], [‘Country’]] Idem.
df.cumsum() Calculer les sommes cumulées des valeurs.
‘France’], ‘Capital’ : [‘Brussels’, ‘Pekin’, ‘Belgium’
df.min() / df.max Calculer la valeur minimale / maximale.
‘Paris’], ‘Pop’ df.idmin() / df.idmax Retourne l’indice de la valeur minimale / maximale.
:[‘11190846,1303171035,207847528]} df.ix[2] Extraire une ligne à partir d’une série de lignes.
df.describe() Retourne des statistiques descriptives de base.
df = pd.Dataframe(data, columns = df.ix[:, ‘Country’] Extraire une colonne à partir d’une
df.mean() Calculer la moyenne des valeurs.
[Country’, ‘Capital’, ‘Pop’]) série de colonnes.
df.median() Calculer la médiane des valeurs.
df.ix[1:,’Country’] Extraire un croisement ligne/colonne.
Country Capital Pop
s[-(s>1)] Extraire les séries où s n’est pas > 1. Fonctions
0 Belgium Brussels 11190846
1 China Pekin 1303171035 s[(s<-1)|(s>2)] Extraire les séries où s est < -1 ou > 2. f = lambda x : x*2
2 France Paris 87847528 df[df[‘Pop’]>12000000] Mettre un filtre au dataframe. df.apply ( f ) Appliquer une fonction.
df.applymap (f) Appliquer la fonction élément par élément.
s[‘a’] = 6 Régler a de la série s à 6.
Alignement en mémoire
Ecrire et lire les données
A un indice manquant dans un tableau, on affecte une valeur manquante (NaN)
Lire/Ecrire sur un csv Lire /Ecrire sur SQL
s3 = pd.Series ([7, -2, 3], index = [‘a’, ‘c’, ‘d’])
pd.read_csv(‘fichier.csv’, header = None,
s + s3
nrow = 5) from sqlalchemy import create_engine
a 10.0
df.to_csv(‘monDataFrame.csv’) engine = create_engine (‘sqlite :/// :memory:’)
b NaN
pd.read_sql(‘select * from my_table;’, engine)
c 5.0
Lire/Ecrire sur un excel pd.read_sql_table(‘my_table’, engine)
d 7.0
pd.read_excel(‘fichier.xlsx’) pd.read_sql_query (‘select * from my_table;’, engine)
L’utilisateur peut intervenir dans l’alignement en mémoire avec la méthode « fill »
pd.to_excel(‘df.xlxs’, sheet_name =’Feuil1’)
s.add (s3, fill_value = 0)
a 10.0
lire plusieurs feuilles du même fichier pd.to_sql (‘myDF’, engine)
b -5.0
xlsx = pd.ExcelFile (‘fichier.xls’)
c 5.0
df = pd.read_excel(xslx, ‘Feuille1’)
d 7.0
Programmation sous SAS
De base brute à base SAS Lecture des données à partir d’un fichier externe Sélection des colonnes
1. On commence par les données brutes, c’est-à-dire une collection Proc import Utiliser : proc import Sélection d’une colonne par nom Sélection d’une
de données qui n’a pas encore été traitée par sas. Datafile = “C:\file.csv” Data selected ; colonne par sa
Datafile est
2. On utilise un ensemble d'instructions appelé étape DATA pour Out = outdata Set sas.help.cars ; position
l’emplacement du fichier
obtenir vos données dans un jeu de données sas. Dbms = csv Keep model type ;
qu’on veut lire.
3. On pourrait ensuite traiter la base de données sas avec Replace; Supprimer d’une colonne par %Let to_keep(1:3) ;
DBMS : spécifie le type nom
différentes procédures. Getnames = yes; Pour sélectionner les
de la base à importer. Data selected ; variables de 1 à 3.
Lecture des données à partir de datalines Set sas.help.cars ;
Data names; Utiliser : étape data Drop model type ; %Let to_keep(1,3, 5) ;
Data names;
Infile “file-path” delimiter = ‘,’; Changer de label Pour sélectionner les
Infile datalines delimiter = ‘,’; Utiliser le infile pour
Length first last $25.; Data selected ; variables de 1, 3 et 5.
Length first last $25.; identifer le fichier externe
Input first $ last $; Set sas.help.cars ;
Input first $ last $; à lire par un input.
Run; Label model = ‘car model’
datalines;
Type = ‘car type’;
Amine,Ahmidouch
Narjisse,Cheddadi Lecture des données brutes Sélection des lignes
;run;
Informats : comment lire la data. Formats : comment afficher la data Ignore les N premières observations
Dans la code data, on pourrait rajouter : Data want ;
Infile : identifie un fichier externe à lire.
Informat first $15. last $15. birthday ddmmyy10.; Set sas.help.buy (firstobs = 5) ;
Input : spécifie les variables de la nouvelle base.
format birthday date9.; Limiter le nombre de lignes à lire
Length : précise le nombre de bytes pour stocker les variables
Exemples d’informats Data want ;
Datalines : indique que des lignes de données suivent.
$w. lit des chaînes de caractères de longueur w. Set sas.help.buy (obs = 5);
Run : exécute l’étape Data.
w.d lit des données numériques de longueur w avec d chiffres en Sélectionner les lignes avec les conditions if
décimales Data want ;
Différentes options de infile : delimiter, missover, dlm, firstobs
MMDDYYw. Lit des données date dans la forme 04-11-80 Set sas.help.buy;
If amount >= -1000;
Trier une base de données Conditions if Les boucles
Data titles ;
Affichage du contenu de la base
Utiliser la procédure proc Data df ;
Set names ; Data df ;
sort : Do x=1, 2, 3 ;
If name = ‘Ali’ then Do x=1 to 3 ; Afficher les 5 premières observations
y = x**2;
Proc sort data = Score out = do; y = x**2;
output;
Sorted; title = ‘Etudiant’ ; output; Proc print data = sashelp.class (obs = 5);
end;
By descending score; end; end;
run;
Run; else if name =’Karam’ then run; Table des fréquences
Si on ne précise pas l’ordre, do; Data df ; Data df ;
c’est croissant par défaut. title = ‘Professeur’; x = 1; Proc freq data = sashelp.class;
x = 1;
end; Tables sex/ plots = freqplot;
Do while (x<4); Do until (x>3);
else y = x**2; L’instruction end
La procédure Sort trie la base y = x**2;
Un résumé statistique de la base
title = ‘Salarié’; output; output; indique la fin de la
de données SAS par les
x = x+1; x = x+1; boucle, comme c’est
valeurs d’une ou de plusieurs SAS évalue la condition dans la end; visible dans les Proc means data = sashelp.iris n mean std min max q1
end;
variables numériques ou des condition if pour produire un run; exemples ci-après. Median q3;
run;
chaînes de caractères. résultat. Si la valeur est nulle ou
manquante, la condition est
considérée fausse.
Lien vers le QUIZZ :
www.docs.google.com/forms/d/e/1FAIpQLScIDASuaOW_yWV3mzvpDqAWBU60cPofCEfw0zya6NEoY5FhnQ/viewform?vc=0&c=0&w=1
Algèbre linéaire
Exercices d’applications
Exercice 1:
On considère les matrices suivantes:
2 1 −1 1 3
1 −2 5
= (1 2 3), = , = −3 0 , = , = −1 −4 0
−2 5 0
1 2 0 2 5
Quels sont les produits matriciels possibles? Quelles sont les matrices carrées et les matrices symétriques?
Exercice 2:
−1 1 1
1) Soit = 1 −1 1 . Montrer que =2 − , en déduire que A est inversible et calculer .
1 1 −1
1 0 2
2) Soit = 0 −1 1 . Calculer − . En déduire que A est inversible puis déterminer .
1 −2 0
Exercice 3:
Soit A une matrice carrée d'ordre n telle que = .
1) Montrer que si ≠ alors A n'est pas inversible.
2) Montrer que si ≠ alors − n'est pas inversible.

Algèbre linéaire
Corrigés des exercices d’applications
Corrigé 1:
Les produits matriciels possibles sont : AC, AE, BD, CD, DC. La matrice carrée est E, C et D sont des matrices symétriques.
Corrigé 2:
Le calcul ne pose pas de problèmes. Il mène à:

= ⟹ = =
A est inversible, et son inverse est :
+
=
2
Un calcul donne. − =4 . ∗ = , ainsi A est inversible et
1 1 2 −4 2
= ( − )= 1 −2 −1
4 4
1 2 −1
Corrigé 3:
1. Si A était inversible, on pourrait multiplier à gauche par les deux membres de l’égalité = , ainsi =
2. Posons = − , alors =( − ) = −2 + = − = . Donc d’après la question précédente, si ≠ alors B n’est pas inversible.
Autrement dit, si ≠ , alors − n’est pas inversible.
Exercices d’application
Exercice 1 :
Dans la salle des profs 60% sont des femmes; une femme sur trois porte des lunettes et un homme sur deux porte des lunettes : quelle est la
probabilité pour qu’un porteur de lunettes pris au hasard soit une femme ?
Exercice 2 :
Dans une entreprise deux ateliers fabriquent les mêmes pièces. L'atelier 1 fabrique en une journée deux fois plus de pièces que l'atelier 2. Le
pourcentage de pièces défectueuses est 3% pour l'atelier 1 et 4% pour l'atelier 2. On prélève une pièce au hasard dans l'ensemble de la production
d'une journée.
Déterminer :
- la probabilité que cette pièce provienne de l'atelier 1;
- la probabilité que cette pièce provienne de l'atelier 1 et est défectueuse;
- la probabilité que cette pièce provienne de l'atelier 1 sachant qu'elle est défectueuse.
Exercice 3 :
Soit F la fonction définie par :
⎧
0 <0 a- Vérifier que F est bien une fonction de répartition
⎪ 0,29 −1≤ ≤1 b- Soit X la variable aléatoire admettant F pour fonction de répartition ; quelle est
( )= 0,37 1≤ ≤7 la loi de X ?
⎨ 0,69 7 ≤ ≤ 11
⎪
⎩ 1 ≥0
Exercice 4 :
Soit X une variable aléatoire de loi de Poisson de paramètre λ > 0. Calculer E (1 + X) −1
Exercice 5 :
Montrer que Var (X) = E(X²) - 2(E(X))²
Exercice 6 :
Le nombre X de kg de tomates récoltés dans un jardin en une semaine, est une variable aléatoire dont la loi de probabilité est la suivante :
a- Quelle est l’espérance mathématique de X et quelle est sa variance ?

b- Pendant les six semaines de la saison de récolte, la distribution de probabilité ne varie pas. Calculer l’espérance mathématique et la variance
de la variable aléatoire Y donnant la récolte totale en kg durant les six semaines.
Corrigé des exercices d’application
Corrigé 1 :
Notons les différents événements : Fe : «être femme», Lu : «porter des lunettes», H : «être homme».
Alors on a P(Fe) = 0.6, P(Lu\Fe) = 1 3 ; il s’agit de la probabilité conditionnelle probabilité de «porter des lunettes» sachant que la personne est une
femme.
De même, on a P(Lu\H) = 0.5.
On cherche la probabilité conditionnelle P(Fe\Lu).
D’après la formule des probabilités totales on a : P(Fe/Lu)P(Lu) = P(Lu/Fe)P(Fe) avec P(Lu) = P(Lu/Fe)P(Fe) +P(Lu/H)P(H).
Application numérique : P(Lu) = 0.4, donc P(Fe/Lu) = P(Lu/Fe)P(Fe) P(Lu) = 0.5.
Corrigé 2
Notons A l'événement ``la pièce provient de l'atelier 1'', B l'événement ``la pièce provient de l'atelier 2'' et D l'événement ``la pièce est
défectueuse''.
L'énoncé nous dit que les 2/3 des pièces produites proviennent de l'atelier 1. Donc P(A)=2/3.
On cherche P(A∩D)=PA(D)P(A)=0,03×23=150. On démontre de même que P(B∩D)=175 et donc que P(D)=P(A∩D)+P(B∩D)=130.
Ainsi, on a PD(A)=P(A∩D)P(D)=35.
Corrigé 3
1- F est croissante, de limite nulle en −∞, de limite égale à 1 en +∞ et continue à droite, il s’agit donc bien d’une fonction de répartition.
2-
x ∈ X(Ω) -1 1 7 11
P(X = x) 0,29 0,08 0,32 0,31
Corrigé 4
E((1 + X) ) = ∑ (1 + k) e = ∑
( )!
!
= (∑ − 1) = e − 1 = (1 − e )/ λ
!
Corrigé 5
Var(X) = E[(X-E(X))²] = E(X²-2 E(X)X+(E(X))²)

= E(X²)-2 E(X)E(X)+(E(X))=E(X²)-2(E(X))²
Corrigé 6 :
a- E(X) = 0 × 0, 1 + 1 × 0, 5 + 2 × 0, 3 + 3 × 0, 1 = 1, 4 ; E(X²) = 02 × 0, 1 + 12 × 0, 5 + 22 × 0, 3 + 32 × 0, 1 = 2, 6 ; Var(X) =

E(X²) − (E(X))² = 0.64.
b- Y étant la somme de 6 variables aléatoires. i.i.d. on a : E(Y) = 6E(X) = 8, 4 et Var(Y) = 6Var(X) = 3.84
Statistique inférencielle
Exercices d’application
Exercice 1 :
Soit X une variable aléatoire dont la densité de probabilité f est définie par : où θ est un paramètre réel strictement positif.
1 −
( )= − , <0
0, ≥0
1. Déterminer l’estimateur du maximum de vraisemblance de d’un r-échantillon de variable parente X.
2. Calculer l’espérance mathématique et la variance de .
Que peut-on conclure ?
3. Calculer la quantité d’information de Fisher.
4. En déduire que est efficace.
Exercice 2 :
Une entreprise fabrique des sacs en plastique pour les enseignes de distribution. Elle s'intéresse au poids maximal que ces sacs peuvent
supporter sans se déchirer. On suppose ici que le poids maximal que ces sacs peuvent supporter suit une loi normale d'espérance
mathématique 58 Kg et d'écart-type 3 Kg.
1. Sur 200 sacs reçus, une grande enseigne de distribution constate un poids moyen de 57,7 Kg.
1.1. Donner un intervalle de confiance bilatéral de la moyenne des poids sur un échantillon de taille 200, au seuil de risque 1 %. 1.2.
Quelle est votre conclusion sur le poids moyen constaté ?
2. Donner le poids moyen dépassé dans 97 % des cas, sur un échantillon de taille 200.
Corrigé 1 :
On a :
E(X)= θ et V(X)= θ²
Considérons un r-échantillon de cette structure.
Sa fonction de vraisemblance est définie pour tout θ, θ > 0, et tout (x , … , x ) ∈ , tous strictement
positifs, par :
L( θ ; x , … , x ) = ∏ f(x )
∑
=
D’où :
∑
ln L( θ ; x , … , x ) = −lnθ +
²
il en résulte que :
∑
ln L( θ ; x , … , x ) = − +
²
D’où :
ln L( θ ; x , … , x ) = 0 ⇒ θ = ∑ x
²
Et comme ln L( θ ; x , … , x )<0
²
Donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une structure exponentielle

est :
1
θ= x
r
C’est la moyenne empirique du r-échantillon.

2. comme
1
θ= x
r
Alors :
( ) ²
E(θ) =E(X)= θ et V(θ) = =
On en déduit que θ est un estimateur sqns biais et convergent de θ.
3. Calculons la quantité d’information de Fisher, I [X, θ], concernant θ.

On a :
²
I[X, θ] =-E[ ln f( θ ; X)]
²
²
= -E [ (- ln θ − )]
²
=E [− + ]
Donc la quantité d’information de Fisher, I[ ,…, , ], concernant fournie par le r-échantillon est :
I[ ,…, , ]= r I[X, ]=
Calculons l’efficacité :
e[ ]= =1
[ ,…, , ] ( )
Donc optimal ou efficace.

Corrigé 2 :
1. Ici on travaille sur un échantillon de taille 200 (la taille de la population étant considérée comme infinie).
1.1. La variable aléatoire égale à la moyenne des poids maximaux sur tout échantillon de taille 200 suit la loi normale N(58 ;
) = N(58 ; 0,212).
√
On cherche P(58 – a ≤ ≤ 58 + a) = 0,99. Après avoir posé T = et lu sur la table de la loi normale centrée réduite, on
,
obtient a = 0,55.
Donc l'intervalle de confiance sur tout échantillon de taille 200, de la moyenne des poids, est [57,45 ; 58,55].
1.2. Le poids moyen constaté sur l'échantillon ci-dessus est conforme aux attentes (57,7 Kg appartient à l'intervalle).
2. On cherche P( > b) = 0,97 donc après calculs on obtient b = 57,6.
Donc le poids moyen dépassé dans 97 % des cas est 57,6 Kg.

Fiches DATACAMP

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Fiches DATACAMP

Hochgeladen von

Copyright:

Verfügbare Formate

Algèbre linéaire

Matrices Matrices usuelles Multiplication matricielle

sera par rapport à son complémentaire

L’INDÉPENDANCE MUTUELLE IMPLIQUE Convergence en M.Q

Méthode des moments

1 La méthode des moindres-carrés ordinaires consiste à trouver le paramètre qui minimise la

Un estimateur est optimal (ou efficace) si sa = ( )= ( ( − ) )

Risque de Puissance du test

Etape 1 : Choisir judicieusement les hypothèses à évaluer et fixer le risque .

Etape 2 : Choisir le test adapté à la procédure.

Construction d’intervalles de confiance usuels

Où est le fractile d’ordre √ √ ( respectivement ) d’une loi

On appelle conjugué du nombre complexe z=a+bi, a ϵ R, b ϵ R, le nombre complexe =a-bi. ´ ( ´)

Deux nombres complexes sont égaux si et seulement

Soit A une matrice carrée d'ordre n telle que = .

1) Montrer que si ≠ alors A n'est pas inversible.

2) Montrer que si ≠ alors − n'est pas inversible.

Le calcul ne pose pas de problèmes. Il mène à:

Soit X une variable aléatoire de loi de Poisson de paramètre λ > 0. Calculer E (1 + X) −1

Montrer que Var (X) = E(X²) - 2(E(X))²

a- Quelle est l’espérance mathématique de X et quelle est sa variance ?

P(X = x) 0,29 0,08 0,32 0,31

Var(X) = E[(X-E(X))²] = E(X²-2 E(X)X+(E(X))²)

a- E(X) = 0 × 0, 1 + 1 × 0, 5 + 2 × 0, 3 + 3 × 0, 1 = 1, 4 ; E(X²) = 02 × 0, 1 + 12 × 0, 5 + 22 × 0, 3 + 32 × 0, 1 = 2, 6 ; Var(X) =

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une structure exponentielle

Corrigé des exercices d’application

3. Calculons la quantité d’information de Fisher, I [X, θ], concernant θ.

Corrigé des exercices d’application

Das könnte Ihnen auch gefallen