Statistiques à deux variables

Nuage de points, ajustement affine, méthode des moindres carrés et coefficient de corrélation

Version Interactive avec données aléatoires

Partie 1 : Série statistique à deux variables

Contrôles interactifs

Générez de nouvelles données aléatoires pour explorer les concepts :

1) Nuage de points

On considère deux variables statistiques \(x\) et \(y\) observées sur une même population de \(n\) individus.

On note \(x_1, x_2, \ldots, x_n\) les valeurs relevées pour la variable \(x\) et \(y_1, y_2, \ldots, y_n\) les valeurs relevées pour la variable \(y\).

Les couples \((x_1 ; y_1), (x_2 ; y_2), \ldots, (x_n ; y_n)\) forment une série statistique à deux variables.

Définition : Dans un repère orthogonal, l\"ensemble des points \(M_i\) de coordonnées \((x_i ; y_i)\), avec \(1 \leq i \leq n\), est appelé le nuage de points associé à la série statistique.

2) Point moyen

Définition : Le point \(G\) de coordonnées \((\bar{x} ; \bar{y})\), où \(\bar{x}\) et \(\bar{y}\) sont les moyennes respectives des \(x_i\) et des \(y_i\), est appelé le point moyen du nuage de points.

Méthode : Représenter un nuage de points

Le tableau suivant présente l\"évolution du budget publicitaire et du chiffre d\"affaire d\"une société :

a) Dans un repère, représenter le nuage de points \((x_i ; y_i)\).

b) Déterminer les coordonnées du point moyen \(G\) du nuage de points.

Correction

a) Représentation du nuage de points :

b) Calcul des coordonnées du point moyen :

Partie 2 : Ajustement affine

Contrôles interactifs

Explorez différents ajustements avec des données aléatoires :

1) Interpolation, extrapolation

L\"objectif est, à partir des valeurs d\"une série statistique à deux variables, d\"obtenir des approximations pour des valeurs inconnues de cette série.

Définitions : L\"interpolation et l\"extrapolation sont des méthodes qui consistent à estimer une valeur inconnue dans une série statistique.

  • Pour une interpolation, le calcul est réalisé dans le domaine d\"étude fourni par les valeurs de la série.
  • Pour une extrapolation, le calcul est réalisé en dehors du domaine d\"étude.

2) Droite d\"ajustement

Définition : Lorsque les points d\"un nuage sont sensiblement alignés, on peut construire une droite, appelée droite d\"ajustement (ou droite de régression), passant « au plus près » de ces points.

3) Méthode de Mayer

Cet ajustement consiste à déterminer la droite passant par deux points moyens du nuage de points.

Méthode : Déterminer la droite d\"ajustement par la méthode des points moyens

1) Soit \(G_1\), le point moyen associé aux trois premiers points du nuage et \(G_2\) le point moyen associé aux trois derniers points du nuage.

a) Calculer les coordonnées de \(G_1\) et \(G_2\).

b) On prend \((G_1G_2)\) comme droite d\"ajustement. Tracer cette droite.

Correction

Coordonnées des points moyens :

Représentation de la droite d\"ajustement :

4) Méthode des moindres carrés

Cette méthode consiste à rechercher la position de la droite d\"ajustement telle que la somme des carrés des distances entre la droite et les points soit minimale.

Propriété : La droite d\"ajustement de \(y\) en \(x\) a pour équation \(y = ax + b\), avec :

\[ a = \frac{\text{cov}(x, y)}{\text{var}(x)}, \quad b = \bar{y} - a\bar{x} \]

où \(\text{cov}(x; y) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})\) est la covariance de \((x, y)\)

et \(\text{var}(x) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2\) est la variance de \(x\).

Méthode : Déterminer la droite d\"ajustement par la méthode des moindres carrés

1) Dans un repère, représenter le nuage de points \((x_i ; y_i)\).

2) a) Déterminer une équation de la droite d\"ajustement par la méthode des moindres carrés.

b) Représenter la droite d\"ajustement de \(y\) en \(x\).

Correction

Calculs pour la méthode des moindres carrés :

Représentation du nuage de points et de la droite d\"ajustement :

Partie 3 : Changement de variable

Contrôles interactifs

Explorez l\"ajustement exponentiel avec des données aléatoires :

1) Ajustement exponentiel

Lorsque le nuage de points suggère une croissance exponentielle, on peut utiliser un changement de variable pour linéariser la relation.

Méthode : Pour un ajustement de la forme \(y = ae^{bx}\), on pose \(z = \ln(y)\) et on obtient \(z = \ln(a) + bx\), qui est une relation linéaire entre \(z\) et \(x\).

Exemple : Évolution d\"une population

Le tableau suivant présente l\"évolution d\"une population (en milliers d\"habitants) en fonction du temps :

1) Représenter le nuage de points \((x_i ; y_i)\).

2) Effectuer le changement de variable \(z = \ln(y)\) et représenter le nuage de points \((x_i ; z_i)\).

3) Déterminer l\"équation de la droite d\"ajustement de \(z\) en \(x\).

4) En déduire la fonction d\"ajustement \(y = f(x)\).

Correction

1) Nuage de points original :

2) Nuage de points après changement de variable \(z = \ln(y)\) :

3) Calculs pour l\"ajustement linéaire :

4) Fonction d\"ajustement exponentielle :