Statistiques à deux variables

Nuage de points, ajustement affine et coefficient de corrélation

avec données aléatoires

Partie 1 : Série statistique à deux variables

Contrôles interactifs

Générez de nouvelles données aléatoires pour explorer les concepts :

1) Série statistique à deux variables quantitatives

Une série statistique à deux variables quantitatives est une série pour laquelle deux caractères mesurables sont relevés sur une même population.

Elle peut se présenter sous la forme d'un tableau, en lignes ou en colonnes.

On considère deux variables statistiques \(x\) et \(y\) observées sur une même population de \(n\) individus.

La variable \(x\) prend les valeurs \(x_1, x_2, \ldots, x_n\) et la variable \(y\) prend les valeurs \(y_1, y_2, \ldots, y_n\) .

Définition : Dans un repère orthogonal, l'ensemble des points \(M_i\) de coordonnées \((x_i ; y_i)\), avec \(1 \leq i \leq n\), est appelé le nuage de points associé à la série statistique.

2) Nuage de points et point moyen

Un nuage de points est la représentation graphique d'une série statistique à deux variables quantitatives, formé par Les couples \((x_1 ; y_1), (x_2 ; y_2), \ldots, (x_n ; y_n)\) .

.

Définition : Le point \(G\) de coordonnées \((\bar{x} ; \bar{y})\), où \(\bar{x}\) et \(\bar{y}\) sont les moyennes respectives des \(x_i\) et des \(y_i\), est appelé le point moyen du nuage de points.

\(\bar{x}=\frac{x_1 + x_2 + x_3 + . . + x_n}{n} \) ;
\(\bar{y}=\frac{y_1 + y_2 + y_3 + . . + y_n}{n} \) ;

Méthode : Représenter un nuage de points

Le tableau suivant présente l\"évolution du budget publicitaire et du chiffre d\"affaire d\"une société :

a) Dans un repère, représenter le nuage de points \((x_i ; y_i)\).

b) Déterminer les coordonnées du point moyen \(G\) du nuage de points.

Correction

a) Représentation du nuage de points :

b) Calcul des coordonnées du point moyen :

Partie 2 : Ajustement affine

Contrôles interactifs

Explorez différents ajustements avec des données aléatoires :

1) Interpolation, extrapolation

L\"objectif est, à partir des valeurs d\"une série statistique à deux variables, d\"obtenir des approximations pour des valeurs inconnues de cette série.

Définitions : L\"interpolation et l\"extrapolation sont des méthodes qui consistent à estimer une valeur inconnue dans une série statistique.

  • Pour une interpolation, le calcul est réalisé dans le domaine d\"étude fourni par les valeurs de la série.
  • Pour une extrapolation, le calcul est réalisé en dehors du domaine d\"étude.

2) Droite d\"ajustement

Définition : Lorsque les points d\"un nuage sont sensiblement alignés, on peut construire une droite, appelée droite d\"ajustement (ou droite de régression), passant « au plus près » de ces points.

3) Méthode de Mayer

Cet ajustement consiste à déterminer la droite passant par deux points moyens du nuage de points.

Méthode : Déterminer la droite d\"ajustement par la méthode des points moyens

1) Soit \(G_1\), le point moyen associé aux trois premiers points du nuage et \(G_2\) le point moyen associé aux trois derniers points du nuage.

a) Calculer les coordonnées de \(G_1\) et \(G_2\).

b) On prend \((G_1G_2)\) comme droite d\"ajustement. Tracer cette droite.

Correction

Coordonnées des points moyens :

Représentation de la droite d\"ajustement :

4) Méthode des moindres carrés

Cette méthode consiste à rechercher la position de la droite d\"ajustement telle que la somme des carrés des distances entre la droite et les points soit minimale.

Propriété : La droite d\"ajustement de \(y\) en \(x\) a pour équation \(y = ax + b\), avec :

\[ a = \frac{\text{cov}(x, y)}{\text{var}(x)}, \quad b = \bar{y} - a\bar{x} \]

où \(\text{cov}(x; y) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})\) est la covariance de \((x, y)\)

et \(\text{var}(x) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2\) est la variance de \(x\).

Méthode : Déterminer la droite d\"ajustement par la méthode des moindres carrés

1) Dans un repère, représenter le nuage de points \((x_i ; y_i)\).

2) a) Déterminer une équation de la droite d\"ajustement par la méthode des moindres carrés.

b) Représenter la droite d\"ajustement de \(y\) en \(x\).

Correction

Calculs pour la méthode des moindres carrés :

Représentation du nuage de points et de la droite d\"ajustement :

Partie 3 : Changement de variable

Contrôles interactifs

Explorez l\"ajustement exponentiel avec des données aléatoires :

1) Ajustement exponentiel

Lorsque le nuage de points suggère une croissance exponentielle, on peut utiliser un changement de variable pour linéariser la relation.

Méthode : Pour un ajustement de la forme \(y = ae^{bx}\), on pose \(z = \ln(y)\) et on obtient \(z = \ln(a) + bx\), qui est une relation linéaire entre \(x\) et \(z\).

Exemple : Évolution d\"une population

Le tableau suivant présente l\"évolution d\"une population (en milliers d\"habitants) en fonction du temps :

1) Représenter le nuage de points \((x_i ; y_i)\).

2) Effectuer le changement de variable \(z = \ln(y)\) et représenter le nuage de points \((x_i ; z_i)\).

3) Déterminer l\"équation de la droite d\"ajustement de \(z\) en \(x\).

4) En déduire la fonction d\"ajustement \(y = f(x)\).

Correction

1) Nuage de points original :

2) Nuage de points après changement de variable \(z = \ln(y)\) :

3) Calculs pour l\"ajustement linéaire :

4) Fonction d\"ajustement exponentielle :