Nuage de points, ajustement affine, méthode des moindres carrés et coefficient de corrélation
Version Interactive avec données aléatoires
Générez de nouvelles données aléatoires pour explorer les concepts :
On considère deux variables statistiques \(x\) et \(y\) observées sur une même population de \(n\) individus.
On note \(x_1, x_2, \ldots, x_n\) les valeurs relevées pour la variable \(x\) et \(y_1, y_2, \ldots, y_n\) les valeurs relevées pour la variable \(y\).
Les couples \((x_1 ; y_1), (x_2 ; y_2), \ldots, (x_n ; y_n)\) forment une série statistique à deux variables.
Définition : Dans un repère orthogonal, l\"ensemble des points \(M_i\) de coordonnées \((x_i ; y_i)\), avec \(1 \leq i \leq n\), est appelé le nuage de points associé à la série statistique.
Définition : Le point \(G\) de coordonnées \((\bar{x} ; \bar{y})\), où \(\bar{x}\) et \(\bar{y}\) sont les moyennes respectives des \(x_i\) et des \(y_i\), est appelé le point moyen du nuage de points.
Méthode : Représenter un nuage de points
Le tableau suivant présente l\"évolution du budget publicitaire et du chiffre d\"affaire d\"une société :
a) Dans un repère, représenter le nuage de points \((x_i ; y_i)\).
b) Déterminer les coordonnées du point moyen \(G\) du nuage de points.
Correction
a) Représentation du nuage de points :
b) Calcul des coordonnées du point moyen :
Explorez différents ajustements avec des données aléatoires :
L\"objectif est, à partir des valeurs d\"une série statistique à deux variables, d\"obtenir des approximations pour des valeurs inconnues de cette série.
Définitions : L\"interpolation et l\"extrapolation sont des méthodes qui consistent à estimer une valeur inconnue dans une série statistique.
Définition : Lorsque les points d\"un nuage sont sensiblement alignés, on peut construire une droite, appelée droite d\"ajustement (ou droite de régression), passant « au plus près » de ces points.
Cet ajustement consiste à déterminer la droite passant par deux points moyens du nuage de points.
Méthode : Déterminer la droite d\"ajustement par la méthode des points moyens
1) Soit \(G_1\), le point moyen associé aux trois premiers points du nuage et \(G_2\) le point moyen associé aux trois derniers points du nuage.
a) Calculer les coordonnées de \(G_1\) et \(G_2\).
b) On prend \((G_1G_2)\) comme droite d\"ajustement. Tracer cette droite.
Correction
Coordonnées des points moyens :
Représentation de la droite d\"ajustement :
Cette méthode consiste à rechercher la position de la droite d\"ajustement telle que la somme des carrés des distances entre la droite et les points soit minimale.
Propriété : La droite d\"ajustement de \(y\) en \(x\) a pour équation \(y = ax + b\), avec :
\[ a = \frac{\text{cov}(x, y)}{\text{var}(x)}, \quad b = \bar{y} - a\bar{x} \]
où \(\text{cov}(x; y) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})\) est la covariance de \((x, y)\)
et \(\text{var}(x) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2\) est la variance de \(x\).
Méthode : Déterminer la droite d\"ajustement par la méthode des moindres carrés
1) Dans un repère, représenter le nuage de points \((x_i ; y_i)\).
2) a) Déterminer une équation de la droite d\"ajustement par la méthode des moindres carrés.
b) Représenter la droite d\"ajustement de \(y\) en \(x\).
Correction
Calculs pour la méthode des moindres carrés :
Représentation du nuage de points et de la droite d\"ajustement :
Explorez l\"ajustement exponentiel avec des données aléatoires :
Lorsque le nuage de points suggère une croissance exponentielle, on peut utiliser un changement de variable pour linéariser la relation.
Méthode : Pour un ajustement de la forme \(y = ae^{bx}\), on pose \(z = \ln(y)\) et on obtient \(z = \ln(a) + bx\), qui est une relation linéaire entre \(z\) et \(x\).
Exemple : Évolution d\"une population
Le tableau suivant présente l\"évolution d\"une population (en milliers d\"habitants) en fonction du temps :
1) Représenter le nuage de points \((x_i ; y_i)\).
2) Effectuer le changement de variable \(z = \ln(y)\) et représenter le nuage de points \((x_i ; z_i)\).
3) Déterminer l\"équation de la droite d\"ajustement de \(z\) en \(x\).
4) En déduire la fonction d\"ajustement \(y = f(x)\).
Correction
1) Nuage de points original :
2) Nuage de points après changement de variable \(z = \ln(y)\) :
3) Calculs pour l\"ajustement linéaire :
4) Fonction d\"ajustement exponentielle :