Nuage de points, ajustement affine et coefficient de corrélation
avec données aléatoires
Générez de nouvelles données aléatoires pour explorer les concepts :
Une série statistique à deux variables quantitatives est une série pour laquelle deux caractères mesurables sont relevés sur une même population.
Elle peut se présenter sous la forme d'un tableau, en lignes ou en colonnes.
On considère deux variables statistiques \(x\) et \(y\) observées sur une même population de \(n\) individus.
La variable \(x\) prend les valeurs \(x_1, x_2, \ldots, x_n\) et la variable \(y\) prend les valeurs \(y_1, y_2, \ldots, y_n\) .
Définition : Dans un repère orthogonal, l'ensemble des points \(M_i\) de coordonnées \((x_i ; y_i)\), avec \(1 \leq i \leq n\), est appelé le nuage de points associé à la série statistique.
Un nuage de points est la représentation graphique d'une série statistique à deux variables quantitatives, formé par Les couples \((x_1 ; y_1), (x_2 ; y_2), \ldots, (x_n ; y_n)\) .
.Définition : Le point \(G\) de coordonnées \((\bar{x} ; \bar{y})\), où \(\bar{x}\) et \(\bar{y}\) sont les moyennes respectives des \(x_i\) et des \(y_i\), est appelé le point moyen du nuage de points.
Méthode : Représenter un nuage de points
Le tableau suivant présente l\"évolution du budget publicitaire et du chiffre d\"affaire d\"une société :
a) Dans un repère, représenter le nuage de points \((x_i ; y_i)\).
b) Déterminer les coordonnées du point moyen \(G\) du nuage de points.
Correction
a) Représentation du nuage de points :
b) Calcul des coordonnées du point moyen :
Explorez différents ajustements avec des données aléatoires :
L\"objectif est, à partir des valeurs d\"une série statistique à deux variables, d\"obtenir des approximations pour des valeurs inconnues de cette série.
Définitions : L\"interpolation et l\"extrapolation sont des méthodes qui consistent à estimer une valeur inconnue dans une série statistique.
Définition : Lorsque les points d\"un nuage sont sensiblement alignés, on peut construire une droite, appelée droite d\"ajustement (ou droite de régression), passant « au plus près » de ces points.
Cet ajustement consiste à déterminer la droite passant par deux points moyens du nuage de points.
Méthode : Déterminer la droite d\"ajustement par la méthode des points moyens
1) Soit \(G_1\), le point moyen associé aux trois premiers points du nuage et \(G_2\) le point moyen associé aux trois derniers points du nuage.
a) Calculer les coordonnées de \(G_1\) et \(G_2\).
b) On prend \((G_1G_2)\) comme droite d\"ajustement. Tracer cette droite.
Correction
Coordonnées des points moyens :
Représentation de la droite d\"ajustement :
Cette méthode consiste à rechercher la position de la droite d\"ajustement telle que la somme des carrés des distances entre la droite et les points soit minimale.
Propriété : La droite d\"ajustement de \(y\) en \(x\) a pour équation \(y = ax + b\), avec :
\[ a = \frac{\text{cov}(x, y)}{\text{var}(x)}, \quad b = \bar{y} - a\bar{x} \]
où \(\text{cov}(x; y) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})\) est la covariance de \((x, y)\)
et \(\text{var}(x) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2\) est la variance de \(x\).
Méthode : Déterminer la droite d\"ajustement par la méthode des moindres carrés
1) Dans un repère, représenter le nuage de points \((x_i ; y_i)\).
2) a) Déterminer une équation de la droite d\"ajustement par la méthode des moindres carrés.
b) Représenter la droite d\"ajustement de \(y\) en \(x\).
Correction
Calculs pour la méthode des moindres carrés :
Représentation du nuage de points et de la droite d\"ajustement :
Explorez l\"ajustement exponentiel avec des données aléatoires :
Lorsque le nuage de points suggère une croissance exponentielle, on peut utiliser un changement de variable pour linéariser la relation.
Méthode : Pour un ajustement de la forme \(y = ae^{bx}\), on pose \(z = \ln(y)\) et on obtient \(z = \ln(a) + bx\), qui est une relation linéaire entre \(x\) et \(z\).
Exemple : Évolution d\"une population
Le tableau suivant présente l\"évolution d\"une population (en milliers d\"habitants) en fonction du temps :
1) Représenter le nuage de points \((x_i ; y_i)\).
2) Effectuer le changement de variable \(z = \ln(y)\) et représenter le nuage de points \((x_i ; z_i)\).
3) Déterminer l\"équation de la droite d\"ajustement de \(z\) en \(x\).
4) En déduire la fonction d\"ajustement \(y = f(x)\).
Correction
1) Nuage de points original :
2) Nuage de points après changement de variable \(z = \ln(y)\) :
3) Calculs pour l\"ajustement linéaire :
4) Fonction d\"ajustement exponentielle :