Droite de régression linéaire
Entrez deux séries de valeurs pour obtenir l'équation y = ax + b par la méthode des moindres carrés, ainsi que le coefficient de détermination R².
Régression linéaire simple
Régression linéaire : modéliser une relation entre deux variables
La régression linéaire est l'une des méthodes statistiques les plus utilisées. Elle permet de modéliser la relation entre une variable explicative X et une variable expliquée Y par une équation de droite : y = ax + b. La pente a indique de combien Y augmente quand X augmente d'une unité, et l'ordonnée à l'origine b donne la valeur de Y quand X = 0.
Le calcul utilise la méthode des moindres carrés : on cherche la droite qui minimise la somme des carrés des écarts verticaux entre les points observés et la droite. Les formules sont : a = cov(X, Y) / var(X) et b = y − a × x. Le coefficient de détermination R², compris entre 0 et 1, mesure la qualité de l'ajustement : R² = 1 signifie un ajustement parfait, R² = 0 indique que la droite n'explique aucune variation.
Notre calculateur traite vos données instantanément : entrez les valeurs de X et Y (avec le même nombre de points) et obtenez l'équation de la droite, le R² et les coefficients détaillés.
Où utilise-t-on la régression linéaire ?
La régression linéaire est partout :
- Économie : prédire la consommation des ménages en fonction du revenu, ou les ventes en fonction du budget publicitaire.
- Sciences : calibrer un instrument de mesure (loi de Beer-Lambert en chimie, droite d'étalonnage).
- Immobilier : estimer le prix d'un bien en fonction de sa surface ou d'autres caractéristiques.
- Sport et santé : prédire les performances ou suivre une évolution (poids, temps de course).
- Machine learning : la régression linéaire est l'algorithme de base de l'apprentissage supervisé.
Questions fréquentes
Comment interpréter le coefficient R² ?
R² exprime la part de variance de Y expliquée par X. R² = 0,9 signifie que 90 % de la variation de Y est expliquée par la droite ; les 10 % restants viennent d'autres facteurs ou du hasard. En sciences exactes on cherche R² > 0,95 ; en sciences sociales, R² > 0,5 est déjà un bon résultat.
Qu'est-ce que la méthode des moindres carrés ?
C'est la méthode standard pour trouver la "meilleure" droite. Elle consiste à minimiser la somme des carrés des distances verticales entre chaque point et la droite. On utilise les carrés pour éviter que les écarts positifs et négatifs s'annulent et pour pénaliser plus fortement les grands écarts.
Quand la régression linéaire n'est-elle pas adaptée ?
Quand la relation entre X et Y n'est pas linéaire (courbe, exponentielle, en forme de cloche), la droite donne un mauvais ajustement avec un R² faible. Dans ce cas, il faut utiliser une régression non linéaire ou transformer les variables (logarithme, racine).
Combien de points minimum pour une régression ?
Mathématiquement, deux points suffisent à tracer une droite, mais pour qu'une régression ait du sens statistique il faut au moins 5 à 10 points. Plus l'échantillon est grand, plus l'estimation est fiable. Pour des données bruitées, on recommande 30 points minimum.