Bases de la régression pour l’analyse commerciale



Si vous vous êtes déjà demandé comment deux éléments de données ou plus sont liés les uns aux autres (par exemple, comment le PIB est affecté par les changements du chômage et de l’inflation), ou si votre patron vous a déjà demandé de créer une prévision ou d’analyser des prévisions basées sur sur les relations entre les variables, alors l’apprentissage de l’analyse de régression vaudrait bien votre temps.

Dans cet article, vous apprendrez les bases de la régression linéaire simple, parfois appelée « des moindres carrés ordinaires » ou régression OLS, un outil couramment utilisé dans les prévisions et l’analyse financière. Nous commencerons par apprendre les principes de base de la régression, d’abord la covariance et la corrélation, puis nous passerons à la construction et à l’interprétation d’une sortie de régression. Les logiciels d’entreprise populaires tels que Microsoft Excel peuvent effectuer tous les calculs de régression et les sorties pour vous, mais il est toujours important d’apprendre les mécanismes sous-jacents.

Points clés à retenir

  • La régression linéaire simple est couramment utilisée dans les prévisions et l’analyse financière, pour qu’une entreprise indique comment un changement du PIB pourrait affecter les ventes, par exemple.
  • Microsoft Excel et d’autres logiciels peuvent faire tous les calculs, mais il est bon de savoir comment fonctionne la mécanique de la régression linéaire simple.

Variables

Au cœur d’un modèle de régression se trouve la relation entre deux variables différentes, appelées variables dépendantes et indépendantes. Par exemple, supposons que vous vouliez prévoir les ventes de votre entreprise et que vous ayez conclu que les ventes de votre entreprise montent et descendent en fonction de l’évolution du PIB.

Les ventes que vous prévoyez seraient la variable dépendante car leur valeur « dépend » de la valeur du PIB et le PIB serait la variable indépendante. Vous devrez ensuite déterminer la force de la relation entre ces deux variables afin de prévoir les ventes. Si le PIB augmente/diminue de 1 %, de combien vos ventes augmenteront-elles ou diminueront-elles ?

Covariance

En tant que

C

o

v

(

X

,

oui

)

=

??

(

X

m

X

vous

)

(

oui

m

oui

vous

)

N

begin{aligned} &Cov(x,y) = sum frac { ( x_n – x_u )( y_n – y_u) }{ N } \ end{aligned} Cov(X,oui)=??N(XmXvous)(ouimouivous)En tant que

La formule pour calculer la relation entre deux variables est appelée covariance. Ce calcul vous montre la direction de la relation. Si une variable augmente et que l’autre variable tend à augmenter également, la covariance serait positive. Si une variable augmente et que l’autre a tendance à baisser, la covariance serait alors négative.

Le nombre réel que vous obtenez en calculant cela peut être difficile à interpréter car il n’est pas standardisé. Une covariance de cinq, par exemple, peut être interprétée comme une relation positive, mais on ne peut dire que la force de la relation est plus forte que si le nombre était quatre ou plus faible que si le nombre était six.

Coefficient de corrélation

En tant que

C

o

r

r

e

je

une

t

je

o

m

=

??

X

oui

=

C

o

v

X

oui

s

X

s

oui

begin{aligned} &Correlation = rho_{xy} = frac { Cov_{xy} }{ s_x s_y } \ end{aligned} Correjeunetjeom=??Xoui=sXsouiCovXouiEn tant que

Nous devons normaliser la covariance afin de nous permettre de mieux l’interpréter et de l’utiliser dans la prévision, et le résultat est le calcul de corrélation. Le calcul de corrélation prend simplement la covariance et la divise par le produit de l’écart type des deux variables. Cela liera la corrélation entre une valeur de -1 et +1.

Une corrélation de +1 peut être interprétée comme suggérant que les deux variables évoluent parfaitement positivement l’une avec l’autre et un -1 implique qu’elles sont parfaitement corrélées négativement. Dans notre exemple précédent, si la corrélation est de +1 et que le PIB augmente de 1 %, alors les ventes augmenteraient de 1 %. Si la corrélation est de -1, une augmentation de 1 % du PIB entraînerait une baisse de 1 % des ventes, c’est exactement le contraire.

Équation de régression

Maintenant que nous savons comment la relation relative entre les deux variables est calculée, nous pouvons développer une équation de régression pour prévoir ou prédire la variable que nous désirons. Vous trouverez ci-dessous la formule d’une régression linéaire simple. Le « y » est la valeur que nous essayons de prévoir, le « b » est la pente de la droite de régression, le « x » est la valeur de notre valeur indépendante et le « a » représente l’ordonnée à l’origine. L’équation de régression décrit simplement la relation entre la variable dépendante (y) et la variable indépendante (x).

En tant que

oui

=

b

X

+

une

begin{aligné} &y = bx + a \ end{aligné} oui=bX+uneEn tant que

L’interception, ou « a », est la valeur de y (variable dépendante) si la valeur de x (variable indépendante) est zéro, et est donc parfois simplement appelée « constante ». Donc, s’il n’y avait pas de changement dans le PIB, votre entreprise ferait quand même des ventes. Cette valeur, lorsque la variation du PIB est nulle, est l’interception. Jetez un œil au graphique ci-dessous pour voir une représentation graphique d’une équation de régression. Dans ce graphique, il n’y a que cinq points de données représentés par les cinq points sur le graphique. La régression linéaire tente d’estimer une ligne qui correspond le mieux aux données (une ligne de meilleur ajustement) et l’équation de cette ligne donne l’équation de régression.

Image de Julie Bang © Investopedia 2019

Régressions dans Excel

Maintenant que vous comprenez le contexte d’une analyse de régression, prenons un exemple simple à l’aide des outils de régression d’Excel. Nous nous appuierons sur l’exemple précédent consistant à essayer de prévoir les ventes de l’année prochaine en fonction des variations du PIB. Le tableau suivant répertorie certains points de données artificiels, mais ces chiffres peuvent être facilement accessibles dans la vie réelle.

An Ventes PIB
2015 100 1,00 %
2016 250 1,90 %
2017 275 2,40%
2018 200 2,60 %
2019 300 2,90%

En regardant simplement le tableau, vous pouvez voir qu’il va y avoir une corrélation positive entre les ventes et le PIB. Les deux ont tendance à monter ensemble. Avec Excel, il vous suffit de cliquer sur le Outils menu déroulant, sélectionnez L’analyse des données et de là choisir Régression. La boîte contextuelle est facile à remplir à partir de là ; votre plage d’entrée Y est votre colonne « Ventes » et votre plage d’entrée X est le changement dans la colonne PIB ; choisissez la plage de sortie pour laquelle vous souhaitez que les données s’affichent sur votre feuille de calcul et appuyez sur OK. Vous devriez voir quelque chose de similaire à ce qui est donné dans le tableau ci-dessous :

Coefficients des statistiques de régression

R multiple 0,8292243 Intercepter 34.58409

R Carré

0,687613 PIB 88.15552
Ajusté

R Carré

0.583484

Erreur standard 51.021807

Observations 5

Interprétation

Les principaux résultats dont vous devez vous préoccuper pour une régression linéaire simple sont le R au carré, l’interception (constante) et le coefficient bêta (b) du PIB. Le nombre R au carré dans cet exemple est de 68,7 %. Cela montre à quel point notre modèle prédit ou prévoit les ventes futures, suggérant que les variables explicatives du modèle ont prédit 68,7 % de la variation de la variable dépendante. Ensuite, nous avons une intersection de 34,58, qui nous indique que si la variation du PIB était prévue à zéro, nos ventes seraient d’environ 35 unités. Et enfin, le bêta du PIB ou coefficient de corrélation de 88,15 nous indique que si le PIB augmente de 1%, les ventes augmenteront probablement d’environ 88 unités.

La ligne de fond

Alors, comment utiliseriez-vous ce modèle simple dans votre entreprise ? Eh bien, si vos recherches vous portent à croire que la prochaine variation du PIB sera un certain pourcentage, vous pouvez intégrer ce pourcentage au modèle et générer une prévision de vente. Cela peut vous aider à élaborer un plan et un budget plus objectifs pour l’année à venir.

Bien sûr, il ne s’agit que d’une simple régression et vous pouvez créer des modèles qui utilisent plusieurs variables indépendantes appelées régressions linéaires multiples. Mais les régressions linéaires multiples sont plus compliquées et posent plusieurs problèmes qui nécessiteraient un autre article pour en discuter.

Laisser un commentaire