logo RankiaItalia

Cos’è la regressione lineare multipla (MLR)? Modello, formula e requisiti

La regressione lineare multipla (MLR) è una tecnica statistica per prevedere una variabile dipendente usando più variabili indipendenti. Scopri come funziona e i requisiti necessari per utilizzarla.
Modello di Regressione lineare multipla

La regressione lineare multipla è un’estensione della regressione lineare semplice, in cui la relazione tra le variabili è descritta da una retta. Quando le variabili indipendenti sono più di una, il modello diventa “multiplo”. In questo articolo scoprirai come definire correttamente un modello di regressione lineare multipla.

Cos'è la regressione lineare multipla (MLR)? 

La regressione lineare multipla tenta di adattare modelli lineari o linearizzabili tra una variabile dipendente e più di una variabile indipendente. In questo tipo di modello, è essenziale testare l'eteroschedasticità, la multicollinearità e la specificazione. 

Si tratta di una tecnica statistica utilizzata per prevedere il risultato di una variabile in base al valore di due o più variabili. La variabile da prevedere è la variabile dipendente, ovvero quella variabile che cambia a seconda del valore di un'altra variabile o variabile indipendente.  

Esistono diverse forme di regressione: oltre alla regressione multipla lineare, che assume una relazione lineare tra le variabili, si può ricorrere anche a modelli di regressione non lineare, quando la relazione non può essere rappresentata da una semplice retta. In quest’ultimo caso, si usano funzioni più complesse o trasformazioni per modellare il comportamento della variabile dipendente, ma l’interpretazione e la stima del modello risultano generalmente più impegnative.

Variabile dipendente e variabili indipendenti

Nel modello di regressione lineare multipla, la variabile dipendente (o risposta) è quella che si cerca di prevedere o spiegare. Essa rappresenta l’esito o il fenomeno osservato, il cui valore dipende da una combinazione di altre variabili.

Le variabili indipendenti (o esplicative) sono invece quelle che si presume influenzino la variabile dipendente. In un modello multiplo, queste possono essere due o più, e ognuna contribuisce in modo differente alla previsione del valore atteso della variabile di risposta.

Ad esempio, in ambito finanziario, se si vuole prevedere il rendimento di un’azione (variabile dipendente), si possono considerare come variabili indipendenti l’andamento dell’indice di mercato, i tassi d’interesse e la volatilità attesa.

È fondamentale selezionare con attenzione le variabili indipendenti da includere nel modello, evitando ridondanze e collinearità, per garantire l’affidabilità dell’analisi.

Formula di regressione lineare multipla 

Formula di regressione lineare multipla 

In cui si: 

  • Yi: variabile dipendente o prevedibile 
  • β0: intercetta y, cioè,  il valore di quando sia xi che x2 sono 0
  • β1 e β2: coefficienti di regressione che rappresentano la variazione di y rispetto alla variazione di una unità di xi1 e xi2, rispettivamente. 
  • Βp: coefficiente di pendenza per ogni variabile indipendente 
  • ϵ: termine di errore casuale (residuo) del modello. 

A cosa serve la regressione lineare multipla 

In ambito finanziario, la regressione lineare multipla è ampiamente utilizzata per analizzare e prevedere il comportamento di variabili economiche e di mercato. Tra le principali applicazioni:

Prevedere il rendimento di un’azione, utilizzando come variabili indipendenti l’andamento dell’indice di riferimento (es. S&P 500), i tassi d’interesse e la volatilità di mercato.

  • Valutare il prezzo equo di un titolo, in funzione di variabili fondamentali come utili per azione (EPS), flusso di cassa operativo e leva finanziaria.
  • Stimare la performance di un portafoglio, considerando l’esposizione a diversi fattori di rischio (es. premi di mercato, fattori settoriali o geografici).
  • Costruire modelli di scoring del rischio di credito, sulla base di indicatori finanziari aziendali, come il rapporto debito/patrimonio o la variabilità degli utili.
  • Analizzare l’impatto di variabili macroeconomiche (PIL, inflazione, tasso di disoccupazione) su asset finanziari o mercati specifici.
  • In alternativa, è possibile confrontare risultati ottenuti da una regressione lineare semplice e multipla, per verificare quanto guadagno in precisione offra l’inclusione di più variabili esplicative.
  • Infine, in presenza di più variabili dipendenti da spiegare simultaneamente, si può ricorrere alla regressione multivariata, utile per analisi più articolate in ambito macroeconomico o aziendale.

In tutti questi casi, il modello tenta di stabilire una relazione lineare tra la variabile dipendente (es. prezzo, rendimento, rating) e due o più variabili indipendenti.

Dove applicare la regressione lineare multipla per l’analisi finanziaria?

Freedom24

broker image

Prodotti offerti

Azioni, ETF, Futures, Opzioni

Piattaforma

WebTrader

Visita

XTB

broker image

Prodotti offerti

Forex, Azioni, Commodities, ETF, CFD, Criptovalute, Piano d'Accumulo del Capitale

Piattaforma

Trader Workstation(TWS), xStation

Visita

Requisiti di regressione lineare multipla 

È necessario considerare i seguenti requisiti per poter utilizzare la tecnica di regressione multipla: 

Normalità ed equidistribuzione dei rifiuti 

Per ottenere un buon modello di regressione multipla, non è sufficiente che i residui siano piccoli, poiché la validità del modello richiede una distribuzione normale e con la stessa dispersione ogni combinazione di valori nelle variabili indipendenti. 

Numero di variabili indipendenti 

Una regola che molti raccomandano è quella di includere almeno venti osservazioni per ogni variabile indipendente considerata a priori interessante nel modello, poiché numeri più bassi possono portare a nessuna conclusione ed errori di tipo II. 

Linearità 

Si presume che la variabile di risposta sia quella che dipende linearmente dalle variabili esplicative. Se la risposta non sembra essere lineare, i componenti non lineari devono essere inseriti nel modello. 

Collinearità 

Se due variabili indipendenti sono strettamente correlate ed entrambe sono incluse in un modello, è molto probabile che nessuna di queste sia considerata significativa, sebbene se solo una di queste fosse stata inclusa, potrebbe essere considerata significativa. 

Una tecnica molto semplice per rilevare la collinearità consiste nell'esaminare i coefficienti del modello per vedere se diventano instabili quando viene introdotta la nuova variabile. 

Osservazioni anomale 

Infine, le anomalie devono essere accuratamente identificate e, se necessario, scartate, poiché queste hanno una grande influenza sul risultato. A volte, sono solo errori nell'inserimento dei dati, ma con grandi conseguenze nell'analisi. 

Pubblicità
Articoli correlati