La multicollinearità è uno stato di interrelazioni o interassociazioni molto elevate tra le variabili indipendenti. È quindi un tipo di disturbo nei dati, e se presente nei dati le inferenze statistiche fatte sui dati potrebbero non essere affidabili.

Ci sono alcune ragioni per cui si verifica la multicollinearità:

È causata dall’utilizzo sbagliato di fattori fittizi.

È causata dalla considerazione di una variabile che viene elaborata a partire da diversi fattori dell’indice informativo.

Anche la multicollinearità può derivare dalla ridondanza di un fattore simile.

In generale accade quando i fattori sono profondamente legati l’uno all’altro.

La multicollinearità può portare ad alcuni problemi. Questi problemi sono i seguenti:

Il coefficiente di ricaduta a metà strada a causa della multicollinearità potrebbe non essere valutato in modo assoluto. Gli errori standard saranno probabilmente elevati.

La multicollinearità porta ad un aggiustamento dei segni, così come l’estensione dei coefficienti di ricaduta frazionaria, partendo da un esempio e passando all’esempio successivo.

La multicollinearità rende noioso valutare l’importanza relativa delle variabili indipendenti nel chiarire la varietà apportata dalla variabile dipendente.

Nell’ottica di un’elevata multicollinearità, gli intervalli di certezza dei coefficienti diventeranno, in generale, eccezionalmente ampi e gli approfondimenti saranno, in generale, estremamente ridotti. Si fa fatica a respingere la speculazione non valida di qualsiasi indagine quando la multicollinearità è disponibile nelle informazioni in esame.

Ci sono alcuni segnali che aiutano il ricercatore a rilevare il grado di multicollinearità.

Uno di questi segni è se il risultato individuale di una misurazione non è enorme, ma il risultato generale della misurazione è enorme. In questa occasione, lo scienziato può ottenere una miscela di risultati critici e irrilevanti che mostrano la vicinanza della multicollinearità. Supponiamo che lo specialista, dopo aver diviso l’esempio in due sezioni, trovi che i coefficienti dell’esempio contrastino definitivamente. Questo mostra la vicinanza della multicollinearità. Ciò implica che i coefficienti sono instabili a causa della vicinanza della multicollinearità. Si supponga che lo scienziato osservi un intenso cambiamento nel modello includendo o lasciando cadere qualche variabile. Anche questo mostra che la multicollinearità è disponibile nelle informazioni.

Anche la multicollinearità può essere riconosciuta con l’aiuto della resilienza ed è uguale, fattore di inflazione di varianza (VIF). Nella remota possibilità che la stima della resistenza sia inferiore a 0,2 o 0,1 e, allo stesso tempo, la stima del VIF 10 o più, a quel punto la multicollinearità è pericolosa.