giovedì 14 aprile 2016

Psicometria (17/27): Assunzioni, prerequisiti e misurazione dei fattori

Fattorializzabilità della matrice
Se nessuna correlazione supera la soglia di |.30|, non ha molto senso effettuare l'analisi fattoriale.
Esistono 2 metodi per esaminare la grandezza delle correlazioni tra variabili:

  1. Il test di sfericità di Bartlett esamina l'ipotesi nulla che R=I, dove se il test è significativo e il campione è sufficientemente ampio, si può effettuare l'analisi fattoriale.
  2. Il test di adeguatezza campionaria: KMO=SiSjr2ij/(SiSjr2ij+SiSjp2ij)
    Dove: rij sono le correlazioni tra ogni coppia di variabili e pij sono le correlazioni tra ogni coppia di variabili parzializzate rispetto a tutte le altre.
    Valori >.90 sono considerati eccellenti, tra .80 e .90 buoni, .70 e .80 accettabili, .60 e .70 mediocri, <.60 sono scarsi ed inaccettabili.
Livelli di misura delle variabili e coefficienti di correlazione
Se il numero di categorie ordinabili di una variabile è sufficiente (>5) e se la distribuzione è normale, l'analisi fattoriale può essere applicata senza problemi, ed in questi casi il coefficiente di correlazione di Pearson è quello che da stime più stabili sull'associazione delle variabili.
Se il numero delle categorie è inferiore a 5, se i dati non sono normali e se le variabili sono nominali o dicotomiche, conviene invece usare altri approcci d'analisi, come quello sui coefficienti tetracorici o policorici.

Outlier tra casi e variabili
Le variabili outlier sono quelle che non correlano con le altre variabili in analisi e vanno a definire fattori residuali e poco attendibili.
Ogni variabile che ha un coefficiente di correlazione multipla al quadrato con le altre molto basso, o un indice KMO molto basso, è un potenziale outlier.

Normalità e linearità
Se le distribuzioni delle variabili sono normali la soluzione ottenuta è migliore, dato che i coefficienti di correlazione sono più affidabili.
Nelle analisi che usano procedure di inferenza statistica per stabilire il numero di fattori (come GLS e ML), la normalità multivariata delle variabili viene assunta, quindi la violazione di questa assunzione porta a risultati distorti, tuttavia, in alcuni casi, se si usano delle apposite trasformazioni è possibile linearizzare la relazione e quindi fare l'analisi fattoriale sui punteggi così trasformati.

Ampiezza e qualità del campione
In genere, campioni di 50 unità sono considerati scarsi, di 100 mediocri, di 200 adeguati, di 300 buoni, di 500 come molto buoni, di 1000 come eccellenti.
In generale cmq è consigliato non scendere sotto i 100 soggetti e non avere mai meno di 5 casi per ogni variabile osservata.
Risultati migliori si hanno: con campioni più grandi rispetto a campioni più piccoli, con un rapporto più elevato tra numero di variabili e numero di fattori, con valori elevati di comunalità.
Inoltre, un campione molto selezionato ed omogeneo può portare ad una riduzione delle variabilità delle variabili e quindi delle correlazioni.

Numero di variabili
Il numero di item che viene stimato nella soluzione deve essere inferiore al numero di elementi che viene esaminato per stimarlo, di solito, è meglio se il numero di variabili è 3 o 4 volte superiore al numero dei fattori.

Misurare i fattori
Il calcolo dei punteggi fattoriali è un indice che consente di esprimere la quantità di quel determinato fattore per tutti i soggetti che si vogliono esaminare.
Solo nell'analisi delle componenti principali è possibile calcolare direttamente il punteggio fattoriale, invece nell'analisi fattoriale vera e propria è impossibile identificare l'esatto punteggio nel fattore comune usando le variabili osservate, perchè ogni variabile ha anche una componente unica che viene confusa con la parte della variabilità dovuta a fattori comuni.
In questi casi si può stimare il punteggio fattoriale relativo ai fattori comuni, con diversi metodi:
Il metodo della regressione individua una scala fattoriale f* (che rappresenta la combinazione lineare dei punteggi nelle variabili osservate) tale che la correlazione tra il fattore latente F e la scala f* sia massima.
I punteggi nella scala f* per tutti i soggetti esaminati sono ottenuti con la formula: F*=ZR-1A, dove F* è la matrice che contiene i punteggi dei soggetti nella scala fattoriale, A è la matrice delle saturazioni, R è la matrice delle correlazioni e Z è la matrice dei punteggi standardizzati nelle variabili osservate.
La matrice B=R-1A consente di ottenere i coefficienti di ponderazione cercati (coefficienti dei punteggi fattoriali).
Un problema di questo metodo è che anche se i fattori sono stati trovati con una rotazione ortogonale, l'ortogonalità dei punteggi fattoriali può non essere garantita.
Si può anche esaminare la qualità dei fattori tramite i coefficienti di determinazione fattoriale che stimano la correlazione tra il fattore latente F e la scala fattoriale f*.
Questa correlazione esprime quanto bene i fattori sono misurati dagli item del modello.
Il coefficiente va da 0 a 1, e valori elevati stanno ad indicare un'elevata qualità della misurazione.

<< Lezione precedente - Prossima lezione >>


Torna all'elenco delle lezioni

 


Piaciuto l'articolo? Lascia un commento!

EmoticonEmoticon