venerdì 8 aprile 2016

Psicometria (15/27): Rotazione dei fattori

Ruotare i fattori serve a rendere la soluzione fattoriale più interpretabile.
Il procedimento consiste nel trasformare la matrice delle saturazioni A senza cambiarne le fondamentali proprietà matematiche.
La matrice di trasformazione (T) contiene seni e coseni di un angolo θ (angolo di rotazione) il cui valore non è specificato e che quindi possono esistere infiniti angoli ed infinite matrici T che possono effettuare la trasformazione di A nella nuova matrice ruotata B.
A cambiare sono le saturazioni delle variabili originali nei fattori ruotati, e quindi la parte di varianza spiegata da ogni singolo fattore che risulta più omogenea di prima della rotazione.
Esistono 2 tipi di rotazioni: ortogonali (dove i fattori vengono ruotati lasciando inalterato il vincolo di ortogonalità, cioè continuano a non essere correlati), e oblique (dove i fattori ruotati possono essere correlati tra loro).

La struttura semplice
Nel criterio della struttura semplice si massimizza il numero di zeri nelle righe e nelle colonne della matrice delle saturazioni, e questo significa che ogni fattore deve saturare una minoranza di variabili, e che possibilmente ogni variabile sia spiegata da un solo fattore.
In un fattore, il numero di saturazioni vicino a 0 può essere considerato come indice della semplicità del fattore (indice byperplane count, ovvero il numero di zeri nella colonna rappresenta il numero di variabili che finiscono nell'iperpiano del fattore, cioè il luogo in cui quel fattore è assente, ovvero dove le variabili hanno saturazioni vicine a 0 in quel fattore).
Quando si effettua la rotazione si deve quindi orientare gli assi in modo che il criterio della struttura semplice sia verificato il più possibile.
Thurstone ha individuato 5 criteri perchè una soluzione fattoriale sia considerata semplice:
  1. Ogni variabile dovrebbe avere almeno una saturazione uguale a zero
  2. Ogni fattore dovrebbe avere almeno r (numero di fattori) saturazioni uguali a zero, e queste dovrebbero essere uniche per ogni fattore
  3. Per ogni coppia di fattori ci devono essere almeno r variabili con saturazioni vicine a 0 in un fattore e diverse da 0 in un altro
  4. Quando ci sono più di 3 fattori ogni coppia di fattori dovrebbe contenere un'alta proporzione di variabili con saturazioni uguali a 0 in entrambi i fattori
  5. Per ogni coppia di fattori solo una piccola proporzione di variabili dovrebbe avere saturazioni diverse da 0 in embrambi i fattori
La formula per l'indice di complessità di una variabile esempio i:

formula

Dove: r è il numero dei fattori, a2ij è la saturazione al quadrato della variabile i nel fattore j, a-2ij è la media dei coefficienti di saturazione al quadrato per la variabile i calcolata su tutti gli r.

L'indice totale di semplicità:

formula

Per quantificare la semplicità di un generico fattore j:

formula

Dove: n è il numero di variabili.

La misura totale della semplicità dei fattori:

formula

In generale, sotto il livello di soglia di circa |.30| le saturazioni possono essere inadeguate, inoltre, una struttura è tanto semplice tanto maggiore è la differenza tra la saturazione principale e la secondaria più elevata.
Il rapporto tra la saturazione principale e la più elevata delle secondarie deve essere almeno uguale a 2, solo in questo caso si garantisce una struttura fattoriale sufficientemente semplice.
Tutte le variabili che hanno una saturazione principale > |.30| e hanno un rapporto tra principale e secondaria molto elevato (>2), sono considerate marker puri della dimensione misurata del fattore, mentre quelle che hanno la principale elevata ma il rapporto tra i 1.5 e i 2, possono essere presi in considerazione nell'interpretazione del fattore ma non possono essere considerati come marcatori puri, invece quando negli item c'è saturazione secondaria identica (o quasi) alla primaria, questi non possono essere presi in considerazione nell'interpretazione del fattore.

Rotazioni ortogonali
Esistono diversi metodi:
  • Varimax: Aumenta la semplicità dei fattori, massimizzando la varianza delle saturazioni delle variabili all'interno di ogni fattore.
    Identifica un angolo di rotazione θ in modo che l'indice di semplicità sia massimo, e tende a far diventare le saturazioni elevate più elevate e le basse ancora più basse, in modo che in ogni fattore ci siano alcune variabili con saturazioni elevate a altre basse.
  • Quartimax: Massimizza la semplicità delle variabili a scapito dei fattori, massimizzando la varianza delle saturazioni al quadrato per riga.
    Ha l'effetto di concentrare più varianza possibile per ogni variabile su un solo fattore, in questo modo però può nascere un fattore generale saturato da più o meno tutte le variabili, condizione utile solo se il ricercatore si attende una soluzione con un solo fattore.
  • Tandem Criteria Analysis (TCA): Utilizza nel processo di rotazione le correlazioni tra le variabili osservate, ed è diviso in 2 fasi.
    La prima fase si basa sul principio che se 2 variabili sono correlate devono apparire su uno stesso fattore, così le soluzioni ottenute concentrano sui primi fattori più varianza possibile.
    Dopo la rotazione della prima fase si possono eliminare quei fattori con saturazioni <.3 in valore assoluto, i fattori con saturazione tra .3 e .45 e nessuna saturazione intorno a .5 possono essere considerati come marginali e volendo eliminati, mentre sono ritenuti validi quelli con >.5.
    Nella seconda fase, c'è invece il criterio che se 2 variabili non sono correlate tra loro allora non devono apparire su uno stesso fattore.
Varimax semplifica i fattori, Quartimax le variabili, quindi i risultati di Varimax sono più chiari e generalizzabili, però il metodo TCA è ancora migliore di Varimax, soprattutto se il numero di fattori estratti è elevato.

Rotazioni oblique
Esistono diversi metodi:
  • Oblimin: Semplifica la matrice delle saturazioni fattoriali, facendo in modo che le variabili abbiano saturazioni il più possibile vicine a 0 in tutti i fattori tranne 1.
    La funzione usata è la seguente:
    formula
    Dove: δ è un valore che controlla il grado di obliquità della soluzione.
  • Promax: La matrice non ruotata viene trasformata in una matrice più semplice in cui i fattori non sono correlati, le saturazioni vengono elevate alla seconda, alla quarta,o a potenza maggiori, una o più volte, in modo che quelle più basse vengono rese sempre più piccole e la matrice fattoriale più semplice.
    Questa matrice semplice viene usata poi come bersaglio e vengono effettuati dei calcoli che fanno in modo che la matrice ortogonale originale non ruotata sia resa più simile possibile ad essa, eliminando il vincolo che i fattori siano ortogonali.
Entrambi questi tipi di rotazioni danno risultati soddisfacenti e molto simili, inoltre è possibile variare il grado di obliquità della soluzione, anche se bisogna tenere conto che:
  • diminuendo l'obliquità di solito aumentano le variabili con saturazioni secondarie diverse da zero in più fattori
  • aumentando senza controllo l'obliquità si rischia di arrivare a fattori troppo correlati e quindi non distinguibili
Le soluzioni oblique danno origine a strutture fattoriali più semplici di quelle ottenute con le ortogonali, anche quando i fattori non risultano correlati, però implicano la stima di un numero maggiore di parametri.
In generale, conviene sempre prima effettuare sempre prima la soluzione obliqua ed eventualmente passare a quella ortogonale se nessuna delle correlazioni tra i fattori risulta maggiore di |.30|.

Nelle soluzioni oblique ci sono due diverse matrici che riassumono le relazioni tra variabili e fattori: la matrice pattern (P) che contiene i coefficienti relativi all'impatto diretto di ciascun fattore sulle variabili al netto dell'impatto degli altri fattori (che corrispondono ai pesi beta della regressione multipla), che vengono esaminati per interpretare i fattori derivati dalle rotazioni oblique, e la matrice struttura (S) che contiene le correlazioni tra le variabili e i fattori e può essere ricavata dalla matrice pattern moltiplicandola per la matrice Φ che contiene le correlazioni tra i fattori, quindi: S=PΦ.
Dopo la rotazione obliqua, per riprodurre R è necessario considerare entrambe le matrici P e S: R^1=PΦP' e R^=PΦP+U2
I coefficienti del pattern fattoriale rappresentano l'influenza del fattore sulla variabile al netto dell'altro fattore (effetto diretto del fattore sulla variabile), e le correlazioni tra variabili e fattori sono gli elementi della matrice struttura, che si ottengono sommando agli effetti diretti del fattore sulla variabile, gli effetti della relazione del fattore sulla variabile osservata attraverso la correlazione con un altro fattore.
In generale, la presenza di fattori correlati rende più complessa l'operazione di riproduzione delle correlazioni osservate.

<< Lezione precedente - Prossima lezione >>


Torna all'elenco delle lezioni

 


Lascia un commento!