martedì 1 marzo 2016

Statistica (10/19): Distribuzioni di frequenza con 2 variabili

Per analizzare le distribuzioni di frequenza con 2 variabili si usano le tabelle a doppia entrata (o di contingenza).

Ecco un esempio pratico di tabella a doppia entrata:

Tabella a doppia entrata 3x4

Poco Abbastanza Tanto Tantissimo
Intelligenza
Forza
Furbizia
 

Questo genere di distribuzione viene detta distribuzione bivariata.
Va indicato per convenzione il nome della tabella con il numero delle colonne x le righe (e Tabella a doppia entrata 3x4).
Questa tabella è a due variabili quindi viene detta bidimensionale.
In genere cmq, non si va mai oltre alle tabelle tridimensionali.

Ora verrà riportata dentro ogni cella la frequenza, detta frequenza di cella o frequenza congiunta, espressa anche in percentuale (percentuale di cella o percentuale congiunta).
Sommando tutte le frequenze si otterrà il numero totale dei casi osservati, mentre sommando tutte le percentuali, si dovrà ottenere 100.
Queste somme andranno riportate nell'ultima cella libera in basso a destra.

Tabella a doppia entrata 3x4 con frequenze semplici
Frequenze Poco Abbastanza Tanto Tantissimo
Intelligenza  3  2
Forza  3  1
Furbizia  2  0 1
 20

Tabella a doppia entrata 3x4 con percentuali
Percentuali Poco Abbastanza Tanto Tantissimo
Intelligenza 15  10
Forza 15 30   5
Furbizia 10  0 5
 100

Sommando per ciascuna righe le varie frequenze, si ottiene la distribuzione marginale di riga, che verrà scritta nell'ultima cella di destra della riga in esame.
Nello stesso modo, con le percentuali otterremo le percentuali marginali di riga.

Tabella a doppia entrata 3x4 con frequenze semplici con distribuzione marginale di riga
Frequenze Poco Abbastanza Tanto Tantissimo
Intelligenza  3  2  6
Forza  3  1  10
Furbizia  2  0 1  4
 20

Tabella a doppia entrata 3x4 con percentuali con percentuale marginale di riga
Percentuali Poco Abbastanza Tanto Tantissimo
Intelligenza 15  10 30
Forza 15 30   5  50 
Furbizia 10  0 5  20
 100

Sommando le frequenze di ciascuna colonna, si otterrà la distribuzione marginale di colonna.
Nello stesso modo si ricavano, con le percentuali, le percentuali marginali di colonna.
Questi valori vengono scritti nell'ultima cella in basso della colonna in esame.

Tabella a doppia entrata 3x4 con frequenze semplici con distribuzione marginale di colonna
Frequenze Poco Abbastanza Tanto Tantissimo
Intelligenza  3  2  6
Forza  3  1  10
Furbizia  2  0 1  4
 8 8  3  1  20

Tabella a doppia entrata 3x4 con percentuali con percentuale marginale di colonna
Percentuali Poco Abbastanza Tanto Tantissimo
Intelligenza 15  10 30
Forza 15 30   5  50 
Furbizia 10  0 5  20
 40 40   15  15  100

La distribuzione condizionata è la distribuzione in percentuale di una variabile, entro una specifica categoria dell'altra variabile.
Ovvero ad esempio, nella categoria Forza, i valori percentuali delle categorie poco, abbastanza, tanto e tantissimo.
La percentuale viene calcolata sui subtotali che compongono le distribuzioni marginali, lavorando per riga o per colonna, a seconda della distribuzione condizionata che si vuole rilevare.

Esempio di calcolo delle percentuali condizionate sui marginali di riga:

Categoria Frequenza Calcolo Percentuale
Poco 3 (3/6)*100=  50 
Abbastanza  1 (1/6)*100=  17
Tanto  2 (2/6)*100=  33 
Tantissimo  0 (0/6)*100=   0
n=6   Tot=100

Come si nota, la somma delle percentuali ottenute, dovrà essere sempre 100.
Ecco la rappresentazione in tabella:

Percentuali Poco Abbastanza Tanto Tantissimo
Intelligenza 50 17  33 100
Forza 30 60 10  100
Furbizia 50 25  0 25  100
 

Lo stesso ragionamento si fa per i margini di colonna.

Il calcolo delle percentuali condizionate consente di rendere i vari sottogruppi confrontabili.
Esempi di tabelle a doppia entrata con frequenze semplici e percentuali condizionate sulla riga animale:

Frequenze Fedeltà Affetto
Cani  35 30 65
Gatti 14 11 25

90

Percentuali Fedeltà Affetto
Cani 54 46 100
Gatti 56 44 100


Rappresentazione grafica della distribuzione di frequenza bivariata

Per rappresentare graficamente e in maniera sintetica la distribuzione di frequenza bivariata si utilizza il grafico a barre.

grafico a barre

Nel grafico a barre con due variabili, vengono rappresentate variabili qualitative e le barre sono separate tra di loro, per indicare che non c'è continuità tra i valori.
La frequenza rappresentata può essere semplice, oppure si può scegliere di utilizzare la frequenza relativa o percentuale.
In questo tipo di confronto una percentuale alta in un caso, rappresenta una percentuale bassa in dell'altro.

<< Lezione precedente - Prossima lezione >>

 

Torna all'elenco delle lezioni

 

Piaciuto l'articolo? Lascia un commento!

EmoticonEmoticon