Skip to main content

Statistica

Lezioni di matematica on line

Dati statistici

La statistica descrittiva cerca di sintetizzare una quantità di dati sperimentali riassumendo le caratteristiche salienti con pochi indici o grafici significativi. Se si vuole, per esempio, trarre determinate informazioni sulla crescita dei pini di un bosco, si può anche pensare di entrare nel bosco e misurare, una per una, le altezze di tutte gli alberi, certamente però questo sistema avrebbe costi elevati. Pertanto si effetueranno le misure su un numero ridotto di pini, scelti a caso tra quelli presenti nel bosco. Dalle misurazioni fatte su un certo numero di alberi, estratto a campione, si cercherà di risalire alle caratteristiche di tutti gli alberi del bosco. Questo tipo di procedura prende il nome di inferenza statistica. La statistica inferenziale, quindi, estraendo ed esaminanando un campione di una certa popolazione, ne elabora e sintetizza i dati con i metodi della statistica descrittiva, per poi fare previsioni di tipo probabilistico per valutare le caratteristiche principali della massa totale della popolazione.

Variabili qualitative e quantitative

Le variabili statistiche possono essere qualitative, se esprimono una qualità dell’individuo, (ad esempio sesso, colore capelli, razza). Una variabile qualitativa non viene misurata, ma classificata in categorie sulla base delle modalità con cui essa si presenta (maschio femmina, castano biondo, ). D’altra parte esistono le variabili quantitative, che possono essere misurate su una scala discreta (numero di persone) o su una scala continua (statura delle persone).

Distribuzioni di frequenza

Avendo a che fare con un numero elevato di dati, è conveniente considerare le frequenze delle unità sperimentali: la frequenza assoluta non è altro che il numero degli individui che presentano una certa misura (per un carattere quantitativo) o una certa modalità (per un carattere qualitativo). Ad esempio se su 100 persone 20 sono di razza caucasica, 35 sono di razza asiatica e 45 sono di razza subsahariana, si può dedurre che la frequenza assoluta degli asiatici è pari a 45. Se si ha a che fare con variabili quantitative su scala continua, prima di calcolare le frequenze è conveniente suddividere l’intervallo delle misure in una serie di classi di frequenza. Ad esempio, se abbiamo considerato 3000 persone ed abbiamo osservato che 115 hanno altezze comprese tra 180 e 185 cm, possiamo conclude che la frequenza degli individui della classe 180-185 cm è pari a 115. Oltre alle frequenze assolute, possiamo considerare anche le frequenze relative, che si calcolano dividendo le frequenze assolute per il numero totale degli individui del collettivo. Nei casi prima accennati, la frequenza relativa dei caucasici è pari a 20/100, cioè 0.2, mentre la frequenza relativa degli individui nella classe 180-185 è pari a 115/3000, cioè 0.038. Se si ha una variabile quantitativa o comunque una variabile nella quale le modalità o le classi di frequenza possono essere logicamente ordinate, oltre alle frequenze assolute e relative si possno prendere in considerazione le cosiddette frequenze cumulate, che si ottengono cumulando i valori di tutte le classi di frequenza precedenti a quella considerata. Ad esempio se tra le 3000 persone anzidette 224 hanno altezze comprese tra 185 e 190 cm, la frequenza cumulata della classe è pari a 224+115 = 339, che si ottiene sommando alla frequenza assoluta di classe la frequenza assoluta delle classi precedenti.