La statistica si occupa dello studio quantitativo di fenomeni collettivi ( riguardano molti soggetti), osservabili nella realtà sociale, in natura o in laboratorio.

La Statistica

La  Statistica.

In origine ( quando è iniziata ), si occupava di rispondere a quesiti ( domande ) sul governo e sulla vita di uno stato, ed è proprio dalla parola stato che deriva il termine statistica, che si occupava, inizialmente, di rispondere a quesiti come i seguenti:

  • quanti sono i cittadini italiani?
  • quanti sono gli agricoltori ( chi lavora la terra ) in Italia?
  • quanti posti letto servono negli ospedali del Lazio?
  • Quanti dottori saranno necessari fra cinque anni nel Lazio?

La statistica è una parte della matematica, essa studia alcune proprietà di un insieme (una totalità, un gruppo che viene definito con dei criteri di appartenenza, ad esempio l’insieme delle persone che frequentano una scuola per adulti) di elementi che hanno una o più caratteristiche in comune (per tutti uguale).
L’insieme (può essere formato da persone, animali o cose) che viene analizzato si chiama popolazione statistica e ogni elemento dell’insieme si chiama unità statistica.

Un esempio.

Vogliamo studiare alcune proprietà delle persone che frequentano i corsi di una scuola per adulti, stabiliamo quali.
La nazionalità, il sesso, l’età, il tipo di corso frequentato, lo stato lavorativo, che può essere occupato (lavori), inoccupato (hai perso il lavoro), disoccupato ( non hai mai lavorato) e, infine, lo stato civile, che può essere coniugato ( sei sposato ), separato (hai litigato con il tuo coniuge e non vivi più con lui ) divorziato ( il tuo matrimonio non vale più per la legge ), vedovo (il tuo coniuge è morto) celibe (maschio non sposato), nubile (femmina non sposata).

La statistica
Il questionario.

Per studiare queste proprietà dobbiamo fare una indagine (indagare significa cercare di scoprire qualcosa, la polizia indaga per trovare il colpevole di una rapina in banca) con un questionario (un foglio dove sono scritte domande, questions), che chiede risposte necessarie alle singole unità statistiche ( le persone ) che formano la popolazione statistica ( l’insieme degli studenti di una scuola per adulti).
Le risposte possono essere di tipo quantitativo, cioè espresse (scritte) con un numero(età), oppure di tipo qualitativo, cioè espresse con una parola (nazionalità).

In ogni caso le risposte possono essere associate ad un numero analizzando tutti i questionari, ad esempio ci sono 20 unità statistiche di nazionalità cinese, oppure 30 unità statistiche che hanno 16 anni.
Se si studia tutta una popolazione si fa un censimento, se una parte di essa si fa un’indagine a campione.

Il sondaggio.

Un sondaggio di opinioni (opinione significa coma la pensi su qualcosa) è un’indagine statistica a campione, che deve essere scelto tra la popolazione statistica ( ad esempio tutte le persone che possono votare in una elezione) con dei criteri tali che esso possa dare una rappresentazione verosimile per prevedere (sapere prima qualcosa) che cosa farà tutta la popolazione.
Ad esempio abbiamo letto su un giornale che cosa si prevede per le prossime elezioni del parlamento italiano che sono previste per il 2023.

La rilevazione è stata effettuata da SWG (il nome della società che ha fatto il sondaggio) per Piazza pulita ( chi ha chiesto, commissionato il sondaggio) il 31 marzo 2021 tramite un sondaggio  su un campione probabilistico stratificato ( la scelta del campione deve comprendere elettori del nord, del centro, del sud e delle isole; deve comprendere tutte le fasce di età, deve comprendere elettori che abitano in grandi città ed in piccoli paesi, e così via ) di un certo numero di soggetti maggiorenni.

Il margine d’errore massimo ( es: +/- 3,1% ) è l’intervallo percentuale di quanto si può sbagliare.

Analisi dei dati.

Quando si fa una statistica i dati raccolti con il questionario vengono associati a dei numeri, scritti in delle tabelle, ognuna delle quali riporta una caratteristica (una proprietà) tra le domande fatte, es. per il tipo di corso frequentato ci potrebbero essere 150 persone studiano lingua italiana, 80 studiano inglese, 40 spagnolo, 60 informatica, 50 partecipano a corso di licenza media.
Poi le tabelle vengono rappresentate con grafici: areogrammi quadrati, a torta o ad anello, istogrammi, grafici a linee o a dispersione, ideogrammi, cartogrammi.

La frequenza.

Tra le quantità matematiche da analizzare quelle più semplici sono: frequenza assoluta, frequenza relativa, percentuale, media aritmetica, moda e mediana.

La frequenza assoluta è il numero di volte con cui si ripete un dato.
La frequenza assoluta dei frequentanti il corso di licenza media è 60, delle persone che studiano inglese è 80 e così via.

La frequenza relativa si calcola dividendo la frequenza assoluta per il numero totale delle unità statistiche ( che corrisponde al numero di elementi dell’insieme che si analizza), oppure dividendo la frequenza assoluta per il numero totale delle frequenze assolute.
Supponiamo che il numero di persone che frequentano il CPIA 3 siano 2000, allora la frequenza relativa degli studenti della licenza media sarà 60/2000=0,03 la frequenza relativa delle persone che studiano inglese sarà 80/2000=0,04 e così via.

La frequenza percentuale si calcola moltiplicando la frequenza relativa per 100.
Percentuale studenti licenza media=0,03×100=3%;  studenti inglese=0,04×100=4% e così via.

La media. 

La media aritmetica di un insieme di numeri, o di dati raccolti, si calcola addizionando i numeri, o dati, e dividendo la loro somma per il numero totale degli elementi dell’insieme, cioè per il numero totale dei dati o delle unità statistiche.
Dato l’insieme formato dai numeri (3, 8, 5, 7, 10) la loro media aritmetica sarà uguale a (3+8+5+7+10) / 5 = 33/5= 6,6.
Ad esempio questi numeri potrebbero essere il numero di studenti di nazionalità italiana nei 5 corsi di licenza media, in ogni classe ci sono circa 6,6 alunni italiani.
Normalmente uno studente calcola la sua media dei voti ottenuti nelle diverse materie.

La moda e la mediana.

La moda è il dato che si presenta più volte, cioè che ha la frequenza assoluta maggiore.
Es tra i dati 4, 5, 2, 8, 4, 2, 10, 9, 4 ; la moda è 4 che è presente tre volte, cioè che ha frequenza assoluta 3.

La mediana di un insieme di numeri, o di dati, è il numero che si trova al centro degli elementi dell’insieme messi in ordine crescente (dal più piccolo al più grande).
Possono capitare due situazioni:
a) il numero degli elementi è dispari ad es. 4, 3, 6, 5, 8,
Messi in ordine crescente 3, 4, 5, 6, 8,
La mediana è il numero 5, perché ha due elementi a sinistra e due a destra di se.
b) il numero degli elementi è pari ad es 4, 9, 3, 6, 5, 8
Messi in ordine crescente 3, 4, 5, 6, 8, 9
Non c’è nessun numero al centro perché tre sono da una parte e tre dall’altra, allora la mediana si calcola facendo la media aritmetica dei due numeri a destra e a sinistra del centro
Nel nostro caso abbiamo 5+6/2= 11/2=5,5