Come determinare l’errore standard utilizzando Excel
Microsoft Excel è praticamente il programma di riferimento quando si tratta di elaborare numeri, soprattutto se si cerca di capire quanto siano affidabili i dati del campione rispetto all’intera popolazione. Se vi siete mai chiesti cosa indichi effettivamente l’errore standard, ad esempio quanto sia vicina la media del campione alla media effettiva della popolazione, questa guida fa al caso vostro.È un po’ strano, ma una volta capito, calcolare l’errore standard in Excel è semplice e può davvero aiutarvi a rendere l’analisi dei dati un po’ più intelligente.
Che cos’è l’errore standard?
L’errore standard indica sostanzialmente quanto potrebbe fluttuare la media del campione se si continuassero a estrarre nuovi campioni dalla popolazione. Consideratelo come una misura della precisione della media del campione: un errore più piccolo significa che si tratta di una stima abbastanza accurata della media effettiva della popolazione. Lo fa utilizzando la deviazione standard, ma la corregge in base alla dimensione del campione, quindi campioni più grandi di solito danno un errore standard più piccolo.
Ad esempio, immagina di voler stimare l’altezza media degli studenti in una scuola con, diciamo, 500 studenti. Scegli un campione di 30 studenti, li misuri e trovi un’altezza media di 160 cm. Se ripeti l’operazione con diversi campioni di 30 studenti, le medie potrebbero oscillare di circa 152 cm. L’entità di questa variazione è l’errore standard. In pratica, se l’errore standard è minimo, la media del campione riflette probabilmente bene l’altezza media effettiva di tutti gli studenti. Se è maggiore, forse il campione non è molto rappresentativo o è solo una questione di fortuna.
Come calcolare l’errore standard in Excel
Excel rende tutto questo molto più semplice rispetto a cercare di fare tutto su carta. La chiave sta nell’utilizzare le funzioni integrate per la deviazione standard e la radice quadrata. In alcune configurazioni, sembra quasi una magia, ma funziona. Ricorda solo che, se hai a che fare con un campione, non con l’intera popolazione, la formula corretta è =DEV. ST. S, non =DEV. ST. P.Su alcuni computer, ho visto persone ottenere risultati strani perché hanno usato la funzione sbagliata o non hanno selezionato l’intervallo di dati corretto.
Metodo 1: calcolare manualmente ogni parte
- Inizia organizzando i dati in una colonna. Supponiamo che i tuoi dati siano in B2:B11.
- Calcola la deviazione standard per il tuo campione. Fai clic su una nuova cella e digita
=STDEV. S(B2:B11). Premi Enter. Ora, questa cella mostra la deviazione standard del tuo campione. Su alcuni computer, la formula potrebbe non funzionare se hai utilizzato quella sbagliata o se i dati non sono formattati correttamente. Assicurati di selezionare l’intervallo corretto e di utilizzare STDEV. S. - Ora, calcola la radice quadrata della dimensione del tuo campione. Scegli un’altra cella e digita
=SQRT(COUNT(B2:B11)). Premi Enter. Questo ti dirà quanto è “grande” la dimensione del tuo campione in termini di radice quadrata. - Infine, dividi la deviazione standard per questa radice quadrata. Seleziona una terza cella e digita
=CellWithSD / CellWithSqrt. Ad esempio, se la deviazione standard era in C13 e la radice quadrata in D13, è=C13 / D13.
E boom, questo ti dà l’errore standard. Se vuoi, puoi combinare tutto in un’unica formula come =STDEV. S(B2:B11) / SQRT(COUNT(B2:B11)). Ricorda solo di sostituire B2:B11 con l’intervallo di dati effettivo.
Metodo 2: utilizzare una singola formula
- Non c’è bisogno di scomporre le cose: basta digitare la formula combinata direttamente in una cella:
=STDEV. S(B2:B11) / SQRT(COUNT(B2:B11)). - Funziona perché la funzione DEV. ST. S di Excel calcola la deviazione standard del campione, mentre CONTA. NUMERI fornisce il numero di campioni. Includendo il risultato in RADQ, la divisione diventa più semplice.
In alcune configurazioni, questo potrebbe generare un errore o fornire risultati inaspettati se gli intervalli non sono corretti o i dati non sono numerici. Ricontrolla i dati, soprattutto se ottieni numeri anomali.
Peccare per eccesso di cautela
Excel è piuttosto affidabile per questo tipo di operazioni, ma non dimenticare che le formule sono sensibili alla struttura dei dati. Se hai a che fare con un’intera popolazione anziché con un campione, usa =DEV. ST. P invece di =DEV. ST. S. E se stai importando dati da altre fonti, assicurati che siano puliti, ovvero senza celle vuote o testo al posto dei numeri.
Ah, ecco un piccolo consiglio da esperti: puoi approfondire i calcoli della varianza o altre statistiche a questo utile link. Excel nasconde un sacco di trucchi, se ti fai un giro.
Articoli correlati
Questo articolo è stato utile?