Anonim

La teoria alla base dei valori p e l'ipotesi nulla potrebbero inizialmente sembrare complicate, ma comprendere i concetti ti aiuterà a navigare nel mondo della statistica. Sfortunatamente, questi termini sono spesso usati in modo improprio nella scienza popolare, quindi sarebbe utile per tutti capire le basi.

Vedi anche il nostro articolo Come eliminare ogni altra riga in Excel

Calcolare il valore p di un modello e dimostrare / confutare l'ipotesi nulla è sorprendentemente semplice con MS Excel. Ci sono due modi per farlo e li tratteremo entrambi. Scaviamo dentro.

Ipotesi nulla e valore p

L'ipotesi nulla è un'affermazione, nota anche come posizione di default, che afferma che la relazione tra i fenomeni osservati è inesistente. Può anche essere applicato alle associazioni tra due gruppi osservati. Durante la ricerca, si verifica questa ipotesi e si tenta di confutare.

Ad esempio, supponiamo che tu voglia osservare se una particolare dieta di moda ha risultati significativi. L'ipotesi nulla, in questo caso, è che non vi siano differenze significative nel peso dei soggetti testati prima e dopo la dieta. L'ipotesi alternativa è che la dieta abbia fatto la differenza. Questo è ciò che i ricercatori avrebbero cercato di dimostrare.

Il valore p rappresenta la probabilità che il riepilogo statistico sia uguale o maggiore del valore osservato quando l'ipotesi nulla è vera per un determinato modello statistico. Sebbene sia spesso espresso come un numero decimale, è generalmente meglio esprimerlo in percentuale. Ad esempio, il valore p di 0, 1 dovrebbe essere rappresentato come 10%.

Un basso valore p significa che l'evidenza contro l'ipotesi nulla è forte. Ciò significa inoltre che i tuoi dati sono significativi. D'altra parte, un alto valore p significa che non ci sono prove forti contro l'ipotesi. Per dimostrare che la dieta di moda funziona, i ricercatori dovrebbero trovare un basso valore p .

Un risultato statisticamente significativo è quello che è altamente improbabile che accada se l'ipotesi nulla è vera. Il livello di significatività è indicato con la lettera greca alfa e deve essere maggiore del valore p affinché il risultato sia statisticamente significativo.

Molti ricercatori in una vasta gamma di settori utilizzano il valore p per ottenere una visione migliore e più approfondita dei dati con cui stanno lavorando. Alcuni dei settori di spicco includono sociologia, giustizia penale, psicologia, finanza ed economia.

Trovare il p -valore in Excel

È possibile trovare il valore p di un set di dati in MS Excel tramite la funzione T-Test o utilizzando lo strumento Analisi dei dati. Innanzitutto, esamineremo la funzione T-Test. Esamineremo cinque studenti universitari che hanno seguito una dieta di 30 giorni. Confronteremo il loro peso prima e dopo la dieta.

NOTA: Ai fini di questo articolo, utilizzeremo MS Excel 2010. Sebbene non sia il più recente, i passaggi dovrebbero applicarsi generalmente anche alle versioni più recenti.

Funzione T-Test

Seguire questi passaggi per calcolare il valore p con la funzione T-Test.

  1. Crea e popola la tabella. Il nostro tavolo è simile al seguente:

  2. Fai clic su qualsiasi cella fuori dalla tabella.
  3. Digitare: = T.Test (.
  4. Dopo la parentesi aperta, digitare il primo argomento. In questo esempio, è la colonna Prima della dieta. L'intervallo dovrebbe essere B2: B6. Finora, la funzione è simile alla seguente: T.Test (B2: B6.
  5. Successivamente, inseriremo il secondo argomento. La colonna After Diet e i suoi risultati sono il nostro secondo argomento e l'intervallo di cui abbiamo bisogno è C2: C6. Aggiungiamolo alla formula: T.Test (B2: B6, C2: C6.
  6. Digitare una virgola dopo il secondo argomento e le opzioni di distribuzione a una coda e distribuzione a due code verranno automaticamente visualizzate in un menu a discesa. Scegliamo la prima distribuzione a una coda. Fare doppio clic su di esso.
  7. Digita un'altra virgola.
  8. Fare doppio clic sull'opzione Associato nel menu a discesa successivo.
  9. Ora che hai tutti gli elementi necessari, chiudi la staffa. La formula per questo esempio è simile al seguente: = T.Test (B2: B6, C2: C6, 1, 1)

  10. Premere Invio. La cella visualizzerà immediatamente il valore p . Nel nostro caso, il valore è 0, 133906 o 13, 3906%.

Essendo superiore al 5%, questo valore p non fornisce una forte evidenza contro l'ipotesi nulla. Nel nostro esempio, la ricerca non ha dimostrato che la dieta ha aiutato i soggetti del test a perdere una quantità significativa di peso. Questo non significa necessariamente che l'ipotesi nulla sia corretta, solo che non è stata ancora smentita.

Percorso di analisi dei dati

Lo strumento di analisi dei dati ti consente di fare molte cose interessanti, compresi i calcoli del valore p . Per semplificare le cose, useremo la stessa tabella del metodo precedente.

Ecco come è fatto.

  1. Poiché abbiamo già le differenze di peso nella colonna D, salteremo il calcolo della differenza. Per le tabelle future, utilizzare questa formula: = "Cella 1" - "Cella 2".
  2. Quindi, fai clic sulla scheda Dati nel menu principale.
  3. Seleziona lo strumento Analisi dei dati.
  4. Scorri l'elenco verso il basso e fai clic sull'opzione t-Test: due campioni accoppiati per medie.
  5. Clicca OK.
  6. Apparirà una finestra pop-up. Sembra così:

  7. Immettere il primo intervallo / argomento. Nel nostro esempio, è B2: B6.
  8. Immettere il secondo intervallo / argomento. In questo caso, è C2: C6.
  9. Lascia il valore predefinito nella casella di testo Alpha (è 0, 05).
  10. Fai clic sul pulsante di opzione Intervallo di output e seleziona dove vuoi il risultato. Se è la cella A8, digita: $ A $ 8.
  11. Clicca OK.
  12. Excel calcolerà il valore p e molti altri parametri. Il tavolo finale potrebbe apparire così:

Come puoi vedere, il valore p di una coda è lo stesso del primo caso - 0.133905569. Poiché è superiore a 0, 05, l'ipotesi nulla si applica a questa tabella e le prove a suo carico sono deboli.

Cose da sapere sul valore p -value

Ecco alcuni suggerimenti utili per i calcoli del valore p in Excel.

  1. Se il valore p è uguale a 0, 05 (5%), i dati nella tabella sono significativi. Se è inferiore a 0, 05 (5%), i dati che hai sono molto significativi.
  2. Nel caso in cui il valore p sia superiore a 0, 1 (10%), i dati nella tabella sono insignificanti. Se è compreso nell'intervallo 0, 05-0, 10, hai dati marginalmente significativi.
  3. È possibile modificare il valore alfa, sebbene le opzioni più comuni siano 0, 05 (5%) e 0, 10 (10%).
  4. La scelta di test a due code può essere la scelta migliore, a seconda delle tue ipotesi. Nell'esempio sopra, test con una coda significa che esploriamo se i soggetti del test hanno perso peso dopo essere stati a dieta, ed è esattamente quello che dovevamo scoprire. Ma un test a due code esaminerebbe anche se hanno guadagnato quantità statisticamente significative di peso.
  5. Il p -value non può identificare le variabili. In altre parole, se identifica una correlazione, non può identificare le cause alla base.

Il valore p demistificato

Ogni statista degno del suo sale deve conoscere i dettagli del test di ipotesi nulla e cosa significa il valore p . Questa conoscenza tornerà utile anche ai ricercatori in molti altri campi.

Hai mai usato Excel per calcolare il valore p di un modello statistico? Quale metodo hai usato? Preferisci un altro modo per calcolarlo? Facci sapere nella sezione commenti.

Come calcolare il valore p in Excel