Statistiske tests: hvilken skal du bruge?

Statistiske tests anvendes til hypotesetest. De kan bruges til at:

  • afgøre, om en forudsigelsesvariabel har en statistisk signifikant sammenhæng med en udfaldsvariabel.
  • estimer forskellen mellem to eller flere grupper.

Statistiske tests antager en nulhypotese om intet forhold eller ingen forskel mellem grupper. Derefter bestemmer de, om de observerede data falder uden for værdiområdet forudsagt af nulhypotesen.

Hvis du allerede ved, hvilke typer variabler du har at gøre med, kan du bruge rutediagrammet til at vælge den rigtige statistiske test til dine data.

Hvad laver en statistisk test?

Statistiske tests fungerer ved at beregne en teststatistik – et tal, der beskriver, hvor meget forholdet mellem variabler i din test adskiller sig fra nulhypotesen om intet forhold.

Derefter beregnes en p-værdi (sandsynlighedsværdi). P-værdien estimerer, hvor sandsynligt det er, at du vil se forskellen beskrevet i teststatistikken, hvis nulhypotesen om intet forhold var sandt.

Hvis værdien af teststatistikken er mere ekstrem end statistikken beregnet ud fra nulhypotesen, kan du udlede en statistisk signifikant sammenhæng mellem forudsigelsen og resultatvariablerne.

Hvis værdien af teststatistikken er mindre ekstrem end den, der beregnes ud fra nulhypotesen, kan du ikke udlede nogen statistisk signifikant sammenhæng mellem forudsigelsen og resultatvariablerne.

Hvornår skal man udføre en statistisk test

Du kan udføre statistiske tests på data, der er indsamlet på en statistisk gyldig måde – enten gennem et eksperiment eller gennem observationer foretaget ved hjælp af sandsynlighedsudtagningsmetoder.

For at en statistisk test skal være gyldig, skal din stikprøvestørrelse være stor nok til at tilnærme den sande fordeling af den befolkning, der undersøges.

For at bestemme hvilken statistisk test du skal bruge, skal du vide:

  • om dine data opfylder visse antagelser.
  • de typer variabler, du har at gøre med.

Statistiske antagelser

Statistiske tests giver nogle almindelige antagelser om de data, de tester:

  1. Uafhængighed af observationer (det vil sige ingen autokorrelation): De observationer/variabler, du inkluderer i din test, er ikke relaterede (for eksempel er flere målinger af en enkelt testperson ikke uafhængige, mens målinger af flere forskellige testpersoner er uafhængige).
  2. Homogenitet af varians: variansen inden for hver gruppe, der sammenlignes, er ens for alle grupper. Hvis en gruppe har meget mere variation end andre, vil det begrænse testens effektivitet.
  3. Normalitet af data: dataene følger en normalfordeling (det vil sige en søjlekurve). Denne antagelse gælder kun kvantitative data.

Hvis dine data ikke lever op til antagelserne om normalitet eller ensartethed, kan du muligvis udføre en ikke-parametrisk statistisk test, som giver dig mulighed for at foretage sammenligninger uden antagelser om datadistributionen.

Hvis dine data ikke opfylder antagelsen om uafhængighed af observationer, kan du muligvis bruge en test, der tegner sig for struktur i dine data (gentagne målinger eller tests, der inkluderer blokerende variabler).

Typer af variabler

De typer af variabler, du har, bestemmer normalt, hvilken type statistisk test du kan bruge.

Kvantitative variabler repræsenterer mængder af ting (f.eks. Antallet af træer i en skov). Typer af kvantitative variabler inkluderer:

  • Kontinuerlig (det vil sige forholdsvariabler): repræsenterer mål og kan normalt opdeles i enheder mindre end en (f.eks. 0,75 gram).
  • Diskret (det vil sige heltalsvariabler): repræsenterer optællinger og kan normalt ikke opdeles i enheder, der er mindre end en (f.eks. 1 træ).

Kategoriske variabler repræsenterer grupperinger af ting (f.eks. De forskellige træarter i en skov). Typer af kategoriske variabler inkluderer:

  • Ordinær: repræsenterer data med en ordre (f.eks. Placeringer).
  • Nominel: repræsenterer gruppenavne (f.eks. Mærker eller artsnavne).
  • Binær: repræsenterer data med et ja/nej eller 1/0 resultat (f.eks. vind eller tab).

Vælg den test, der passer til de typer forudsigelses- og resultatvariabler, du har samlet (hvis du laver et eksperiment, er disse de uafhængige og afhængige variabler). Se nedenstående tabeller for at se, hvilken test der bedst matcher dine variabler.

Valg af en parametrisk test: regression, sammenligning eller korrelation

Parametriske tests har normalt strengere krav end ikke-parametriske tests og er i stand til at tage stærkere slutninger ud fra dataene. De kan kun udføres med data, der overholder de fælles antagelser om statistiske tests.

De mest almindelige typer parametriske test inkluderer regressionstest, sammenligningstest og korrelationstest.

Regressionstest

Regressionstest bruges til at teste årsag og virkning forhold. De ser efter effekten af en eller flere kontinuerlige variabler på en anden variabel.

Sammenligningstest

Sammenligningstest ser efter forskelle mellem gruppe middelværdier. De kan bruges til at teste effekten af en kategorisk variabel på middelværdien af andre karakteristika.

T-tests bruges ved sammenligning af middelværdien for nøjagtigt to grupper (f.eks. Gennemsnitshøjderne for mænd og kvinder). ANAVA- og MANAVA-test bruges ved sammenligning af middelværdien for mere end to grupper (f.eks. Gennemsnitshøjderne for børn, teenagere og voksne).

Korrelationstest

Korrelationstest kontrollerer, om to variabler er relaterede uden at antage årsag-virkning-forhold.

Disse kan bruges til at teste, om to variabler, du vil bruge i (for eksempel) en multipel regressionstest, er autokorreleret.

Valg af en ikke-parametrisk test

Ikke-parametriske tests antager ikke så mange antagelser om dataene og er nyttige, når en eller flere af de almindelige statistiske antagelser overtrædes. De slutninger, de laver, er dog ikke så stærke som ved parametriske tests.

Rutediagram: valg af en statistisk test

Dette rutediagram hjælper dig med at vælge blandt parametriske tests.

Bo Jönsson

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

fourteen − 5 =