mandag 30. april 2012

Metode: Statistikk

Statistikk: "en gren innen matematikken som tar for seg analyse av tallfestede dataobservasjoner med den hensikt å kunne trekke konklusjoner basert på disse dataene". 


Vi har henholdsvis to typer statistikk. I forhold til psykologisk forskning snakker vi om beskrivende- og slutningsstatistikk. 


Beskrivende statistikk har som formål å beskrive resultater (data) fra et utvalg. Sentraltendens (gjennomsnitt, median og modus) og variabilitet (variasjonsbredde, varians og standardavvik) er relevant i forhold til beskrivende statistikk.


Slutningsstatiskk brukes typisk i statistisk hypotesetesting. Det forteller oss noe om sannsynligheten for at de statistikkene vi har i utvalget vårt kan stamme fra en viss populasjon. Et sentralt spørsmål her; gjelder det vi finner i utvalget, også for populasjonen?


En forskningsprosess foregår slik --> Forskningsspørsmål, design, hypotese, innsamling av data, statistikk, tolkning av data. Det kan i denne prosessen være hensiktsmessig å ta for seg data grafisk ved hjelp av diagrammer. Dette er en form for å redusere data. Videre er man ute etter å se sammenhenger, da er det hensiktsmessig å se i et plotdiagram. I slike diagram vil man finne prikker som ikke korrelerer med de andre, disse kaller vi uteliggere, fordi de ligger utenfor massemengden. Det er viktig å skalere data riktig i slike diagram. Dersom man ikke gjør det vil forskjellene fremstå som større enn det de egentlig er. Dette skaper en løgnfaktor (størrelsen på effekt vist i grafen/størrelse på effekt i data).


For å måle sentraltendens har vi tre ulike metoder; gjennomsnitt, median og modus. Gjennomsnitt er summen av alle verdier delt på antall verdier. Dette er det mest brukte målet på sentraltendens og gir ofte en verdi som ikke er observert i data. Problemet med gjennomsnittsmåling er at det påvirkes i stor grad av såkalte uteliggere. Median er verdien som ligger i midten av datasettet, når verdiene er rangert fra lavest til høyest og modus er verdien som forekommer flest ganger i et datasett, med andre ord verdien med størst søyle i et søylediagram.


For å måle variabilitet (spredning) har vi også tre ulike metoder; range (variasjonsbredde), varians og standardavvik. Range er forskjellen mellom høyeste og laveste verdi i datasettet. Varians er summen av de kvadrerte avvikene fra gjennomsnittet/ N-1, mens standardavvik viser hvor mye en serie av verdier avviker fra seriens gjennomsnitt. Man kan også si at standardavvik er kvadratroten av varians.  

Ingen kommentarer:

Legg inn en kommentar