tirsdag 1. mai 2012

Metode: Korrelasjon og regresjon

Relasjoner mellom variabler kan ta følgende former --> 


Positiv lineær relasjon: Når den ene variabelen øker, øker også den andre. Eks. Barn som viser stor grad av aggressiv atferd, ser også mange voldelige innslag på tv. Barn som viser liten grad av aggressiv atferd, ser mindre voldelige innslag på tv. 


Negativ lineær relasjon: Når den ene variabelen øker, minsker den andre. Eks. Barn som ser myepå tv, viser mindre grad av fysisk aktivitet. Barn som ser lite på tv, viser stor grad av fysisk aktivitet. 


Kurvelineært forhold: Relasjonen kan her fremstilles som en kurve. Eksempelvis så øker den ene variabelen, mens den andre kun øker til et visst punkt før den avtar. Her foreligger det en mer kompleks relasjon mellom to variabler. Eks. Spenning før eksamen skjerper studenten for en god prestasjon, men øker spenningen for mye, reduseres prestasjonen. 


Ingen relasjon: Verdier på en variabel gir ingen holdepunkt for å si noe om verdier på den andre variabelen. Altså er det ingen samvarians. 


Dette er beskrivelser på hvordan variabler kan samvariere. Videre er det også viktig å nevne noe om styrken på samvariasjonen mellom to variabler. Det at to variabler korrelerer eller samvarierer, betyr altså at verdiene på en av variablene forteller oss noe om verdiene på den andre variabelen. Denne typen samvariasjon kan også tallfestes. 


Den mest brukte metoden er Pearsons produktmoment-korrelasjon eller korrelasjonskoeffisienten (r). Denne gir uttrykk for hvor sterk en korrelasjon er og hvordan to variabler samvarierer. Styrken på en observert samvarians indikeres med et tall mellom 0 og 1 (eller 0 og -1) der 0 betyr at det ikke er samvarians og 1 betyr at det er perfekt samvarians. Jo nærmere 0 det er indikert at (r) er, jo desto svakere er denne korrelasjonen. 


Av og til får vi vite at (r) er signifikant som vil si at (p) er lav. Dette betyr at når en korrelasjonsanalyse gjennomføre, er forskeren ikke bare interessert i styrken på relasjonen mellom to variabler, forskeren er i tillegg interessert i om en observert samvariasjon i utvalget er reell og ikke kun en tilfeldighet. Signifikansnivået (p) er et tallmessig uttrykk for hvor sannsynlig det er at en observert samvariasjon kan oppstå tilfeldig. Er p-verdien lav, kan vi være nokså sikre på at resultatet ikke er oppstått tilfeldig, mens hvis den er høy kan det godt tenkes at den observerte samvariansen kunne oppstått tilfeldig. (p) er ikke bare avhengig av størrelsen på (r), men også av hvor mange observasjoner (n) som inngår i beregningen. 


Korrelasjon innebærer som nevnt tidligere at to variabler samvarierer. I noen situasjoner er det interessant å benytte kunnskap om samvariansen til å predikere (forutsi) skårer på en variabel, gitt at vi har informasjon om skårer på en annen variabel. Eks. En gruppe studenter på et seminar hadde ulik grad av fravær gjennom semesteret. Noen deltok på de fleste seminarene, mens andre var fraværende i større eller mindre grad. Er det da mulig å predikere hvordan disse studentene vil prestere på eksamen ut fra deltakelse på seminar? I slike spørsmål brukes en variabel (antall oppmøte på seminar) prediktorvariabel og en annen (karakter på eksamen) kriterievariabel. Hvis det er en korrelasjon mellom disse er prediksjon mulig. Dette kalles regresjon


Formelen for dette er Y=bX+a. Nøkkelen til å beregne Y gitt X her er at a og b er kjent. a er regresjonskonstanten og b er regresjonskoeffisienten. a er predikert verdi av Y når X=0, mens b viser endringen i Y når X endres med en måleenhet. Disse beregnes så i regresjonsanalysen. Når vi har gjort dette kan vi tegne en rett linje i et diagram. Denne linjen uttrykker den beste lineære tilpasningen til de data vi har. Gitt denne linjen er det når mulig å predikere en students karakter ut i fra kunnskap om hvor mange ganger denne studenten har vært fraværende på seminar. Eks. Et fravær på fem ganger predikerer en karakter på eksempelvis 2,6 som tilsvarer en D eller C. 


Videre er det også noe som kalles for multippel regresjon. Dette er når vi har enda flere instanser i sving. Ta eksempelet som er nevnt tidligere. Dersom vi i tillegg har informasjon om hvor mye studentene hadde lest på egenhånd og vi benytter dette i beregningen, snakker vi om en multippel regresjon. 

Ingen kommentarer:

Legg inn en kommentar