Korrelasjon er et matematisk mål på sammenhengen mellom to variable størrelser.
Korrelasjonstallet, ρ(rho), er et tall som ligger mellom -1 og 1, hvor fortegnet angir retningen til sammenhengen. Det er absoluttverdien til ρ som sier noe om hvor sterk sammenhengen er. Jo større ρ er jo sterkere er sammenhengen, og jo bedre linearitet er det mellom de to datasettene.
Korrelasjonskoeffisient = +1 tilsier god linær samvariasjon og de to variable størrelsene varierer i takt. Punktene ligger på en rett linje i et punktdiagram.
Korrelasjonskoeffisient = 0 tilsier at det ikke er noen linær sammenheng mellom de to variable.
Korrelasjonskoeffisient = - 1 tilsier at de to variable størrelsene varierer i utakt.
Korrelasjonskoffisienten bør være over 0,975 før lineariteten er tilstrekkelig.
Korrelasjon er kun et numerisk mål på om to datasett varierer i takt, ikke at det er en årsakssammenheng mellom de to variable.
Figur 1: Fire ulike korrelasjoner mellom to variable størrelser x og y.
Korrelasjons-diagram blir brukt på laboratoriet i metodevalidering, der en undersøker riktighet for en testmetode mot en godkjent metode. Korrelasjonen gir da et uttrykk for om det er noen tilfeldige feil eller ikke. For å finne korrelasjonen mellom to datasett må man sette opp et korrelasjonsdiagram hvor man plotter to metoder mot hverandre på excel. Når man har plottet korrelasjons-diagrammet kan man finne korrelasjonskoeffisient. Det er korrelasjonskoeffisienten man ser på for å vurdere metodenes linearitet.
Korrelasjonskoeffisienten kan beregnes ut fra denne ligningen:
Figur 2: Formel for korrelasjonskoeffisienten
Referanser
- http://snl.no/korrelasjon/statistikk
- Per Chr. Hagen, Innføring i sannsynlighetsregning og statistikk 5.utgave, side 247.
- http://www.matematikk.org/artikkel.html?tid=102106