En regresjonsanalyse er en kvantitativ analyse som brukes i statistikken for å finne sammenhengen mellom to eller flere forskjellige variable, for eksempel ved sammenligning av to analysemetoder. Dette gjør en ved å finne et uttrykk for en variabel som en funksjon av den andre.

Den vanligste formen for regresjonsanalyse er enkel lineær regresjon med to variable (minste kvadraters metode). Da finner man formelen:

y = ax + b (2) (formel 1)

hvor a er stigningstallet og b er skjæringspunktet med y- aksen.

Dersom skjæringspunktet avviker signifikant fra null, vil man ha en konstant systematisk feil mellom de to analysemetodene. Man kan også ha proporsjonal systematisk feil: da vil kurvene til de to analysemetodene gradvis vike fra hverandre i diagrammet.

Før en regresjonsanalyse antar man alltid en lineær sammenheng mellom metodene. (1)

Eksempel på enkel lineær regresjon med to variable:

Konsentrasjonen av glukose i 15 serumprøver ble lest av på to forskjellige instrumenter på laben, der instrument A ble brukt som referansemetode, og instrument B ble brukt som testmetode. Følgende resultater ble lest av:

Tabell 1: Glukosekonsentrasjon i mmol/L

Prøve nr.Instrument AInstrument B
10,970,90
21,901,70
34,614,30
44,694,20
57,186,60
65,394,90
76,475,90
87,596,80
99,018,10
109,948,80
1110,9910,10
1212,1810,90
1314,4913,30
1416,7315,00
1522,5120,50


Resultatene plottes mot hverandre på et mm-ark eller på excel, med referansemetoden på x-aksen og testmetoden på y-aksen. Ut fra disse punktene blir det tilpasset en rettlinjet kurve og man finner regresjonslikningen for den rette linjen.

Screen Shot 2012-10-26 at 4.26.26 PM.png
Figur 1: Regresjonsanalyse for testmetode mot referansemetode

I dette eksempelet ble excel benyttet for å finne sammenhengen mellom de to metodene. Ved regresjonsanalyse i excel får vi oppgitt blant annet en korrelasjonskoeffisient (r), som forteller hvor god sammenheng det er mellom variablene. En meget god sammenheng gir en korrelasjonskoeffisient tilnærmet lik +/- 1, mens ingen sammenheng vil ligge nærmere 0. Det er vanlig å godta en r med absoluttverdi større enn eller lik 0,97. (2) Korrelasjonskoeffisienten i dette eksempelet ble 0,9997, noe som tilsier meget god lineær sammenheng mellom analysene.

Når man utfører en regresjonsanalyse med minste kvadraters metode i excel, får man ut en rekke parametere som beskriver sammenhengen mellom x og y. Multippel R er korrelasjonskoeffisienten (r) og R-kvadrat er determinasjonskoeffisienten (r^2). Koeffisientene til likningen for den rette linja blir beregnet med et 95 % konfidensintervall for a og b. Det blir også tegnet et punktdiagram med regresjonslinje. (3)


Man har også andre former for regresjon som; Multippel Lineær regresjon (formel 2), Kvadratisk regresjon (formel 3) og transformasjoner.

Z = f (x, y) (2) (formel 2)

Ved multippel lineær regresjon har man to forklaringsvariable:

Y = a + b1* x + b2 * x^2 (2) (formel 3)

Kvadratisk regresjon tilpasser en polynom trendlinje.





Referanser

(1) Burtis, C. A.; Ashwood, E. R.; Bruns, D. E., & Sawyer, B. G., Tietz - Fundamentals of clinical chemistry. Saunders, 2008, 6. utg. (s. 216).

(2) Drogset, S.; Forelesningsnotater i Statistikk, Korrelasjon og regresjon, 24.02.10

(3) Regression with Excel / Multiple Regression with Excel: http://www.jeremymiles.co.uk/regressionbook/extras/appendix2/excel/ - lokalisert 19.10.11.

  • No labels