Percentil (prosentil) et spredningsmål som egner seg når vi har ikkeparametriske fordelinger. 

For å forstå prosentil kan det være naturlig å sammenligne det med median. En god definisjon på median er at det er den observasjonen som ligger i midten av et datasett når alle verdiene er sortert i stigende rekkefølge. For å forstå sammenhengen mellom median og prosentil kan en annen definisjon på median benyttes: medianen kalles 50-prosentilet fordi 50% av de aktuelle observasjonene er mindre eller lik medianen. (1) Ofte vil man angi andre punkt i et datasett enn bare midtpunktet og da er det fint med percentil. Tilsvarende som man kan finne 50-percentil, altså median, kan man definere 70-prosentilet som verdiene som er mindre eller lik 70% av observasjonene osv. Ut av dette kan man si at P-prosentilet er mindre eller lik P% der P vil være tall fra 0-100.

Prosentil deler et datasett i 100 like store deler, men man kan også dele et datasett i fjerde- eller tideler:
Deciler: Obersvasjonene blir fordelt i 10 like store deler. (P10, P20,P30...P90)
Kvartiler: Observasjonene blir fordelt i fire like store deler (Q25, Q50,Q75) (2)

Percentiler benyttes ofte i forbindelse med store tallmengder som blir betraktet som en populasjon. Populasjonen kan bestå av individer, prøvesvar mm. Det er viktig at alle observasjonene er sammenlignbare. Eksempel på fordelingen kan være samme kjønn, samme alder og prøveresultat av samme analytt. Disse tallmengdene blir ordnet i et frekvensdiagram slik at man får en fordeling av observasjonene over et visst areal. I diagrammet trekkes vertikale linjer slik at arealet blir delt opp. Linjene tilsvarer percentilene. (3) 

Eksempel på beregninger med percentil:

Eksempel 1

Ut i fra tabell 1 og n=90 finn maxårsinntekt til 90% av befolkningen. Husk at prosentil angis som desimaltall.

Tabell 1: Fordeling etter årsinntekt for 128 personer

Årsinntekt(1000-talls kr)Antall personerKumulert frekvens
150-15911
160-16445
165-1693136
170-1744480
175-17938118
180-20010128

X(prosentil*n) = antall observasjoner. Denne telles nedenfra i tabellen og er lavere enn den aktuelle prosentilen
n = antall personer

X = 0,90 * n = 
X = 0,90 * 128 
X = 115

Dette innebærer at P90 ligger i klassen 175-179 fordi 118 < 115 < 80. 


Vi får P90 = 174.5+((115-80)/38)*5) = 179

10 prosent av personene har en årsinntekt på over 179 000 kroner, altså har 90 prosent av personene en årsinntekt på under 179 000 kroner.




Referanser:
(1) Løvås, G.G. (2013), Stastistikk for universiteter og høyskoler. Oslo: Universitetsforlaget
(2) Körner, S. & Wahlgren, L., 2002, Praktisk statistik, Studentlitteratur, Sverige, Side 95-97
(3) Thoresen, T., 2008, Statistikk for laboratoriet, Eureka Forlag, Tromsø, Side 55 og 232

(URL1) http://www.axonforlag.no/Menu/Utv.fors.-laerevansker/Utredning/Statistikk/Prosentil (hentet 26.10.12)
(URL2) http://www.axonforlag.no/Menu/Utv.fors.-laerevansker/Utredning/Statistikk/Normalfordeling (hentet 26.10.12)
(URL3) http://www.kunnskapssenteret.com/articles/2634/1/Prosentiler-og-kvartiler/Prosentiler-og-kvartiler.html (hentet 26.10.12)
(URL4) Wikipedia, Percentil, 21.oktober 2013, Tilgjengelig fra: http://en.wikipedia.org/wiki/Percentile (hentet 24.10.13)

  • No labels