kvartil
Hvad er en kvartil?En kvartil er et statistisk udtryk, der beskriver en inddeling af observationer i fire definerede intervaller baseret på dataene, og hvordan de sammenlignes med hele observationssættet.
Forståelse af kvartiler
For at forstå kvartilen er det vigtigt at forstå medianen som et mål for central tendens. Medianen i statistikken er mellemværdien af et sæt tal. Det er det punkt, hvor nøjagtigt halvdelen af dataene ligger under og over den centrale værdi.
Så med et sæt på 13 numre ville medianen være det syvende nummer. De seks numre, der går forud for denne værdi, er de laveste tal i dataene, og de seks numre efter medianen er de højeste tal i det givne datasæt. Fordi medianen ikke påvirkes af ekstreme værdier eller outliers i fordelingen, foretrækkes det undertiden frem for middelværdien.
Medianen er en robust estimator for placering, men siger intet om, hvordan dataene på hver side af dets værdi spredes eller spredes. Det er her kvartilet trænger ind. Kvartilen måler spredningen af værdier over og under middelværdien ved at dele fordelingen i fire grupper.
Key takeaways
- Kvartilen måler spredningen af værdier over og under gennemsnittet ved at dele fordelingen i fire grupper.
- En kvartil opdeler data i tre punkter - en nedre kvartil, median og øvre kvartil - for at danne fire grupper af datasættet.
- Kvartiler bruges til at beregne interkvartilområdet, som er et mål for variabilitet omkring medianen.
Sådan fungerer kvartiler
Ligesom medianen opdeler dataene i halvdelen, så 50% af målingen ligger under medianen og 50% ligger over den, opdeler kvartilen dataene i kvartaler, således at 25% af målingen er mindre end den nederste kvartil, 50 % er mindre end gennemsnittet, og 75% er mindre end den øverste kvartil.
En kvartil opdeler data i tre punkter - en nedre kvartil, median og øvre kvartil - for at danne fire grupper af datasættet. Den nederste kvartil eller den første kvartil betegnes som Q1 og er det midterste tal, der falder mellem den mindste værdi af datasættet og medianen. Den anden kvartil, Q2, er også medianen. Den øverste eller tredje kvartil, betegnet som Q3, er det centrale punkt, der ligger mellem medianen og det højeste antal af fordelingen.
Nu kan vi kortlægge de fire grupper dannet fra kvartilerne. Den første gruppe af værdier indeholder det mindste antal op til Q1; den anden gruppe inkluderer Q1 til medianen; det tredje sæt er medianen til Q3; den fjerde kategori omfatter Q3 til det højeste datapunkt i hele sættet.
Hver kvartil indeholder 25% af de samlede observationer. Generelt er dataene arrangeret fra den mindste til den største:
- Første kvartil: de laveste 25% af antallet
- Anden kvartil: mellem 25, 1% og 50% (op til medianen)
- Tredje kvartil: 51% til 75% (over medianen)
- Fjerde kvartil: de højeste 25% af antallet
Kvartileksempel
Lad os arbejde med et eksempel. Antag, fordelingen af matematikresultater i en klasse på 19 studerende i stigende rækkefølge er:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Marker først medianen Q2, som i dette tilfælde er den tiende værdi: 75.
Q1 er det centrale punkt mellem den mindste score og medianen. I dette tilfælde falder Q1 mellem den første og femte score: 68. [Bemærk, at medianen også kan inkluderes, når man beregner Q1 eller Q3 for et ulige sæt værdier. Hvis vi skulle inkludere medianen på hver side af midtpunktet, vil Q1 være den midterste værdi mellem den første og den tiende score, hvilket er gennemsnittet af det femte og det sjette resultat - (femte + sjette) / 2 = (68 + 69) / 2 = 68, 5].
Q3 er den midterste værdi mellem Q2 og den højeste score: 84. [Eller hvis du inkluderer medianen, Q3 = (82 + 84) / 2 = 83].
Nu hvor vi har vores kvartiler, lad os fortolke deres antal. En score på 68 (Q1) repræsenterer den første kvartil og er den 25. percentil. 68 er medianen for den nedre halvdel af scoringen, der er angivet i de tilgængelige data, dvs. medianen for scoringerne fra 59 til 75.
Q1 fortæller os, at 25% af scoringerne er mindre end 68, og 75% af klassescore er større. Q2 (medianen) er den 50. percentil og viser, at 50% af scoringerne er mindre end 75, og 50% af scoringerne er over 75. Endelig afslører Q3, den 75. percentil, at 25% af scoringerne er større og 75% er mindre end 84.
Særlige overvejelser
Hvis datapunktet for Q1 er længere væk fra medianen end Q3 er fra medianen, kan vi sige, at der er en større spredning blandt de mindre værdier i datasættet end blandt de større værdier. Den samme logik gælder, hvis Q3 er længere væk fra Q2, end Q1 er fra medianen.
Alternativt, hvis der er et jævnt antal datapunkter, vil medianen være gennemsnittet af de to midterste tal. I vores eksempel ovenfor, hvis vi havde 20 studerende i stedet for 19, vil medianen for deres score være det aritmetiske gennemsnit af det tiende og det ellevte antal.
Kvartiler bruges til at beregne interkvartilområdet, som er et mål for variabilitet omkring medianen. Interkvartilområdet beregnes simpelthen som forskellen mellem den første og den tredje kvartil: Q3 - Q1. I virkeligheden er det området for den midterste halvdel af dataene, der viser, hvor spredt dataene er.
I store datasæt har Microsoft Excel en QUARTILE-funktion til beregning af kvartiler.
Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.