kvartil

algoritmisk handel : kvartil
Hvad er en kvartil?

En kvartil er et statistisk udtryk, der beskriver en inddeling af observationer i fire definerede intervaller baseret på dataene, og hvordan de sammenlignes med hele observationssættet.

Forståelse af kvartiler

For at forstå kvartilen er det vigtigt at forstå medianen som et mål for central tendens. Medianen i statistikken er mellemværdien af ​​et sæt tal. Det er det punkt, hvor nøjagtigt halvdelen af ​​dataene ligger under og over den centrale værdi.

Så med et sæt på 13 numre ville medianen være det syvende nummer. De seks numre, der går forud for denne værdi, er de laveste tal i dataene, og de seks numre efter medianen er de højeste tal i det givne datasæt. Fordi medianen ikke påvirkes af ekstreme værdier eller outliers i fordelingen, foretrækkes det undertiden frem for middelværdien.

Medianen er en robust estimator for placering, men siger intet om, hvordan dataene på hver side af dets værdi spredes eller spredes. Det er her kvartilet trænger ind. Kvartilen måler spredningen af ​​værdier over og under middelværdien ved at dele fordelingen i fire grupper.

Key takeaways

  • Kvartilen måler spredningen af ​​værdier over og under gennemsnittet ved at dele fordelingen i fire grupper.
  • En kvartil opdeler data i tre punkter - en nedre kvartil, median og øvre kvartil - for at danne fire grupper af datasættet.
  • Kvartiler bruges til at beregne interkvartilområdet, som er et mål for variabilitet omkring medianen.

Sådan fungerer kvartiler

Ligesom medianen opdeler dataene i halvdelen, så 50% af målingen ligger under medianen og 50% ligger over den, opdeler kvartilen dataene i kvartaler, således at 25% af målingen er mindre end den nederste kvartil, 50 % er mindre end gennemsnittet, og 75% er mindre end den øverste kvartil.

En kvartil opdeler data i tre punkter - en nedre kvartil, median og øvre kvartil - for at danne fire grupper af datasættet. Den nederste kvartil eller den første kvartil betegnes som Q1 og er det midterste tal, der falder mellem den mindste værdi af datasættet og medianen. Den anden kvartil, Q2, er også medianen. Den øverste eller tredje kvartil, betegnet som Q3, er det centrale punkt, der ligger mellem medianen og det højeste antal af fordelingen.

Nu kan vi kortlægge de fire grupper dannet fra kvartilerne. Den første gruppe af værdier indeholder det mindste antal op til Q1; den anden gruppe inkluderer Q1 til medianen; det tredje sæt er medianen til Q3; den fjerde kategori omfatter Q3 til det højeste datapunkt i hele sættet.

Hver kvartil indeholder 25% af de samlede observationer. Generelt er dataene arrangeret fra den mindste til den største:

  1. Første kvartil: de laveste 25% af antallet
  2. Anden kvartil: mellem 25, 1% og 50% (op til medianen)
  3. Tredje kvartil: 51% til 75% (over medianen)
  4. Fjerde kvartil: de højeste 25% af antallet

Kvartileksempel

Lad os arbejde med et eksempel. Antag, fordelingen af ​​matematikresultater i en klasse på 19 studerende i stigende rækkefølge er:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Marker først medianen Q2, som i dette tilfælde er den tiende værdi: 75.

Q1 er det centrale punkt mellem den mindste score og medianen. I dette tilfælde falder Q1 mellem den første og femte score: 68. [Bemærk, at medianen også kan inkluderes, når man beregner Q1 eller Q3 for et ulige sæt værdier. Hvis vi skulle inkludere medianen på hver side af midtpunktet, vil Q1 være den midterste værdi mellem den første og den tiende score, hvilket er gennemsnittet af det femte og det sjette resultat - (femte + sjette) / 2 = (68 + 69) / 2 = 68, 5].

Q3 er den midterste værdi mellem Q2 og den højeste score: 84. [Eller hvis du inkluderer medianen, Q3 = (82 + 84) / 2 = 83].

Nu hvor vi har vores kvartiler, lad os fortolke deres antal. En score på 68 (Q1) repræsenterer den første kvartil og er den 25. percentil. 68 er medianen for den nedre halvdel af scoringen, der er angivet i de tilgængelige data, dvs. medianen for scoringerne fra 59 til 75.

Q1 fortæller os, at 25% af scoringerne er mindre end 68, og 75% af klassescore er større. Q2 (medianen) er den 50. percentil og viser, at 50% af scoringerne er mindre end 75, og 50% af scoringerne er over 75. Endelig afslører Q3, den 75. percentil, at 25% af scoringerne er større og 75% er mindre end 84.

Særlige overvejelser

Hvis datapunktet for Q1 er længere væk fra medianen end Q3 er fra medianen, kan vi sige, at der er en større spredning blandt de mindre værdier i datasættet end blandt de større værdier. Den samme logik gælder, hvis Q3 er længere væk fra Q2, end Q1 er fra medianen.

Alternativt, hvis der er et jævnt antal datapunkter, vil medianen være gennemsnittet af de to midterste tal. I vores eksempel ovenfor, hvis vi havde 20 studerende i stedet for 19, vil medianen for deres score være det aritmetiske gennemsnit af det tiende og det ellevte antal.

Kvartiler bruges til at beregne interkvartilområdet, som er et mål for variabilitet omkring medianen. Interkvartilområdet beregnes simpelthen som forskellen mellem den første og den tredje kvartil: Q3 - Q1. I virkeligheden er det området for den midterste halvdel af dataene, der viser, hvor spredt dataene er.

I store datasæt har Microsoft Excel en QUARTILE-funktion til beregning af kvartiler.

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.

Relaterede vilkår

Sådan fungerer den decile kvantitative metode En decil er en kvantitativ metode til at opdele et sæt rangordnede data i 10 understørrelser, der er lige store. Denne type datarangering udføres som en del af mange akademiske og statistiske studier inden for økonomi og økonomi. mere Beskrivende statistikker Beskrivende statistikker er et sæt korte beskrivende koefficienter, der opsummerer et givet datasæt, der er repræsentativt for en hel eller prøvepopulation. mere Quintiles Definition En kvintil er en statistisk værdi af et datasæt, der repræsenterer 20% af en given population. mere Sådan bruges det Winsoriserede middelværdi Winsoriserede middelværdi er en metode til gennemsnit, der oprindeligt erstatter de mindste og største værdier med de observationer, der er tættest på dem. Dette gøres for at begrænse virkningen af ​​unormale ekstreme værdier eller outliers på beregningen. mere Tre-Sigma-grænser: Hvad du har brug for at vide Tre-Sigma-grænser er en statistisk beregning, der refererer til data inden for tre standardafvigelser fra et middel. mere Definition af standardafvigelse Standardafvigelsen er en statistik, der måler spredningen af ​​et datasæt i forhold til dets gennemsnit og beregnes som kvadratroten af ​​variationen. Det beregnes som kvadratroten af ​​variansen ved at bestemme variationen mellem hvert datapunkt i forhold til middelværdien. flere Partner Links
Anbefalet
Efterlad Din Kommentar