Winsoriseret gennemsnitlig definition
Hvad er det Winsorized middelværdi?Winsoriseret middelværdi er en metode til gennemsnit, som oprindeligt erstatter de mindste og største værdier med de observationer, der er tættest på dem. Dette gøres for at begrænse virkningen af unormale ekstreme værdier eller outliers på beregningen. Efter udskiftning af værdierne bruges derefter aritmetisk gennemsnitsformel til at beregne det winsoriserede middelværdi.
Formlen for det winsoriserede middelværdi er
Winsoriseret middelværdi = xn… xn + 1 + xn + 2… xnNever: n = Antallet af største og mindste datapunkter, der skal erstattes af observationen \ begynde {justeret} & \ tekst {Winsoriseret middelværdi} \ = \ \ frac {x_ {n} \ prikker x_ {n + 1} \ + \ x_ {n + 2} \ prikker x_ {n}} {N} \\ & \ textbf {hvor:} \\ & \ begynde {justeret} n \ = \ & \ text {Antallet af største og mindste data} \\ & \ tekst {punkter, der skal erstattes af observationen} \\ & \ tekst {tættest på dem} \ end {alignet} \\ & N \ = \ \ tekst {Samlet antal datapunkter} \ slutning {justeret} Winsoriseret middelværdi = Nxn… xn + 1 + xn + 2… xn hvor: n = Antallet af største og mindste datapunkter, der skal erstattes af observationen
Winsoriserede midler udtrykkes på to måder. Et "k n " winsoriseret middel henviser til udskiftningen af 'k' mindste og største observationer, hvor 'k' er et heltal. Et "X%" vindestyret middelværdi involverer udskiftning af en given procentdel af værdier fra begge ender af dataene.
Sådan beregnes det Winsorized middelværdi
Det winsoriserede middelværdi beregnes ved at erstatte de mindste og største datapunkter, derefter summere alle datapunkter og dele summen med det samlede antal datapunkter.
Hvad fortæller Winsorized dig?
Det vindende middelværdi er mindre følsomt over for outliers, fordi det kan erstatte dem med mindre ekstreme værdier. Det vil sige, det er mindre modtageligt for konturer mod middelværdien. Hvis en fordeling har fedthaler, vil virkningen af at fjerne de højeste og laveste værdier i fordelingen dog have lille indflydelse på grund af det høje antal variationer i fordelingstalene.
Key takeaways
- En gennemsnitsmetode, der inkluderer udskiftning af de mindste og største værdier med de observationer, der er tættest på dem.
- Mindre følsomme over for outliers, fordi det kan erstatte dem med mindre ekstreme værdier.
- Det er i modsætning til det beskårne middelværdi, som involverer fjernelse af datapunkter - selvom resultatet af de to har en tendens til at være tæt.
Eksempel på anvendelse af Winsorized middelværdi
Man kan beregne det winsoriserede middelværdi for følgende datasæt: 1, 5, 7, 8, 9, 10, 14. I dette eksempel antager vi, at det winsoriserede middelværdi er i første rækkefølge, vi erstatter de mindste og største værdier med deres nærmeste observationer.
Datasættet vises nu som følger: 5, 5, 7, 8, 9, 10, 10. At tage et aritmetisk gennemsnit af det nye sæt giver et winsoriseret middelværdi på 7, 7 eller (5 + 5 + 7 + 8 + 9 + 10 + 10) divideret med 7.
Eller overvej et 20% winsoriseret middelværdi, der tager top 10% og bund 10% og erstatter dem med deres næste nærmeste værdi. Vi vinder størrelsen på følgende datasæt: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. De to mindste og største datapunkter eller 10% erstattes med deres næste nærmeste værdi. Det nye datasæt er således: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Vinderne middelværdi er 33, 9 eller det samlede antal data (678) divideret med det samlede antal datapunkter (20).
Forskellen mellem Winsorized middelværdi og trimmet middelværdi
Det winsoriserede middelværdi inkluderer ændring af datapunkter, mens det trimmede gennemsnit involverer fjernelse af datapunkter. Det er almindeligt, at det vindende middelværdi og det trimmede middelværdi er tæt på.
Begrænsninger ved anvendelse af Winsorized middelværdi
En af de største ulemper ved winsoriserede midler er, at de introducerer bias i datasættet. Indrømmet, datasættet er ideelt set mindre partisk efter ændringen end hvis der blev efterladt outliers.
Lær mere om Winsorized middelværdi
For relateret indsigt kan du læse mere om forskellene mellem de gennemsnitlige beregninger.
Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.