Analyse af variation (ANOVA)
Hvad er analyse af variation (ANOVA)?Variansanalyse (ANOVA) er et analyseværktøj, der bruges i statistikker, der opdeler en observeret samlet variabilitet, der findes i et datasæt, i to dele: systematiske faktorer og tilfældige faktorer. De systematiske faktorer har en statistisk indflydelse på det givne datasæt, mens de tilfældige faktorer ikke gør det. Analytikere bruger ANOVA-testen til at bestemme den indflydelse, som uafhængige variabler har på den afhængige variabel i en regressionsundersøgelse.
T- og z-testmetoderne udviklet i det 20. århundrede blev brugt til statistisk analyse indtil 1918, da Ronald Fisher oprettede analysen af variansmetoden. ANOVA kaldes også Fisher-variansanalysen, og det er udvidelsen af t- og z-testene. Udtrykket blev velkendt i 1925, efter at have vist sig i Fishers bog, "Statistiske metoder til forskningsarbejdere." Det blev ansat i eksperimentel psykologi og senere udvidet til emner, der var mere komplekse.
Formlen for ANOVA er:
F = MSTMSEwhere: F = ANOVA coefficientMST = Middelværdi af kvadrater på grund af behandlingMSE = Middelværdi af kvadrater på grund af fejl \ begynde {justert} & \ text {F} = \ frac {\ text {MST}} {\ text { MSE}} \\ & \ textbf {hvor:} \\ & \ text {F} = \ tekst {ANOVA-koefficient} \\ & \ text {MST} = \ tekst {Middel summen af firkanter på grund af behandling} \\ & \ text {MSE} = \ text {Middel sum af kvadrater på grund af fejl} \\ \ end {justeret} F = MSEMST hvor: F = ANOVA koefficientMST = Middel sum af kvadrater på grund af behandlingMSE = Middel sum af kvadrater pga. fejl
Hvad afslører analysen af variation?
ANOVA-testen er det første trin i analyse af faktorer, der påvirker et givet datasæt. Når testen er afsluttet, udfører en analytiker yderligere test på de metodiske faktorer, som målbart bidrager til datasættets inkonsekvens. Analytikeren bruger ANOVA-testresultaterne i en f-test til at generere yderligere data, der er i overensstemmelse med de foreslåede regressionsmodeller.
ANOVA-testen tillader en sammenligning af mere end to grupper på samme tid for at bestemme, om der findes et forhold mellem dem. Resultatet af ANOVA-formlen, F-statistikken (også kaldet F-forholdet), muliggør analyse af flere datagrupper for at bestemme variationen mellem prøver og inden for prøver.
Hvis der ikke findes nogen reel forskel mellem de testede grupper, der kaldes nullhypotesen, vil resultatet af ANOVAs F-forholdsstatistik være tæt på 1. Svingninger i dens sampling vil sandsynligvis følge Fisher F-fordelingen. Dette er faktisk en gruppe af fordelingsfunktioner med to karakteristiske tal, kaldet tællerens frihedsgrader og nævnerens frihedsgrader.
Key takeaways
- Variansanalyse, eller ANOVA, er en statistisk metode, der adskiller observerede variansdata i forskellige komponenter, der skal bruges til yderligere test.
- En envejs ANOVA bruges til tre eller flere datagrupper til at få information om forholdet mellem de afhængige og uafhængige variabler.
- Hvis der ikke findes nogen reel varians mellem grupperne, skal ANOVAs F-forhold ligge tæt på 1.
Eksempel på, hvordan man bruger ANOVA
En forsker kan for eksempel teste studerende fra flere colleges for at se, om studerende fra et af collegerne konsekvent overgår studerende fra de andre colleges. I en forretningsapplikation kan en F & U-forsker måske teste to forskellige processer med at skabe et produkt for at se, om den ene proces er bedre end den anden med hensyn til omkostningseffektivitet.
Den anvendte ANOVA-test afhænger af en række faktorer. De anvendes, når data skal være eksperimentelle. Variansanalyse anvendes, hvis der ikke er adgang til statistisk software, der resulterer i beregning af ANOVA for hånd. Den er enkel at bruge og bedst egnet til små prøver. Ved mange eksperimentelle design skal prøvestørrelserne være de samme for de forskellige faktorniveaukombinationer.
ANOVA er nyttigt til test af tre eller flere variabler. Det ligner flere to-prøve-t-tests. Det resulterer imidlertid i færre type I-fejl og er passende til en række problemer. ANOVA grupperer forskelle ved at sammenligne midlerne for hver gruppe og inkluderer at sprede variationen i forskellige kilder. Det bruges med individer, testgrupper, mellem grupper og inden for grupper.
Envejs ANOVA versus tovejs ANOVA
Der er to typer ANOVA: envej (eller ensrettet) og tovej. Envejs eller tovejs henviser til antallet af uafhængige variabler i din analyse af varianstest. En envejs ANOVA evaluerer virkningen af en eneste faktor på en enkelt responsvariabel. Det bestemmer, om alle prøverne er ens. Envejs ANOVA bruges til at bestemme, om der er nogen statistisk signifikante forskelle mellem midlerne fra tre eller flere uafhængige (ikke-relaterede) grupper.
En tovejs ANOVA er en udvidelse af envejs ANOVA. Med en envejs har du en uafhængig variabel, der påvirker en afhængig variabel. Med en tovejs ANOVA er der to uafhængige. For eksempel tillader en tovejs ANOVA en virksomhed at sammenligne medarbejdernes produktivitet baseret på to uafhængige variabler, f.eks. Løn og kvalifikationssæt. Det bruges til at observere samspillet mellem de to faktorer og teste effekten af to faktorer på samme tid.
Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.