Vigtigste » mæglere » Analyse af variation (ANOVA)

Analyse af variation (ANOVA)

mæglere : Analyse af variation (ANOVA)
Hvad er analyse af variation (ANOVA)?

Variansanalyse (ANOVA) er et analyseværktøj, der bruges i statistikker, der opdeler en observeret samlet variabilitet, der findes i et datasæt, i to dele: systematiske faktorer og tilfældige faktorer. De systematiske faktorer har en statistisk indflydelse på det givne datasæt, mens de tilfældige faktorer ikke gør det. Analytikere bruger ANOVA-testen til at bestemme den indflydelse, som uafhængige variabler har på den afhængige variabel i en regressionsundersøgelse.

T- og z-testmetoderne udviklet i det 20. århundrede blev brugt til statistisk analyse indtil 1918, da Ronald Fisher oprettede analysen af ​​variansmetoden. ANOVA kaldes også Fisher-variansanalysen, og det er udvidelsen af ​​t- og z-testene. Udtrykket blev velkendt i 1925, efter at have vist sig i Fishers bog, "Statistiske metoder til forskningsarbejdere." Det blev ansat i eksperimentel psykologi og senere udvidet til emner, der var mere komplekse.

Formlen for ANOVA er:

F = MSTMSEwhere: F = ANOVA coefficientMST = Middelværdi af kvadrater på grund af behandlingMSE = Middelværdi af kvadrater på grund af fejl \ begynde {justert} & \ text {F} = \ frac {\ text {MST}} {\ text { MSE}} \\ & \ textbf {hvor:} \\ & \ text {F} = \ tekst {ANOVA-koefficient} \\ & \ text {MST} = \ tekst {Middel summen af ​​firkanter på grund af behandling} \\ & \ text {MSE} = \ text {Middel sum af kvadrater på grund af fejl} \\ \ end {justeret} F = MSEMST hvor: F = ANOVA koefficientMST = Middel sum af kvadrater på grund af behandlingMSE = Middel sum af kvadrater pga. fejl

Hvad afslører analysen af ​​variation?

ANOVA-testen er det første trin i analyse af faktorer, der påvirker et givet datasæt. Når testen er afsluttet, udfører en analytiker yderligere test på de metodiske faktorer, som målbart bidrager til datasættets inkonsekvens. Analytikeren bruger ANOVA-testresultaterne i en f-test til at generere yderligere data, der er i overensstemmelse med de foreslåede regressionsmodeller.

ANOVA-testen tillader en sammenligning af mere end to grupper på samme tid for at bestemme, om der findes et forhold mellem dem. Resultatet af ANOVA-formlen, F-statistikken (også kaldet F-forholdet), muliggør analyse af flere datagrupper for at bestemme variationen mellem prøver og inden for prøver.

Hvis der ikke findes nogen reel forskel mellem de testede grupper, der kaldes nullhypotesen, vil resultatet af ANOVAs F-forholdsstatistik være tæt på 1. Svingninger i dens sampling vil sandsynligvis følge Fisher F-fordelingen. Dette er faktisk en gruppe af fordelingsfunktioner med to karakteristiske tal, kaldet tællerens frihedsgrader og nævnerens frihedsgrader.

Key takeaways

  • Variansanalyse, eller ANOVA, er en statistisk metode, der adskiller observerede variansdata i forskellige komponenter, der skal bruges til yderligere test.
  • En envejs ANOVA bruges til tre eller flere datagrupper til at få information om forholdet mellem de afhængige og uafhængige variabler.
  • Hvis der ikke findes nogen reel varians mellem grupperne, skal ANOVAs F-forhold ligge tæt på 1.

Eksempel på, hvordan man bruger ANOVA

En forsker kan for eksempel teste studerende fra flere colleges for at se, om studerende fra et af collegerne konsekvent overgår studerende fra de andre colleges. I en forretningsapplikation kan en F & U-forsker måske teste to forskellige processer med at skabe et produkt for at se, om den ene proces er bedre end den anden med hensyn til omkostningseffektivitet.

Den anvendte ANOVA-test afhænger af en række faktorer. De anvendes, når data skal være eksperimentelle. Variansanalyse anvendes, hvis der ikke er adgang til statistisk software, der resulterer i beregning af ANOVA for hånd. Den er enkel at bruge og bedst egnet til små prøver. Ved mange eksperimentelle design skal prøvestørrelserne være de samme for de forskellige faktorniveaukombinationer.

ANOVA er nyttigt til test af tre eller flere variabler. Det ligner flere to-prøve-t-tests. Det resulterer imidlertid i færre type I-fejl og er passende til en række problemer. ANOVA grupperer forskelle ved at sammenligne midlerne for hver gruppe og inkluderer at sprede variationen i forskellige kilder. Det bruges med individer, testgrupper, mellem grupper og inden for grupper.

Envejs ANOVA versus tovejs ANOVA

Der er to typer ANOVA: envej (eller ensrettet) og tovej. Envejs eller tovejs henviser til antallet af uafhængige variabler i din analyse af varianstest. En envejs ANOVA evaluerer virkningen af ​​en eneste faktor på en enkelt responsvariabel. Det bestemmer, om alle prøverne er ens. Envejs ANOVA bruges til at bestemme, om der er nogen statistisk signifikante forskelle mellem midlerne fra tre eller flere uafhængige (ikke-relaterede) grupper.

En tovejs ANOVA er en udvidelse af envejs ANOVA. Med en envejs har du en uafhængig variabel, der påvirker en afhængig variabel. Med en tovejs ANOVA er der to uafhængige. For eksempel tillader en tovejs ANOVA en virksomhed at sammenligne medarbejdernes produktivitet baseret på to uafhængige variabler, f.eks. Løn og kvalifikationssæt. Det bruges til at observere samspillet mellem de to faktorer og teste effekten af ​​to faktorer på samme tid.

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.

Relaterede vilkår

To-vejs ANOVA En to-vejs ANOVA-test er en statistisk test, der bruges til at bestemme virkningen af ​​to nominelle forudsigelsesvariabler på en kontinuerlig udgangsvariabel. mere Analyse af varianter (ANOVA) Analyse af afvigelser (ANOVA) er en statistisk undersøgelse af forskellene mellem alle de variabler, der er anvendt i et eksperiment. mere Definition af T-test En t-test er en type inferentiel statistik, der bruges til at bestemme, om der er en betydelig forskel mellem midlerne fra to grupper, som kan være relateret til visse funktioner. mere Sådan fungerer den mindste kvadratmetode Metoden mindstekvadrater er en statistisk teknik til at bestemme linjen med den bedste pasform for en model, der er specificeret af en ligning med visse parametre til observerede data. mere Sådan fungerer den resterende standardafvigelse Den resterende standardafvigelse er et statistisk udtryk, der bruges til at beskrive forskellen i standardafvigelser af observerede værdier kontra forudsagte værdier som vist ved punkter i en regressionsanalyse. mere Hvad er en fejlbetegnelse? En fejlbetegnelse er defineret som en variabel i en statistisk model, der oprettes, når modellen ikke fuldt ud repræsenterer det faktiske forhold mellem de uafhængige og afhængige variabler. flere Partner Links
Anbefalet
Efterlad Din Kommentar