Vigtigste » algoritmisk handel » Definition af reststandardafvigelse

Definition af reststandardafvigelse

Hvad er den resterende standardafvigelse?

Den resterende standardafvigelse er et statistisk udtryk, der bruges til at beskrive forskellen i standardafvigelser af observerede værdier kontra forudsagte værdier som vist ved punkter i en regressionsanalyse. Regressionsanalyse er en metode, der bruges i statistikker til at vise et forhold mellem to forskellige variabler, og for at beskrive, hvor godt du kan forudsige en variabers opførsel fra en anden opførsel.

Reststandardafvigelse omtales også som standardafvigelsen for punkter omkring en monteret linje eller standardfejlen ved estimering.

Formlerne for rest- og reststandardafvigelse er

Residual = (Y − Yest) Sres = ∑ (Y − Yest) 2n − 2where: Sres = ReststandardafvigelseY = Observeret værdi Yest = Estimeret eller projiceret valuen = Datapunkter i populationen \ begynde {justert} & \ tekst {Restid} = \ venstre (Y-Y_ {est} \ højre) \\ & S_ {res} = \ sqrt {\ frac {\ sum \ left (Y-Y_ {est} \ højre) ^ 2} {n-2}} \\ & \ textbf {hvor:} \\ & S_ {res} = \ text {Reststandardafvigelse} \\ & Y = \ tekst {Observeret værdi} \\ & Y_ {est} = \ tekst {Estimeret eller projiceret værdi} \\ & n = \ tekst {Datapunkter i populationen} \\ \ ende {justeret} Rest = (Y − Yest) Sres = n − 2∑ (Y − Yest) 2 hvor: Sres = ReststandardafvigelseY = observeret valueYest = Estimeret eller projiceret valuen = Datapunkter i populationen

Sådan beregnes den resterende standardafvigelse

For at beregne den resterende standardafvigelse skal først forskellen mellem de forudsagte værdier og faktiske værdier dannet omkring en monteret linje beregnes. Denne forskel er kendt som restværdien eller simpelthen rester eller afstanden mellem kendte datapunkter og de datapunkter, der er forudsagt af modellen.

For at beregne den resterende standardafvigelse skal du sætte resterne i den resterende standardafvigelsesligning for at løse formlen.

Hvad fortæller den resterende standardafvigelse dig?

Den resterende standardafvigelse er en god-af-fit-måling, der kan bruges til at analysere, hvor godt et sæt datapunkter passer til den aktuelle model. I en forretningsindstilling, for eksempel, efter at have udført en regressionsanalyse på flere datapunkter af omkostninger over tid, kan den resterende standardafvigelse give en virksomhedsejer information om forskellen mellem faktiske omkostninger og forventede omkostninger og en idé om, hvor meget projicerede omkostninger kan variere fra gennemsnittet af de historiske omkostningsdata.

Key takeaways

Den resterende standardafvigelse er simpelthen standardafvigelsen for restværdierne eller forskellen mellem et sæt observerede og forudsagte værdier.
Standardafvigelsen for resterne beregner, hvor meget datapunkter spredt rundt om regressionslinjen.
Resultatet bruges til at måle fejlen i regressionslinjens forudsigelighed.

Eksempel på, hvordan man beregner reststandardafvigelse

Start med at beregne restværdier. Forudsat at du for eksempel har et sæt af fire observerede værdier for et navngivet eksperiment, viser tabellen herunder y-værdier, der er observeret og registreret for givne værdier på x :

Hvis den lineære ligning eller hældning af den linje, der er forudsagt af dataene i modellen, er angivet som y _est = 1x + 2, hvor y _est = forudsagt y-værdi, kan den resterende for hver observation findes.

Den resterende er lig med (y - y _est ), så for det første sæt er den faktiske y værdi 1 og den forudsagte y _est værdi angivet af ligningen er y _est = 1 (1) + 2 = 3. Restværdien er således 1 - 3 = -2, en negativ restværdi.

For det andet sæt x- og y-datapunkter kan den forudsagte y-værdi, når x er 2 og y er 4, beregnes som 1 (2) + 2 = 4.

I dette tilfælde er de faktiske og forudsagte værdier de samme, så restværdien er nul. Du vil bruge den samme proces til at nå frem til de forudsagte værdier for y i de resterende to datasæt.

Når du har beregnet restmængderne for alle punkter ved hjælp af tabellen eller en graf, skal du bruge den resterende standardafvigelsesformel.

Udvid tabellen ovenfor, beregn den resterende standardafvigelse:

y _est

Rest (ååå _est )

Summen af hver resterende kvadrat eller Σ (ååå _est ) ²

-2

Bemærk, at summen af de kvadratiske rester = 6, som repræsenterer tælleren for den resterende standardafvigelsesligning.

For den nederste del eller nævner af den resterende standardafvigelsesligning, n = antallet af datapunkter, som er 4 i dette tilfælde. Beregn nævneren af ligningen som:

(Antal rester - 2) = (4 - 2) = 2

Endelig beregner du kvadratroten af resultaterne:

Reststandardafvigelse : √ (6/2) = √3 ≈ 1.732

Størrelsen på en typisk rest kan give dig en fornemmelse af generelt hvor tæt dine estimater er. Jo mindre reststandardafvigelsen er, jo tættere er estimatets pasform til de faktiske data. Faktisk er, jo mindre den resterende standardafvigelse sammenlignes med prøvestandardafvigelsen, jo mere forudsigelig eller nyttig er modellen.

Den resterende standardafvigelse kan beregnes, når der er udført en regressionsanalyse, samt en variansanalyse (ANOVA). Ved bestemmelse af en kvantitationsgrænse (LoQ) er brugen af en resterende standardafvigelse tilladt i stedet for standardafvigelsen.

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.

Relaterede vilkår

Hvad er en fejlbetegnelse? En fejlbetegnelse er defineret som en variabel i en statistisk model, der oprettes, når modellen ikke fuldt ud repræsenterer det faktiske forhold mellem de uafhængige og afhængige variabler. mere Sådan fungerer den mindste kvadratmetode Den mindste kvadratmetode er en statistisk teknik til at bestemme linjen med den bedste pasform for en model, der er specificeret af en ligning med visse parametre til observerede data. mere Forståelse af Durbin Watson-statistikken Durbin Watson-statistikken er et tal, der tester for autokorrelation i resterne fra en statistisk regressionsanalyse. mere Sådan fungerer summen af kvadraters statistiske teknik Summen af kvadrater er en statistisk teknik, der bruges i regressionsanalyse til at bestemme spredningen af datapunkter fra deres middelværdi. I en regressionsanalyse er målet at bestemme, hvor godt en dataserie kan tilpasses en funktion, der kan hjælpe med at forklare, hvordan dataserien blev genereret. mere Sådan fungerer multiple lineær regression Multiple lineær regression (MLR) er en statistisk teknik, der bruger flere forklaringsvariabler til at forudsige resultatet af en responsvariabel. mere Definition af standardafvigelse Standardafvigelsen er en statistik, der måler spredningen af et datasæt i forhold til dets gennemsnit og beregnes som kvadratroten af variationen. Det beregnes som kvadratroten af variansen ved at bestemme variationen mellem hvert datapunkt i forhold til middelværdien. flere Partner Links

← De 10 mest dyre kvarterer i Amerika

Hvordan tjener Google sine penge? →

Anbefalet

Efterlad Din Kommentar