Vigtigste » algoritmisk handel » Summen af ​​firkanter

Summen af ​​firkanter

algoritmisk handel : Summen af ​​firkanter
Hvad er summen af ​​firkanter?

Summen af ​​kvadrater er en statistisk teknik anvendt i regressionsanalyse til at bestemme spredningen af ​​datapunkter. I en regressionsanalyse er målet at bestemme, hvor godt en dataserie kan tilpasses en funktion, der kan hjælpe med at forklare, hvordan dataserien blev genereret. Summen af ​​firkanter bruges som en matematisk måde til at finde den funktion, der bedst passer (varierer mindst) fra dataene.

Formlen for sum af kvadrater er

For et sæt X af n poster: Summen af ​​kvadrater = ∑i = 0n (Xi − X‾) 2 hvor: Xi = Det ith element i sætX‾ = Gennemsnittet af alle elementer i sættet (Xi − X‾) = Afvigelsen for hvert element fra middelværdien \ begynde {justeret} & \ tekst {For et sæt} X \ tekst {af} n \ tekst {poster:} \\ & \ tekst {Sum af firkanter} = \ sum_ {i = 0} ^ {n} \ venstre (X_i- \ overline {X} \ højre) ^ 2 \\ & \ textbf {hvor:} \\ & X_i = \ tekst {Den} i ^ {th} \ tekst {punkt i sæt} \\ & \ overline {X} = \ tekst {Gennemsnittet af alle elementer i sættet} \\ & \ venstre (X_i- \ overline {X} \ højre) = \ tekst {Afvigelsen for hvert element fra middel} \\ \ end {alignet} For et sæt X med n poster: Summen af ​​kvadrater = i = 0∑n (Xi −X) 2 hvor: Xi = Det ith emne i sætX = Middelværdien af ​​alle elementer i sættet (Xi −X) = Afvigelsen for hvert element fra gennemsnittet

Summen af ​​firkanter er også kendt som variation.

Hvad fortæller summen af ​​firkanter dig?

Summen af ​​firkanter er et mål for afvigelse fra middelværdien. I statistikker er gennemsnittet gennemsnittet af et sæt tal og er det mest anvendte mål for central tendens. Det aritmetiske middel beregnes simpelthen ved at opsummere værdierne i datasættet og dividere med antallet af værdier.

Lad os sige, at de lukkende priser for Microsoft (MSFT) i de sidste fem dage var 74, 01, 74, 77, 73, 94, 73, 61 og 73, 40 i amerikanske dollars. Summen af ​​de samlede priser er $ 369, 73 og gennemsnits- eller gennemsnitsprisen for lærebogen ville således være $ 369, 73 / 5 = $ 73, 95.

Men at kende middelværdien af ​​et målesæt er ikke altid nok. Nogle gange er det nyttigt at vide, hvor meget variation der er i et sæt målinger. Hvor langt fra hinanden de individuelle værdier er fra gennemsnittet kan give en vis indsigt i, hvor passende observationer eller værdier er til den regressionsmodel, der oprettes.

For eksempel, hvis en analytiker ønskede at vide, om aktiekursen på MSFT bevæger sig i takt med prisen på Apple (AAPL), kan han liste det sæt observationer, der er for begge aktier i en bestemt periode, siger 1, 2, eller 10 år, og opret en lineær model med hver af de observerede observationer eller målinger. Hvis forholdet mellem begge variabler (dvs. prisen på AAPL og prisen på MSFT) ikke er en lige linje, er der variationer i datasættet, der skal undersøges.

I statistik taler, hvis linjen i den oprettede lineære model ikke passerer gennem alle målinger af værdi, er en del af den variation, der er observeret i aktiekurserne, ikke forklaret. Summen af ​​kvadrater bruges til at beregne, hvorvidt der eksisterer et lineært forhold mellem to variabler, og enhver uforklaret variation omtales som den resterende sum af kvadrater.

Summen af ​​kvadrater er summen af ​​variationskvadratet, hvor variation er defineret som spredningen mellem hver enkelt værdi og middelværdien. For at bestemme summen af ​​kvadrater kvadreres afstanden mellem hvert datapunkt og linjen med bedste pasform og opsummeres derefter. Linjen med bedste pasform minimerer denne værdi.

Sådan beregnes summen af ​​kvadrater

Nu kan du se, hvorfor målingen kaldes summen af ​​kvadratiske afvigelser eller summen af ​​kvadrater for kort. Ved hjælp af vores MSFT-eksempel ovenfor kan summen af ​​firkanter beregnes som:

  • SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2
  • SS = (0, 06) 2 + (0, 82) 2 + (-0, 01) 2 + (-0, 34) 2 + (-0, 55) 2
  • SS = 1, 0942

Tilføjelse af summen af ​​afvigelserne alene uden kvadrering vil resultere i et tal lig med eller tæt på nul, da de negative afvigelser næsten perfekt opvejer de positive afvigelser. For at få et mere realistisk antal skal summen af ​​afvigelser kvadreres. Summen af ​​firkanter vil altid være et positivt tal, fordi kvadratet for et hvilket som helst tal, uanset om det er positivt eller negativt, altid er positivt.

Eksempel på, hvordan man bruger summen af ​​firkanter

Baseret på resultaterne af MSFT-beregningen indikerer en høj sum af kvadrater, at de fleste af værdierne er længere væk fra gennemsnittet, og at der derfor er stor variation i dataene. En lav sum af firkanter henviser til lav variation i sæt af observationer.

I eksemplet ovenfor viser 1.0942, at variationen i aktiekursen for MSFT i de sidste fem dage er meget lav, og investorer, der ønsker at investere i aktier, der er kendetegnet ved prisstabilitet og lav volatilitet, kan vælge MSFT.

Key takeaways

  • Summen af ​​kvadrater måler afvigelsen af ​​datapunkter væk fra middelværdien.
  • Et højere sum af kvadraters resultat indikerer en stor grad af variation i datasættet, mens et lavere resultat indikerer, at dataene varierer betydeligt fra middelværdien.

Begrænsninger i brugen af ​​summen af ​​firkanter

At tage en investeringsbeslutning om, hvilket aktie der skal købes, kræver mange flere observationer end dem, der er anført her. En analytiker er muligvis nødt til at arbejde med mange års data for at vide med en højere sikkerhed, hvor høj eller lav variabiliteten af ​​et aktiv er. Når flere datapunkter tilføjes til sættet, bliver summen af ​​firkanter større, da værdierne vil blive mere spredt.

De mest anvendte målinger af variation er standardafvigelsen og -variansen. For at beregne en af ​​de to målinger skal summen af ​​kvadrater dog først beregnes. Variansen er gennemsnittet af summen af ​​firkanter (dvs. summen af ​​firkanter divideret med antallet af observationer). Standardafvigelsen er kvadratroten af ​​variansen.

Der er to metoder til regressionsanalyse, der bruger summen af ​​kvadrater: den lineære mindste kvadratmetode og den ikke-lineære mindste kvadratmetode. Den mindst kvadratiske metode refererer til det faktum, at regressionsfunktionen minimerer summen af ​​kvadraterne af variansen fra de faktiske datapunkter. På denne måde er det muligt at tegne en funktion, der statistisk giver den bedste pasform til dataene. Bemærk, at en regressionsfunktion enten kan være lineær (en lige linje) eller ikke-lineær (en buet linje).

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.

Relaterede vilkår

Sådan fungerer den mindste kvadratmetode Metoden mindstekvadrater er en statistisk teknik til at bestemme linjen med den bedste pasform for en model, der er specificeret af en ligning med visse parametre til observerede data. mere Sådan fungerer den mindste kvadratkriterimetode Kriteriet med mindst kvadrater er en metode til måling af nøjagtigheden af ​​en linje ved at skildre de data, der blev brugt til at generere den. Det vil sige, formlen bestemmer linjen for bedste pasning. mere Definition af standardafvigelse Standardafvigelsen er en statistik, der måler spredningen af ​​et datasæt i forhold til dets gennemsnit og beregnes som kvadratroten af ​​variationen. Det beregnes som kvadratroten af ​​variansen ved at bestemme variationen mellem hvert datapunkt i forhold til middelværdien. mere Brug af variationen Ligningsvariation er en måling af spredningen mellem numre i et datasæt. Investorer bruger variansligningen til at evaluere en porteføljes aktivallokering. mere Sådan fungerer den resterende standardafvigelse Den resterende standardafvigelse er et statistisk udtryk, der bruges til at beskrive forskellen i standardafvigelser af observerede værdier kontra forudsagte værdier som vist ved punkter i en regressionsanalyse. mere Sådan fungerer bestemmelseskoefficienten Bestemmelseskoefficienten er et mål, der bruges i statistisk analyse til at vurdere, hvor godt en model forklarer og forudsiger fremtidige resultater. flere Partner Links
Anbefalet
Efterlad Din Kommentar