Summen af firkanter
Hvad er summen af firkanter?Summen af kvadrater er en statistisk teknik anvendt i regressionsanalyse til at bestemme spredningen af datapunkter. I en regressionsanalyse er målet at bestemme, hvor godt en dataserie kan tilpasses en funktion, der kan hjælpe med at forklare, hvordan dataserien blev genereret. Summen af firkanter bruges som en matematisk måde til at finde den funktion, der bedst passer (varierer mindst) fra dataene.
Formlen for sum af kvadrater er
For et sæt X af n poster: Summen af kvadrater = ∑i = 0n (Xi − X‾) 2 hvor: Xi = Det ith element i sætX‾ = Gennemsnittet af alle elementer i sættet (Xi − X‾) = Afvigelsen for hvert element fra middelværdien \ begynde {justeret} & \ tekst {For et sæt} X \ tekst {af} n \ tekst {poster:} \\ & \ tekst {Sum af firkanter} = \ sum_ {i = 0} ^ {n} \ venstre (X_i- \ overline {X} \ højre) ^ 2 \\ & \ textbf {hvor:} \\ & X_i = \ tekst {Den} i ^ {th} \ tekst {punkt i sæt} \\ & \ overline {X} = \ tekst {Gennemsnittet af alle elementer i sættet} \\ & \ venstre (X_i- \ overline {X} \ højre) = \ tekst {Afvigelsen for hvert element fra middel} \\ \ end {alignet} For et sæt X med n poster: Summen af kvadrater = i = 0∑n (Xi −X) 2 hvor: Xi = Det ith emne i sætX = Middelværdien af alle elementer i sættet (Xi −X) = Afvigelsen for hvert element fra gennemsnittet
Summen af firkanter er også kendt som variation.
Hvad fortæller summen af firkanter dig?
Summen af firkanter er et mål for afvigelse fra middelværdien. I statistikker er gennemsnittet gennemsnittet af et sæt tal og er det mest anvendte mål for central tendens. Det aritmetiske middel beregnes simpelthen ved at opsummere værdierne i datasættet og dividere med antallet af værdier.
Lad os sige, at de lukkende priser for Microsoft (MSFT) i de sidste fem dage var 74, 01, 74, 77, 73, 94, 73, 61 og 73, 40 i amerikanske dollars. Summen af de samlede priser er $ 369, 73 og gennemsnits- eller gennemsnitsprisen for lærebogen ville således være $ 369, 73 / 5 = $ 73, 95.
Men at kende middelværdien af et målesæt er ikke altid nok. Nogle gange er det nyttigt at vide, hvor meget variation der er i et sæt målinger. Hvor langt fra hinanden de individuelle værdier er fra gennemsnittet kan give en vis indsigt i, hvor passende observationer eller værdier er til den regressionsmodel, der oprettes.
For eksempel, hvis en analytiker ønskede at vide, om aktiekursen på MSFT bevæger sig i takt med prisen på Apple (AAPL), kan han liste det sæt observationer, der er for begge aktier i en bestemt periode, siger 1, 2, eller 10 år, og opret en lineær model med hver af de observerede observationer eller målinger. Hvis forholdet mellem begge variabler (dvs. prisen på AAPL og prisen på MSFT) ikke er en lige linje, er der variationer i datasættet, der skal undersøges.
I statistik taler, hvis linjen i den oprettede lineære model ikke passerer gennem alle målinger af værdi, er en del af den variation, der er observeret i aktiekurserne, ikke forklaret. Summen af kvadrater bruges til at beregne, hvorvidt der eksisterer et lineært forhold mellem to variabler, og enhver uforklaret variation omtales som den resterende sum af kvadrater.
Summen af kvadrater er summen af variationskvadratet, hvor variation er defineret som spredningen mellem hver enkelt værdi og middelværdien. For at bestemme summen af kvadrater kvadreres afstanden mellem hvert datapunkt og linjen med bedste pasform og opsummeres derefter. Linjen med bedste pasform minimerer denne værdi.
Sådan beregnes summen af kvadrater
Nu kan du se, hvorfor målingen kaldes summen af kvadratiske afvigelser eller summen af kvadrater for kort. Ved hjælp af vores MSFT-eksempel ovenfor kan summen af firkanter beregnes som:
- SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2
- SS = (0, 06) 2 + (0, 82) 2 + (-0, 01) 2 + (-0, 34) 2 + (-0, 55) 2
- SS = 1, 0942
Tilføjelse af summen af afvigelserne alene uden kvadrering vil resultere i et tal lig med eller tæt på nul, da de negative afvigelser næsten perfekt opvejer de positive afvigelser. For at få et mere realistisk antal skal summen af afvigelser kvadreres. Summen af firkanter vil altid være et positivt tal, fordi kvadratet for et hvilket som helst tal, uanset om det er positivt eller negativt, altid er positivt.
Eksempel på, hvordan man bruger summen af firkanter
Baseret på resultaterne af MSFT-beregningen indikerer en høj sum af kvadrater, at de fleste af værdierne er længere væk fra gennemsnittet, og at der derfor er stor variation i dataene. En lav sum af firkanter henviser til lav variation i sæt af observationer.
I eksemplet ovenfor viser 1.0942, at variationen i aktiekursen for MSFT i de sidste fem dage er meget lav, og investorer, der ønsker at investere i aktier, der er kendetegnet ved prisstabilitet og lav volatilitet, kan vælge MSFT.
Key takeaways
- Summen af kvadrater måler afvigelsen af datapunkter væk fra middelværdien.
- Et højere sum af kvadraters resultat indikerer en stor grad af variation i datasættet, mens et lavere resultat indikerer, at dataene varierer betydeligt fra middelværdien.
Begrænsninger i brugen af summen af firkanter
At tage en investeringsbeslutning om, hvilket aktie der skal købes, kræver mange flere observationer end dem, der er anført her. En analytiker er muligvis nødt til at arbejde med mange års data for at vide med en højere sikkerhed, hvor høj eller lav variabiliteten af et aktiv er. Når flere datapunkter tilføjes til sættet, bliver summen af firkanter større, da værdierne vil blive mere spredt.
De mest anvendte målinger af variation er standardafvigelsen og -variansen. For at beregne en af de to målinger skal summen af kvadrater dog først beregnes. Variansen er gennemsnittet af summen af firkanter (dvs. summen af firkanter divideret med antallet af observationer). Standardafvigelsen er kvadratroten af variansen.
Der er to metoder til regressionsanalyse, der bruger summen af kvadrater: den lineære mindste kvadratmetode og den ikke-lineære mindste kvadratmetode. Den mindst kvadratiske metode refererer til det faktum, at regressionsfunktionen minimerer summen af kvadraterne af variansen fra de faktiske datapunkter. På denne måde er det muligt at tegne en funktion, der statistisk giver den bedste pasform til dataene. Bemærk, at en regressionsfunktion enten kan være lineær (en lige linje) eller ikke-lineær (en buet linje).
Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.