Vigtigste » algoritmisk handel » R-kvadrat definition

R-kvadrat definition

algoritmisk handel : R-kvadrat definition
Hvad er R-kvadrat?

R-kvadrat (R 2 ) er et statistisk mål, der repræsenterer andelen af ​​variansen for en afhængig variabel, der forklares med en uafhængig variabel eller variabler i en regressionsmodel. Mens korrelation forklarer styrken i forholdet mellem en uafhængig og afhængig variabel, forklarer R-kvadratet i hvilken grad variansen af ​​en variabel forklarer variansen af ​​den anden variabel. Så hvis R2 i en model er 0, 50, kan cirka halvdelen af ​​den observerede variation forklares med modellens input.

Ved investeringer fortolkes R-kvadrat generelt som procentdelen af ​​en afdeling eller sikkerheds bevægelser, der kan forklares med bevægelser i et benchmark-indeks. For eksempel identificerer en R-kvadrat for en fast indkomst sikkerhed mod et obligationsindeks sikkerhedsandelens andel af prisbevægelsen, der er forudsigelig baseret på en kursbevægelse på indekset. Det samme kan anvendes på en aktie versus S&P 500-indekset eller ethvert andet relevant indeks.

Det kan også være kendt som bestemmelseskoefficienten.

Formlen til R-kvadrat er

R2 = 1 − forklaret variant R2 = 1 − Total variationExplained variation

Beregning af R-kvadrat

Den faktiske beregning af R-kvadrat kræver flere trin. Dette inkluderer at tage datapunkter (observationer) af afhængige og uafhængige variabler og finde linjen med bedste pasform, ofte fra en regressionsmodel. Derfra beregner du forudsagte værdier, trækker faktiske værdier og kvadratierer resultaterne. Dette giver en liste med firkanterede fejl, som derefter summeres og svarer til den forklarede varians.

For at beregne den samlede varians vil du trække den gennemsnitlige faktiske værdi fra de forudsagte værdier, kvadratere resultaterne og summere dem. Derefter skal du dele den første sum af fejl (forklaret varians) med den anden sum (total varians), trække resultatet fra en, og du har R-kvadratet.

01:58

R-Squared

Hvad fortæller R-Squared dig?

R-kvadratiske værdier varierer fra 0 til 1 og angives almindeligvis som procentdel fra 0% til 100%. En R-kvadrat på 100% betyder, at alle bevægelser i en sikkerhed (eller anden afhængig variabel) forklares fuldstændigt af bevægelser i indekset (eller den / de uafhængige variabel (er), du er interesseret i).

Når man investerer, indikerer en høj R-kvadrat mellem 85% og 100%, at aktien eller fondens præstationer bevæger sig relativt på linje med indekset. En fond med et lavt R-kvadrat, 70% eller mindre, indikerer, at sikkerheden ikke generelt følger indeksens bevægelser. En højere R-kvadratværdi indikerer et mere nyttigt betatal. For eksempel, hvis en aktie eller en fond har en R-kvadratværdi på næsten 100%, men har en beta under 1, tilbyder den sandsynligvis højere risikojusteret afkast.

Key takeaways

  • R-Squared er et statistisk mål for pasform, der angiver, hvor meget variation af en afhængig variabel er forklaret af de (n) uafhængige variabel (er) i en regressionsmodel.
  • Ved investeringer fortolkes R-kvadrat generelt som procentdelen af ​​en afdeling eller sikkerheds bevægelser, der kan forklares med bevægelser i et benchmark-indeks.
  • En R-kvadrat på 100% betyder, at alle bevægelser i en sikkerhed (eller anden afhængig variabel) forklares fuldstændigt af bevægelser i indekset (eller den / de uafhængige variabel (er), du er interesseret i).

Forskellen mellem R-kvadrat og justeret R-kvadrat

R-Squared fungerer kun som beregnet i en simpel lineær regressionsmodel med en forklaringsvariabel. Med en multiple regression, der består af flere uafhængige variabler, skal R-Squared justeres. Det justerede R-kvadrat sammenligner den beskrivende magt af regressionsmodeller, der inkluderer forskellige antallet af prediktorer. Hver prediktor, der føjes til en model, øger R-kvadratet og reducerer den aldrig. Således kan en model med flere udtryk synes at have en bedre pasform bare for den kendsgerning, at den har flere udtryk, mens den justerede R-kvadrat kompenserer for tilføjelsen af ​​variabler og kun øges, hvis den nye term forbedrer modellen over hvad der ville være opnået ved sandsynlighed og falder, når en prediktor forbedrer modellen mindre end hvad der er forudsagt ved en tilfældighed. I en overfittingtilstand opnås en forkert høj værdi af R-kvadrat, hvilket fører til en nedsat evne til at forudsige. Dette er ikke tilfældet med den justerede R-firkant.

Mens standard R-kvadrat kan bruges til at sammenligne godheden af ​​to eller modeller af forskellige modeller, er justeret R-kvadrat ikke en god måling til sammenligning af ikke-lineære modeller eller flere lineære regressioner.

Forskellen mellem R-kvadrat og beta

Beta og R-kvadrat er to relaterede, men forskellige, mål for korrelation, men beta er et mål for relativ risikofaktor. En gensidig fond med høj R-kvadrat korrelerer meget med en benchmark. Hvis betaen også er høj, kan den give et højere afkast end benchmarket, især på tyre markeder. R-kvadrat måler, hvor tæt hver ændring i et aktivs pris er korreleret med et benchmark. Beta måler, hvor store disse prisændringer er i forhold til et benchmark. Brugt sammen giver R-kvadrat og beta investorer et grundigt billede af kapitalforvalternes ydelse. En beta på nøjagtigt 1, 0 betyder, at aktivets risiko (volatilitet) er identisk med dets benchmark. I det væsentlige er R-squared en statistisk analyseteknik til praktisk brug og pålidelighed af betas af værdipapirer.

Begrænsninger i R-kvadrat

R-kvadrat giver dig et skøn over forholdet mellem bevægelser af en afhængig variabel baseret på en uafhængig variabels bevægelser. Det fortæller dig ikke, om din valgte model er god eller dårlig, og den fortæller dig heller ikke, om dataene og forudsigelserne er partiske. En høj eller lav R-firkant er ikke nødvendigvis god eller dårlig, da den ikke formidler pålideligheden af ​​modellen, eller om du har valgt den rigtige regression. Du kan få en lav R-kvadrat for en god model eller en høj R-firkant for en dårligt monteret model, og vice versa.

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.

Relaterede vilkår

Sådan fungerer bestemmelseskoefficienten Bestemmelseskoefficienten er et mål, der bruges i statistisk analyse til at vurdere, hvor godt en model forklarer og forudsiger fremtidige resultater. mere Hvad regression måler Regression er en statistisk måling, der forsøger at bestemme styrken i forholdet mellem en afhængig variabel (normalt betegnet med Y) og en række andre skiftende variabler (kendt som uafhængige variabler). mere Sådan fungerer multiple lineær regression Multiple lineær regression (MLR) er en statistisk teknik, der bruger flere forklaringsvariabler til at forudsige resultatet af en responsvariabel. mere Indeks Hugger En indeks hugger er en administreret gensidig fond, der har en tendens til at fungere meget som et benchmark-indeks. mere Benchmark for korrelationsværdier Et benchmark for korrelationsværdier er et referencepunkt, som en investeringsfond bruger til at måle vigtige korrelationsværdier såsom beta eller R-kvadrat. mere Hvad er en fejlbetegnelse? En fejlbetegnelse er defineret som en variabel i en statistisk model, der oprettes, når modellen ikke fuldt ud repræsenterer det faktiske forhold mellem de uafhængige og afhængige variabler. flere Partner Links
Anbefalet
Efterlad Din Kommentar