Vigtigste » algoritmisk handel » Bestemmelseskoefficient

Bestemmelseskoefficient

Hvad er bestemmelseskoefficienten?

Bestemmelseskoefficienten er et mål, der bruges i statistisk analyse, der vurderer, hvor godt en model forklarer og forudsiger fremtidige resultater. Det er et tegn på niveauet for den forklarede variation i datasættet. Bestemmelseskoefficienten, også almindeligt kendt som "R-kvadrat", bruges som en retningslinje til måling af nøjagtigheden af modellen.

En måde at fortolke dette tal er at sige, at variablerne inkluderet i en given model forklarer cirka x% af den observerede variation. Så hvis R2 = 0, 50, kan ca. halvdelen af den observerede variation forklares med modellen.

01:58

R-Squared

Key takeaways

Bestemmelseskoefficienten er en kompleks idé, der er centreret om den statistiske analyse af en fremtidig datamodel.
Bestemmelseskoefficienten bruges til at forklare, hvor stor variation af en faktor, der kan være forårsaget af dens forhold til en anden faktor.

Forståelse af bestemmelseskoefficienten

Bestemmelseskoefficienten bruges til at forklare, hvor stor variation af en faktor, der kan være forårsaget af dens forhold til en anden faktor. Det er stærkt afhængig af i trendanalyse og er repræsenteret som en værdi mellem 0 og 1.

Jo tættere værdien er 1, jo bedre er tilpasningen eller forholdet mellem de to faktorer. Bestemmelseskoefficienten er kvadratet af korrelationskoefficienten, også kendt som "R", hvilket gør det muligt for den at vise graden af lineær korrelation mellem to variabler.

Denne sammenhæng er kendt som "pasformens godhed." En værdi på 1, 0 indikerer en perfekt pasform, og det er således en meget pålidelig model til fremtidige prognoser, hvilket indikerer, at modellen forklarer alle de observerede variationer. En værdi på 0 på den anden side vil indikere, at modellen overhovedet ikke nøjagtigt modellerer dataene. For en model med flere variabler, såsom en multiple regressionsmodel, er den justerede R2 en bedre bestemmelseskoefficient. I økonomi ses en R2-værdi over 0, 60 som værd.

Fordele ved at analysere bestemmelseskoefficienten

Bestemmelseskoefficienten er kvadratet af korrelationen mellem de forudsagte scoringer i et datasæt versus det faktiske sæt scoringer. Det kan også udtrykkes som kvadratet for korrelationen mellem X- og Y-scoringer, hvor X er den uafhængige variabel og Y er den afhængige variabel.

Uanset repræsentation betyder en R-kvadrat lig med 0, at den afhængige variabel ikke kan forudsiges ved hjælp af den uafhængige variabel. Omvendt, hvis det er lig med 1, betyder det, at afhængigheden af en variabel altid er forudsagt af den uafhængige variabel.

En bestemmelseskoefficient, der falder inden for dette interval, måler det omfang, den afhængige variabel er forudsagt af den uafhængige variabel. En R-kvadrat på 0, 20 betyder for eksempel, at 20% af den afhængige variabel er forudsagt af den uafhængige variabel.

God pasform eller graden af lineær korrelation måler afstanden mellem en monteret linje på en graf og alle datapunkter, der er spredt rundt om grafen. Det stramme datasæt har en regressionslinje, der er meget tæt på punkterne og har et højt pasform, hvilket betyder, at afstanden mellem linjen og dataene er meget lille. En god pasform har en R-kvadrat der er tæt på 1.

R-kvadrat er imidlertid ikke i stand til at bestemme, om datapunkterne eller forudsigelserne er partiske. Det fortæller heller ikke analytikeren eller brugeren, om koefficienten for bestemmelsesværdi er god eller ej. Et lavt R-kvadrat er f.eks. Ikke dårligt, og det er op til personen at tage en beslutning baseret på R-kvadratnummeret.

Bestemmelseskoefficienten skal ikke fortolkes naivt. For eksempel, hvis en R-kvadrat af en model rapporteres til 75%, er variansen af dens fejl 75% mindre end variationen af den afhængige variabel, og standardafvigelsen for dens fejl er 50% mindre end standardafvigelsen for den afhængige variabel. Standardafvigelsen for modellens fejl er ca. en tredjedel af størrelsen på standardafvigelsen for de fejl, som du får med en model, der kun er konstant.

Endelig, selv hvis en R-kvadratværdi er stor, kan der muligvis ikke være nogen statistisk betydning af de forklarende variabler i en model, eller den effektive størrelse af disse variabler kan i praksis være meget lille.

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.

Relaterede vilkår

Hvad er en fejlbetegnelse? En fejlbetegnelse er defineret som en variabel i en statistisk model, der oprettes, når modellen ikke fuldt ud repræsenterer det faktiske forhold mellem de uafhængige og afhængige variabler. mere Sådan fungerer multiple lineær regression Multiple lineær regression (MLR) er en statistisk teknik, der bruger flere forklaringsvariabler til at forudsige resultatet af en responsvariabel. mere Line Of Best Fit Linjen med best fit er et output fra regressionsanalyse, der repræsenterer forholdet mellem to eller flere variabler i et datasæt. mere R-kvadrat R-kvadrat er et statistisk mål, der repræsenterer andelen af variansen for en afhængig variabel, der forklares med en uafhængig variabel. mere Sådan fungerer den mindste kvadratmetode Metoden mindstekvadrater er en statistisk teknik til at bestemme linjen med den bedste pasform for en model, der er specificeret af en ligning med visse parametre til observerede data. mere Heteroskedasticitet I statistik sker der heteroskedasticitet, når standardafvigelserne for en variabel, der overvåges over en bestemt tidsperiode, er ikke-konstante. flere Partner Links

← Aktieindekseret Universal Life Insurance

Hvilken branche bruger mest på lobbyvirksomhed? →

Anbefalet

Efterlad Din Kommentar