Bestemmelseskoefficient
Hvad er bestemmelseskoefficienten?Bestemmelseskoefficienten er et mål, der bruges i statistisk analyse, der vurderer, hvor godt en model forklarer og forudsiger fremtidige resultater. Det er et tegn på niveauet for den forklarede variation i datasættet. Bestemmelseskoefficienten, også almindeligt kendt som "R-kvadrat", bruges som en retningslinje til måling af nøjagtigheden af modellen.
En måde at fortolke dette tal er at sige, at variablerne inkluderet i en given model forklarer cirka x% af den observerede variation. Så hvis R2 = 0, 50, kan ca. halvdelen af den observerede variation forklares med modellen.
01:58R-Squared
Key takeaways
- Bestemmelseskoefficienten er en kompleks idé, der er centreret om den statistiske analyse af en fremtidig datamodel.
- Bestemmelseskoefficienten bruges til at forklare, hvor stor variation af en faktor, der kan være forårsaget af dens forhold til en anden faktor.
Forståelse af bestemmelseskoefficienten
Bestemmelseskoefficienten bruges til at forklare, hvor stor variation af en faktor, der kan være forårsaget af dens forhold til en anden faktor. Det er stærkt afhængig af i trendanalyse og er repræsenteret som en værdi mellem 0 og 1.
Jo tættere værdien er 1, jo bedre er tilpasningen eller forholdet mellem de to faktorer. Bestemmelseskoefficienten er kvadratet af korrelationskoefficienten, også kendt som "R", hvilket gør det muligt for den at vise graden af lineær korrelation mellem to variabler.
Denne sammenhæng er kendt som "pasformens godhed." En værdi på 1, 0 indikerer en perfekt pasform, og det er således en meget pålidelig model til fremtidige prognoser, hvilket indikerer, at modellen forklarer alle de observerede variationer. En værdi på 0 på den anden side vil indikere, at modellen overhovedet ikke nøjagtigt modellerer dataene. For en model med flere variabler, såsom en multiple regressionsmodel, er den justerede R2 en bedre bestemmelseskoefficient. I økonomi ses en R2-værdi over 0, 60 som værd.
Fordele ved at analysere bestemmelseskoefficienten
Bestemmelseskoefficienten er kvadratet af korrelationen mellem de forudsagte scoringer i et datasæt versus det faktiske sæt scoringer. Det kan også udtrykkes som kvadratet for korrelationen mellem X- og Y-scoringer, hvor X er den uafhængige variabel og Y er den afhængige variabel.
Uanset repræsentation betyder en R-kvadrat lig med 0, at den afhængige variabel ikke kan forudsiges ved hjælp af den uafhængige variabel. Omvendt, hvis det er lig med 1, betyder det, at afhængigheden af en variabel altid er forudsagt af den uafhængige variabel.
En bestemmelseskoefficient, der falder inden for dette interval, måler det omfang, den afhængige variabel er forudsagt af den uafhængige variabel. En R-kvadrat på 0, 20 betyder for eksempel, at 20% af den afhængige variabel er forudsagt af den uafhængige variabel.
God pasform eller graden af lineær korrelation måler afstanden mellem en monteret linje på en graf og alle datapunkter, der er spredt rundt om grafen. Det stramme datasæt har en regressionslinje, der er meget tæt på punkterne og har et højt pasform, hvilket betyder, at afstanden mellem linjen og dataene er meget lille. En god pasform har en R-kvadrat der er tæt på 1.
R-kvadrat er imidlertid ikke i stand til at bestemme, om datapunkterne eller forudsigelserne er partiske. Det fortæller heller ikke analytikeren eller brugeren, om koefficienten for bestemmelsesværdi er god eller ej. Et lavt R-kvadrat er f.eks. Ikke dårligt, og det er op til personen at tage en beslutning baseret på R-kvadratnummeret.
Bestemmelseskoefficienten skal ikke fortolkes naivt. For eksempel, hvis en R-kvadrat af en model rapporteres til 75%, er variansen af dens fejl 75% mindre end variationen af den afhængige variabel, og standardafvigelsen for dens fejl er 50% mindre end standardafvigelsen for den afhængige variabel. Standardafvigelsen for modellens fejl er ca. en tredjedel af størrelsen på standardafvigelsen for de fejl, som du får med en model, der kun er konstant.
Endelig, selv hvis en R-kvadratværdi er stor, kan der muligvis ikke være nogen statistisk betydning af de forklarende variabler i en model, eller den effektive størrelse af disse variabler kan i praksis være meget lille.
Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.