Vigtigste » algoritmisk handel » Hypotestest i finans: koncept og eksempler

Hypotestest i finans: koncept og eksempler

algoritmisk handel : Hypotestest i finans: koncept og eksempler

Din investeringsrådgiver foreslår dig en månedlig indkomstinvesteringsplan, der lover et variabelt afkast hver måned. Du vil kun investere i det, hvis du er sikker på en gennemsnitlig $ 180 månedlig indkomst. Din rådgiver fortæller dig også, at ordningen i de sidste 300 måneder havde investeringsafkast med en gennemsnitlig værdi af $ 190 og en standardafvigelse på $ 75. Bør du investere i denne ordning? Hypotesetestning hjælper med sådan en beslutningstagning.

Denne artikel antager læsernes fortrolighed med begreber i en normal distributionstabel, formel, p-værdi og relaterede grundlæggende statistikker.

Hvad er hypotesetestning?

Hypotese eller signifikansetestning er en matematisk model til test af en påstand, idé eller hypotese om en parameter af interesse i et givet populationssæt ved hjælp af data målt i et prøvesæt. Beregninger udføres på udvalgte prøver for at indsamle mere afgørende oplysninger om egenskaberne for hele populationen, hvilket muliggør en systematisk måde at teste påstande eller ideer om hele datasættet.

Her er et simpelt eksempel: En skoleleder rapporterer, at elever på hendes skole i gennemsnit scorer 7 ud af 10 i eksamener. For at teste denne "hypotese" registrerer vi karakterer af sige 30 studerende (prøve) fra hele elevpopulationen på skolen (sig 300) og beregner gennemsnittet af den prøve. Vi kan derefter sammenligne det (beregnede) prøve middelværdi med det (rapporterede) populationsmiddelværdi og forsøge at bekræfte hypotesen.

For at tage et andet eksempel er det årlige afkast for en bestemt gensidig fond 8%. Antag, at der findes en gensidig fond i 20 år. Vi tager en tilfældig stikprøve af den årlige afkast af gensidig fond for fx fem år (stikprøve) og beregner dens gennemsnit. Derefter sammenligner vi det (beregne) gennemsnit af prøven med det (påståede) populationsmiddelværdi for at verificere hypotesen.

Beslutningskriterierne skal baseres på visse parametre for datasæt.

Der findes forskellige metoder til hypotesetest, men de samme fire grundlæggende trin er involveret:

Trin 1: Definer hypotesen

Normalt angives den rapporterede værdi (eller kravstatistikken) som hypotesen og antages at være sand. For de ovenstående eksempler vil hypotesen være:

  • Eksempel A: Studerende i skolen scorer gennemsnit 7 ud af 10 i eksamener.
  • Eksempel B: Den årlige afkast af gensidig fond er 8% om året.

Denne angivne beskrivelse udgør ” Null hypotese (H 0 ) ” og antages at være sand - den måde, hvorpå en tiltalte i en juryforsøg antages uskyldig, indtil den er beviset skyldig af bevismaterialet, der er fremlagt i retten. Tilsvarende starter hypotesetestning med at angive og antage en "nullhypotese", og derefter bestemmer processen, om antagelsen sandsynligvis vil være sand eller falsk.

Det vigtige punkt at bemærke er, at vi tester nulhypotesen, fordi der er et element af tvivl om dens gyldighed. Uanset hvilken information der er imod den angivne nulhypotese, fanges i den alternative hypotese (H 1 ). For de ovenstående eksempler vil den alternative hypotese være:

  • Studerende scorer et gennemsnit, der ikke er lig med 7.
  • Det årlige afkast af gensidig fond er ikke lig med 8% om året.

Med andre ord er den alternative hypotese en direkte modsætning til nulhypotesen.

Som i en retssag antager juryen tiltaltes uskyld (nullhypotese). Anklageren skal bevise andet (alternativ hypotese). Tilsvarende skal forskeren bevise, at nulhypotesen enten er sand eller falsk. Hvis anklageren ikke kan bevise den alternative hypotese, er juryen nødt til at lade den tiltalte gå (basere beslutningen på nulhypotesen). Tilsvarende, hvis forskeren ikke klarer at bevise en alternativ hypotese (eller simpelthen ikke gør noget), antages nulhypotesen at være sand.

Trin 2: Indstil kriterierne

Beslutningskriterierne skal baseres på bestemte parametre for datasæt, og det er her forbindelsen til normal distribution kommer ind i billedet.

I henhold til standardstatistikpostulatet om stikprøvefordeling "For en hvilken som helst prøvestørrelse n er samplingfordelingen af ​​X̅ normal, hvis populationen X, hvorfra prøven er trukket, normalt distribueres." Derfor betyder sandsynligheden for alle andre mulige prøver, at man kunne vælge er normalt fordelt.

For eksempel kan du bestemme, om det gennemsnitlige daglige afkast for alle aktier, der er noteret på XYZ-aktiemarkedet, omkring nytårsdag er større end 2%.

H 0 : Nul hypotese: middelværdi = 2%

H 1 : Alternativ hypotese: middelværdi> 2% (dette er hvad vi vil bevise)

Tag prøven (f.eks. Om 50 lagre ud af i alt 500), og beregne gennemsnittet af prøven.

For en normal fordeling ligger 95% af værdierne inden for to standardafvigelser for befolkningsgennemsnittet. Derfor giver denne normale fordeling og antagelse af central grænse for prøvedataset os mulighed for at etablere 5% som et signifikansniveau. Det giver mening, da der under denne antagelse er mindre end en 5% sandsynlighed (100-95) for at få outliers, der ligger over to standardafvigelser fra befolkningsgennemsnittet. Afhængigt af datasætets art kan andre betydningsniveauer tages med 1%, 5% eller 10%. Ved økonomiske beregninger (inklusive adfærdsfinansiering) er 5% den generelt accepterede grænse. Hvis vi finder nogen beregninger, der går ud over de sædvanlige to standardafvigelser, har vi et stærkt tilfælde af outliers for at afvise nulhypotesen.

Grafisk er det repræsenteret som følger:

I eksemplet ovenfor, hvis gennemsnittet af prøven er meget større end 2% (siger 3, 5%), afviser vi nulhypotesen. Den alternative hypotese (gennemsnit> 2%) accepteres, hvilket bekræfter, at det gennemsnitlige daglige afkast for lagrene faktisk er over 2%.

Men hvis gennemsnittet af prøven ikke sandsynligvis vil være væsentligt større end 2% (og forbliver på, for eksempel omkring 2, 2%), kan vi IKKE afvise nulhypotesen. Udfordringen kommer til, hvordan man skal træffe afgørelse om sådanne sager i tæt rækkevidde. For at tage en konklusion fra udvalgte prøver og resultater skal der bestemmes et niveau af betydning, som muliggør en konklusion om nulhypotesen. Den alternative hypotese gør det muligt at bestemme betydningsniveauet eller "kritisk værdi" -konceptet til at træffe afgørelse om sådanne nærtliggende sager.

I henhold til standardbogsdefinitionen i lærebogen, “En kritisk værdi er en afskæringsværdi, der definerer grænserne, over hvilke mindre end 5% af eksempler kan opnås, hvis nulhypotesen er sand. Eksempel middel opnået ud over en kritisk værdi vil resultere i en beslutning om at afvise nulhypotesen. "I ovenstående eksempel, hvis vi har defineret den kritiske værdi som 2, 1%, og det beregnede middelværdi kommer til 2, 2%, afviser vi nulhypotesen En kritisk værdi skaber en klar afgrænsning af accept eller afvisning.

Trin 3: Beregn statistikken

Dette trin involverer beregning af det eller de krævede tal, kendt som teststatistikker (som middelværdi, z-score, p-værdi osv.), For den valgte prøve. (Vi kommer til disse i et senere afsnit.)

Trin 4: Nå en konklusion

Med den eller de beregnede værdier skal du vælge nulhypotesen. Hvis sandsynligheden for at få et prøveværdi er mindre end 5%, er konklusionen at afvise nulhypotesen. Ellers accepter og bevar nulhypotesen.

Typer af fejl

Der kan være fire mulige resultater i stikprøvebaseret beslutningstagning med hensyn til den korrekte anvendelighed for hele befolkningen:

Beslutning om at beholde


Beslutning om at afvise


Gælder for hele befolkningen


Korrekt


Ukorrekt

(TYPE 1 Fejl - a)


Gælder ikke for hele befolkningen


Ukorrekt

(TYPE 2 Fejl - b)


Korrekt


De "korrekte" sager er dem, hvor de beslutninger, der er taget om prøverne, virkelig gælder for hele befolkningen. Tilfælde af fejl opstår, når man beslutter at bevare (eller afvise) nulhypotesen baseret på stikprøveberegningerne, men denne beslutning gælder ikke rigtig for hele befolkningen. Disse tilfælde udgør Type 1 (alpha) og Type 2 (beta) fejl, som angivet i tabellen ovenfor.

Valg af den korrekte kritiske værdi gør det muligt at fjerne type-1 alfa-fejl eller begrænse dem til et acceptabelt interval.

Alfa betegner fejlen på signifikansniveauet og bestemmes af forskeren. For at opretholde standard 5% signifikans eller konfidensniveau for sandsynlighedsberegninger bevares dette på 5%.

I henhold til de relevante beslutningstagnings benchmarks og definitioner:

  • ”Dette (alfa) kriterium er normalt sat til 0, 05 (a = 0, 05), og vi sammenligner alfa-niveauet med p-værdien. Når sandsynligheden for en type I-fejl er mindre end 5% (p <0, 05), beslutter vi at afvise nulhypotesen; Ellers beholder vi nulhypotesen. ”
  • Det tekniske udtryk, der bruges til denne sandsynlighed, er p-værdi . Det er defineret som ”sandsynligheden for at opnå et stikprøveresultat, i betragtning af at værdien angivet i nulhypotesen er sand. P-værdien for at opnå et prøveudbytte sammenlignes med signifikansniveauet. "
  • En type II-fejl eller betafejl defineres som "sandsynligheden for forkert bevarelse af nulhypotesen, når den faktisk ikke er relevant for hele befolkningen."

Et par flere eksempler vil demonstrere denne og andre beregninger.

Eksempel 1

Der findes en månedlig indkomstinvesteringsordning, der lover variabelt månedligt afkast. En investor vil kun investere i det, hvis han er sikret en gennemsnitlig $ 180 månedlig indkomst. Han har en prøve på 300 måneders afkast, som har et gennemsnit på $ 190 og en standardafvigelse på $ 75. Skal han eller hun investere i denne ordning ">

Lad os konfigurere problemet. Investoren vil investere i ordningen, hvis han eller hun er sikret det ønskede gennemsnitlige afkast på $ 180.

H 0 : Nul hypotese: middelværdi = 180

H 1 : Alternativ hypotese: middelværdi> 180

Metode 1: Fremgangsmåde til kritisk værdi

Identificer en kritisk værdi X L for prøveværdien, der er stor nok til at afvise nulhypotesen - dvs. afvis nulhypotesen, hvis eksempelmidlet> = kritisk værdi X L

P (identificer en Alfa-fejl i type I) = P (afvis H 0, da H 0 er sandt),

Dette vil blive opnået, når prøveeksemplaret overstiger de kritiske grænser.

= P (givet at H 0 er sandt) = alfa

Grafisk vises det som følger:

Tager alpha = 0, 05 (dvs. 5% signifikansniveau), Z 0, 05 = 1, 645 (fra Z-tabellen eller normal distributionstabellen)

=> X L = 180 + 1, 645 * (75 / sqrt (300)) = 187, 12

Da gennemsnittet af prøven (190) er større end den kritiske værdi (187, 12), afvises nulhypotesen, og konklusionen er, at det gennemsnitlige månedlige afkast faktisk er større end $ 180, så investoren kan overveje at investere i denne ordning.

Metode 2: Brug af standardiseret teststatistik

Man kan også bruge standardiseret værdi z.

Teststatistik, Z = (gennemsnit af prøve - populationsmiddel) / (std-dev / sqrt (antal prøver)).

Derefter bliver afvisningsområdet følgende:

Z = (190 - 180) / (75 / sqrt (300)) = 2, 309

Vores afstødningsregion på 5% signifikansniveau er Z> Z 0, 05 = 1, 645.

Da Z = 2.309 er større end 1.645, kan nulhypotesen afvises med en lignende konklusion nævnt ovenfor.

Metode 3: Beregning af P-værdi

Vi sigter mod at identificere P (prøve middelværdi> = 190, når middelværdi = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2, 309) = 0, 0084 = 0, 84%

Følgende tabel for at udlede beregninger af p-værdien konkluderer, at der er bekræftet bevis for, at gennemsnitligt månedligt afkast er højere end 180:

p-værdi


Inferens


mindre end 1%


Bekræftet bevis, der understøtter alternativ hypotese


mellem 1% og 5%


Stærkt bevis, der understøtter alternativ hypotese


mellem 5% og 10%


Svag dokumentation, der støtter alternativ hypotese


større end 10%


Ingen beviser, der støtter alternativ hypotese


Eksempel 2

En ny børsmægler (XYZ) hævder, at hans mæglerhonorar er lavere end for din nuværende aktiemægler (ABC). Data tilgængelige fra et uafhængigt forskningsfirma indikerer, at gennemsnittet og std-dev for alle ABC-mæglerklienter er henholdsvis $ 18 og $ 6.

Der udtages en stikprøve på 100 klienter af ABC, og mægleromkostninger beregnes med de nye satser for XYZ-mægler. Hvis gennemsnittet af prøven er $ 18, 75 og std-dev er det samme ($ 6), kan der foretages nogen slutning om forskellen i den gennemsnitlige mægleregning mellem ABC og XYZ mægler ">

H 0 : Nul hypotese: middelværdi = 18

H 1 : Alternativ hypotese: middel 18 (Dette er hvad vi vil bevise.)

Afvisningsregion: Z <= - Z 2, 5 og Z> = Z 2, 5 (hvis man antager 5% signifikansniveau, deles 2, 5 hver på hver side).

Z = (prøve middel - middel) / (std-dev / sqrt (antal prøver))

= (18, 75 - 18) / (6 / (kvadrat (100)) = 1, 25

Denne beregnede Z-værdi falder mellem de to grænser defineret af:

- Z 2, 5 = -1, 96 og Z 2, 5 = 1, 96.

Dette konkluderer, at der ikke er tilstrækkelig bevis for at udlede, at der er nogen forskel mellem satserne på din eksisterende mægler og den nye mægler.

Alternativt p-værdien = P (Z1, 25)

= 2 * 0, 1056 = 0, 2112 = 21, 12%, hvilket er større end 0, 05 eller 5%, hvilket fører til den samme konklusion.

Grafisk er det repræsenteret af følgende:

Kritikpunkter for den hypotetiske testmetode:

  • En statistisk metode baseret på antagelser
  • Fejlagtigt som beskrevet i alfa- og beta-fejl
  • Fortolkning af p-værdi kan være tvetydig, hvilket kan føre til forvirrende resultater

Bundlinjen

Hypotesetest gør det muligt for en matematisk model at validere en påstand eller idé med et vist konfidensniveau. Som de fleste af de statistiske værktøjer og modeller er det imidlertid bundet af et par begrænsninger. Brug af denne model til at træffe økonomiske beslutninger bør overvejes med et kritisk øje, idet alle afhængigheder tages i betragtning. Alternative metoder som Bayesian Inferens er også værd at undersøge til lignende analyse.

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.
Anbefalet
Efterlad Din Kommentar