Vigtigste » algoritmisk handel » Stratificeret tilfældig prøveudtagning

Stratificeret tilfældig prøveudtagning

algoritmisk handel : Stratificeret tilfældig prøveudtagning
Hvad er stratificeret tilfældig prøveudtagning?

Stratificeret tilfældig prøveudtagning er en metode til prøvetagning, der involverer opdelingen af ​​en befolkning i mindre undergrupper kendt som strata. Ved stratificeret tilfældig stikprøveudtagning eller stratifikation dannes lagene på baggrund af medlemmers delte attributter eller karakteristika såsom indkomst eller uddannelsesmæssig opnåelse.

Stratificeret tilfældig prøveudtagning kaldes også proportional tilfældig prøveudtagning eller tilfældig stikprøveudtagning.

[Vigtigt: Stratificeret prøveudtagning bruges til at fremhæve forskelle mellem grupper i en befolkning i modsætning til simpel tilfældig stikprøveudtagning, der behandler alle medlemmer af en befolkning som lige, med lige stor sandsynlighed for at blive stikprøven.]

01:40

Stratificeret tilfældig prøveudtagning

Sådan fungerer stratificeret tilfældig prøveudtagning

Når en forsker afslutter analyse eller forskning på en gruppe enheder med lignende egenskaber, kan en forsker finde ud af, at befolkningsstørrelsen er for stor til at afslutte forskningen til. For at spare tid og penge kan en analytiker indtage en mere gennemførlig tilgang ved at vælge en lille gruppe fra befolkningen. Den lille gruppe omtales som en stikprøvestørrelse, som er en undergruppe af befolkningen, der bruges til at repræsentere hele befolkningen. En prøve kan vælges fra en population på flere måder, hvoraf den ene er den stratificerede tilfældige samplingmetode.

En stratificeret stikprøveudtagning involverer opdeling af hele befolkningen i homogene grupper kaldet strata (flertal for stratum). Tilfældige prøver vælges derefter fra hvert stratum. Overvej for eksempel en akademisk forsker, der gerne vil vide antallet af MBA-studerende i 2007, der modtog et jobtilbud inden for tre måneder efter eksamen.

Han vil snart opdage, at der var næsten 200.000 MBA-kandidater for året. Han beslutter sig måske for bare at tage en simpel tilfældig prøve på 50.000 kandidater og gennemføre en undersøgelse. Endnu bedre kunne han opdele befolkningen i lag og tage en tilfældig prøve fra lagene. For at gøre dette, ville han oprette befolkningsgrupper baseret på køn, aldersgruppe, race, nationalitetsland og karrierebaggrund. En tilfældig prøve fra hvert stratum udtages i et antal, der er proportionalt med stratumets størrelse sammenlignet med befolkningen. Disse undergrupper af lagene samles derefter for at danne en tilfældig prøve.

Key takeaways

  • Stratificeret stikprøveudtagning giver forskere mulighed for at få en prøvepopulation, der bedst repræsenterer hele den population, der studeres.
  • Stratificeret stikprøveudtagning involverer opdeling af hele befolkningen i homogene grupper kaldet strata.
  • Stratificeret tilfældig prøveudtagning adskiller sig fra simpel tilfældig sampling, som involverer tilfældig udvælgelse af data fra en hel population, så hver mulig prøve er lige sandsynligvis forekommende.

Eksempel på stratificeret tilfældig prøveudtagning

Antag, at et forskerteam ønsker at bestemme GPA for universitetsstuderende overalt i USA. Forskningsteamet har svært ved at indsamle data fra alle 21 millioner universitetsstuderende; den beslutter at tage en tilfældig stikprøve af befolkningen ved hjælp af 4.000 studerende.

Antag nu, at holdet ser på de forskellige attributter for prøvedeltagerne og undrer sig over, om der er nogen forskelle i GPA'er og studerendes majors. Antag, at det finder ud af, at 560 studerende er engelske majors, 1.135 er videnskabelige majors, 800 er datalogi-majors, 1.090 er ingeniør-majors og 415 er matematik-majors. Holdet ønsker at bruge en proportional stratificeret tilfældig prøve, hvor stratum af prøven er proportional med den tilfældige stikprøve i populationen.

Antag, at teamet undersøger demografien for universitetsstuderende i USA og finder procentdelen af ​​det, de studerende har 12% hovedfag i engelsk, 28% i videnskab, 24% inden for datalogi, 21% i ingeniørvidenskab og 15% større i matematik. Således oprettes fem lag fra den lagdelte tilfældige samplingproces.

Holdet skal derefter bekræfte, at befolkningslaget står i forhold til stratum i stikprøven; de finder dog, at proportioner ikke er ens. Holdet skal derefter genprøve 4.000 studerende fra befolkningen og tilfældigt vælge 480 engelske, 1.120 videnskaber, 960 datalogi, 840 ingeniører og 600 matematikstuderende.

Hos dem har den en forholdsmæssig stratificeret tilfældig prøve af universitetsstuderende, hvilket giver en bedre repræsentation af studerendes college-majors i USA Forskerne kan derefter fremhæve specifikt stratum, observere de forskellige studier af amerikanske universitetsstuderende og observere de forskellige kvalitetspoint gennemsnit .

Enkle tilfældige versus stratificerede tilfældige prøver

Enkle tilfældige prøver og stratificerede tilfældige prøver er begge statistiske måleværktøjer. En simpel tilfældig prøve bruges til at repræsentere hele datapopulationen. En stratificeret tilfældig prøve opdeler populationen i mindre grupper eller lag, baseret på delte egenskaber.

Den enkle tilfældige stikprøve bruges ofte, når der er meget lidt tilgængelig information om datapopulationen, når datapopulationen har alt for mange forskelle til at opdeles i forskellige undergrupper, eller når der kun er et tydeligt kendetegn blandt datapopulationen.

For eksempel kan et slikfirma eventuelt ønske at studere sine kunders købsvaner for at bestemme fremtiden for sin produktlinje. Hvis der er 10.000 kunder, kan det bruge 100 af disse kunder som en tilfældig prøve. Den kan derefter anvende, hvad den finder fra de 100 kunder til resten af ​​sin base. I modsætning til stratificering, vil det prøve 100 medlemmer rent tilfældigt uden hensyntagen til deres individuelle karakteristika.

Proportioneret og uforholdsmæssig stratificering

Stratificeret tilfældig prøveudtagning sikrer, at hver undergruppe i en given population er tilstrækkeligt repræsenteret i hele prøvepopulationen i en forskningsundersøgelse. Stratificering kan være forholdsmæssig eller uforholdsmæssig. I en forholdsmæssig stratificeret metode er prøvestørrelsen af ​​hvert stratum proportionalt med befolkningens størrelse på stratum.

For eksempel, hvis forskeren ønskede en prøve på 50.000 kandidater ved hjælp af aldersgruppe, opnås den forholdsmæssige stratificerede tilfældige prøve ved hjælp af denne formel: (prøvestørrelse / populationsstørrelse) x stratum størrelse. Tabellen nedenfor antager en befolkningstørrelse på 180.000 MBA kandidater pr. År.

Aldersgruppe


24-28


29-33


34-37


i alt


Antal mennesker i stratum


90.000


60.000


30.000


180.000


Strata prøve størrelse


25.000


16.667


8333


50.000


Strataprøvestørrelsen for MBA-kandidater i alderen 24 til 28 år er beregnet som (50.000 / 180.000) x 90.000 = 25.000. Den samme metode bruges til de andre aldersgrupper. Nu, hvor strataeksempelstørrelsen er kendt, kan forskeren udføre enkel tilfældig prøveudtagning i hvert stratum for at vælge sine undersøgelsesdeltagere. Med andre ord vælges 25.000 kandidater fra aldersgruppen 24-28 tilfældigt fra hele befolkningen, 16.667 kandidater fra aldersområdet 29-33 vil blive valgt tilfældigt fra befolkningen, og så videre.

I en uforholdsmæssig stratificeret prøve er størrelsen på hvert stratum ikke proportionalt med dets størrelse i befolkningen. Forskeren kan beslutte at prøve 1/2 af kandidaterne i aldersgruppen 34-37 år og 1/3 af kandidaterne i aldersgruppen 29-33 år.

Det er vigtigt at bemærke, at en person ikke kan passe ind i flere lag. Hver enhed skal kun passe ind i et lag. At have overlappende undergrupper betyder, at nogle individer vil have større chancer for at blive valgt til undersøgelsen, hvilket fuldstændigt ignorerer begrebet stratificeret prøveudtagning som en type sandsynlighedsudtagning.

[Vigtigt: Porteføljeforvaltere kan bruge stratificeret tilfældig sampling til at oprette porteføljer ved at replikere et indeks, såsom et obligationsindeks.]

Fordele ved stratificeret tilfældig prøveudtagning

Den største fordel ved stratificeret tilfældig prøveudtagning er, at den fanger nøglepopulationskarakteristika i prøven. I lighed med et vægtet gennemsnit producerer denne prøveudtagningsegenskaber karakteristika i prøven, der er proportional med den samlede population. Stratificeret tilfældig prøveudtagning fungerer godt for populationer med forskellige attributter, men er ellers ineffektiv, hvis der ikke kan dannes undergrupper.

Stratificering giver en mindre fejl i estimering og større præcision end den enkle tilfældige samplingmetode. Jo større forskelle der er mellem lagene, jo større er præcisionen.

Ulemper ved stratificeret tilfældig prøveudtagning

Desværre kan denne metode ikke bruges i hver undersøgelse. Metodens ulempe er, at flere betingelser skal være opfyldt for, at den kan bruges korrekt. Forskere skal identificere hvert medlem af en befolkning, der studeres, og klassificere hvert enkelt af dem til en, og kun en, subpopulation. Som et resultat heraf er stratificeret stikprøveudtagning ufordelagtigt, når forskere ikke med sikkerhed kan klassificere hvert medlem af befolkningen i en undergruppe. Det kan også være udfordrende at finde en udtømmende og definitiv liste over en hel befolkning.

Overlapning kan være et problem, hvis der er emner, der falder ind i flere undergrupper. Når der udføres enkel tilfældig prøveudtagning, er det mest sandsynligt, at dem, der er i flere undergrupper, bliver valgt. Resultatet kan være en fejlagtig repræsentation eller unøjagtig afspejling af befolkningen.

Ovenstående eksempler gør det let: bacheloruddannelse, kandidatuddannelse, mandlig og kvindelig er klart definerede grupper. I andre situationer kan det dog være langt vanskeligere. Forestil dig at inkorporere egenskaber som race, etnicitet eller religion. Sorteringsprocessen bliver vanskeligere, hvilket gør stratificeret tilfældig prøveudtagning en ineffektiv og mindre end ideel metode.

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.

Relaterede vilkår

Prøve En prøve er en mindre, overskuelig version af en større gruppe. Prøver bruges i statistisk test, når populationsstørrelserne er for store. mere Sådan fungerer enkle tilfældige prøver En simpel tilfældig prøve er en undergruppe af en statistisk population, hvor hvert medlem af delmængden har samme sandsynlighed for at blive valgt. En simpel tilfældig prøve menes at være en objektiv repræsentation af en gruppe. mere repræsentativ prøve bruges ofte til at ekstrapolere bredere følelser En repræsentativ prøve er en undergruppe af en befolkning, der afspejler karakteristika for hele befolkningen. mere Ins og outs af systematisk prøveudtagning Systematisk prøveudtagning er en sandsynlighedsudtagningsmetode, hvor en tilfældig prøve fra en større population vælges. mere Sampling Definition Sampling er en proces der bruges i statistisk analyse, hvor en gruppe observationer udvindes fra en større population. mere Definition af T-test En t-test er en type inferentiel statistik, der bruges til at bestemme, om der er en betydelig forskel mellem midlerne fra to grupper, som kan være relateret til visse funktioner. flere Partner Links
Anbefalet
Efterlad Din Kommentar