Vigtigste » algoritmisk handel » Ikke-parametrisk statistik

Ikke-parametrisk statistik

Hvad er ikke-parametrisk statistik?

Ikke-parametriske statistikker henviser til en statistisk metode, hvor dataene ikke er påkrævet for at passe til en normal fordeling. Ikke-parametrisk statistik bruger data, der ofte er ordinære, hvilket betyder, at de ikke er afhængige af tal, men snarere på en rangering eller rækkefølge af sortering. F.eks. Vil en undersøgelse, der overbringer forbrugerpræferencer, der spænder fra lignende til ikke lide, betragtes som ordinære data.

Ikke-parametrisk statistik inkluderer ikke-parametriske beskrivende statistikker, statistiske modeller, inferens og statistiske prøver. Modestrukturen for ikke-parametriske modeller er ikke specificeret priori, men bestemmes i stedet ud fra data. Udtrykket ikke-parametrisk er ikke beregnet til at antyde, at sådanne modeller helt mangler parametre, men snarere at antallet og arten af parametrene er fleksible og ikke fastlagt på forhånd. Et histogram er et eksempel på et ikke-parametrisk skøn over en sandsynlighedsfordeling.

Forståelse af ikke-parametrisk statistik

I statistikker inkluderer parametriske statistikker parametre som middelværdien, median, standardafvigelse, varians osv. Denne form for statistik bruger de observerede data til at estimere fordelingen af parametre. Under parametriske statistikker antages data at passe til en normal fordeling med ukendte parametre μ (populationsmiddelværdi) og σ ² (populationsvarians), som derefter estimeres ved hjælp af eksempeldelen og prøvevariansen.

Ikke-parametrisk statistik antager ingen antagelse om prøvestørrelsen eller om de observerede data er kvantitative.

Ikke-parametrisk statistik antager ikke, at data er hentet fra en normal fordeling. I stedet estimeres formen for fordelingen under denne form for statistisk måling. Mens der er mange situationer, hvor en normal distribution kan antages, er der også nogle scenarier, hvor det ikke vil være muligt at bestemme, om dataene normalt vil blive distribueret.

Eksempler på ikke-parametrisk statistik

I det første eksempel skal du overveje en forsker, der ønsker et skøn over antallet af babyer i Nordamerika født med brune øjne, kan beslutte at tage en prøve på 150.000 babyer og køre en analyse af datasættet. Målingen, de stammer fra, vil blive brugt som et skøn over hele populationen af babyer med brune øjne født det følgende år.

For et andet eksempel skal du overveje en anden forsker, der ønsker at vide, om det at gå tidligt eller sent i seng er knyttet til, hvor ofte man bliver syg. Forudsat at prøven er valgt tilfældigt blandt populationen, kan antagelsen af stikprøvestørrelse af sygdomsfrekvens antages at være normal. Imidlertid kan et eksperiment, der måler den menneskelige legems resistens over for en bakteriestamme, ikke antages at have en normal fordeling.

Dette skyldes, at en tilfældigt valgt prøvedata kan være modstand mod stammen. På den anden side, hvis forskeren overvejer faktorer som genetisk makeup og etnicitet, kan han finde ud af, at en prøvestørrelse valgt ved hjælp af disse egenskaber muligvis ikke er resistent over for stammen. Man kan derfor ikke antage en normal fordeling.

Denne metode er nyttig, når dataene ikke har nogen klar numerisk fortolkning og er bedst at bruge med data, der har en sortering af sortering. For eksempel kan en personlighedsvurderingsprøve have en rangering af dens målinger indstillet som stærkt uenig, uenig, ligeglad, enig og stærkt enig. I dette tilfælde bør ikke-parametriske metoder anvendes.

Særlige overvejelser

Ikke-parametriske statistikker har vundet påskønnelse på grund af deres brugervenlighed. Efterhånden som behovet for parametre lettes, bliver dataene mere anvendelige til en større række test. Denne type statistikker kan bruges uden middelværdien, prøvestørrelse, standardafvigelse eller estimering af andre relaterede parametre, når ingen af disse oplysninger er tilgængelige.

Da ikke-parametriske statistikker gør færre antagelser om eksempeldataene, er dens anvendelse bredere end parametrisk statistik. I tilfælde, hvor parametrisk testning er mere passende, vil ikke-parametriske metoder være mindre effektive. Dette skyldes, at resultaterne opnået fra ikke-parametriske statistikker har en lavere grad af tillid, end hvis resultaterne blev opnået ved hjælp af parametriske statistikker.

Key takeaways

Ikke-parametrisk statistik er let at bruge, men tilbyder ikke nøjagtigheden af andre statistiske modeller.
Denne type analyse er bedst egnet, når man overvejer rækkefølgen af noget, hvor selv om de numeriske data ændres, vil resultaterne sandsynligvis forblive de samme.

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.

Relaterede vilkår

Forståelse af T-distribution AT-distribution er en type sandsynlighedsfunktion, der er passende til at estimere populationsparametre for små prøvestørrelser eller ukendte afvigelser. mere Sådan fungerer stikprøvefordeling En prøveudtagningsfordeling er en sandsynlighedsfordeling af en statistik opnået gennem et stort antal prøver trukket fra en bestemt population. mere Sådan bruges Wilcoxon-testen Wilcoxon-testen, der refererer til enten Rank Sum-testen eller Signed Rank-testen, er en ikke-parametrisk test, der sammenligner to parrede grupper. mere Ikke-parametrisk metode Ikke-parametrisk metode refererer til en type statistik, der ikke kræver, at de data, der analyseres, opfylder visse antagelser eller parametre. mere Definition af T-test En t-test er en type inferentiel statistik, der bruges til at bestemme, om der er en betydelig forskel mellem midlerne fra to grupper, som kan være relateret til visse funktioner. mere Tillidsinterval Et konfidensinterval måler sandsynligheden for, at en populationsparameter falder mellem to indstillede værdier. flere Partner Links

← Fantomindkomst

Omfattende guide til lejers forsikring →

Anbefalet

Efterlad Din Kommentar