Fantastisk korrelation
Hvad er rigtig korrelationI statistik refererer en falsk korrelation eller falskhed til en forbindelse mellem to variabler, der ser ud til at være årsagsmæssige, men ikke er. Smukke forhold ser ofte ud som en variabel, der påvirker en anden. Denne falske korrelation skyldes ofte en tredje faktor, der ikke er synlig på undersøgelsestidspunktet, nogle gange kaldet en forvirrende faktor.
Key takeaways
- Fantastisk korrelation, eller falskhed, er, når to faktorer forekommer tilfældigt relaterede, men ikke er det.
- Udseendet af et årsagsforhold skyldes ofte en lignende bevægelse på et diagram, der viser sig at være tilfældigt eller forårsaget af en tredje "forvirrende" faktor.
- Fantastisk korrelation kan ofte være forårsaget af små prøvestørrelser eller vilkårlige slutpunkter.
Sådan fungerer fantastisk korrelation
Når to tilfældige variabler sporer hinanden tæt på en graf, er det let at mistænke korrelation eller et forhold mellem de to faktorer, hvor en ændring påvirker den anden. Ved at sætte "årsagssammenhæng" til, et andet emne, kan denne observation føre til, at læseren af kortet tror at bevægelsen af variabel A er knyttet til bevægelsen i variabel B eller omvendt. men nogle gange, ved nærmere statistisk undersøgelse, er de justerede bevægelser tilfældigt eller forårsaget af en tredje faktor, der påvirker de to første. Dette er en falsk korrelation. Forskning udført med små prøvestørrelser eller vilkårlige endepunkter er særlig modtagelige for svindel.
Eksempel på fantastiske korrelationer
Det er ikke for udfordrende at opdage interessante sammenhænge. Mange vil dog vise sig at være falske. For de mandlige arter på Wall Street involverer to populære svage korrelationer kvinder og sport. Oprindelsen i 1920'erne er skørtlængde teorien, som hævder, at nederdelens længder og aktiemarkedets retning er korreleret. Hvis nederdelens længder er lange, betyder det, at aktiemarkedet går ned; hvis de er korte, går markedet op. Omkring slutningen af januar er der tale om den såkaldte Super Bowl-indikator, som antyder, at en sejr fra AFC-holdet sandsynligvis betyder, at aktiemarkedet vil falde i det kommende år, mens en sejr fra NFC-teamet antyder en stigning i marked. Siden 1966 har indikatoren haft en nøjagtighed på 80%. Det er et sjovt samtalestykke, men sandsynligvis ikke noget, som en seriøs økonomisk rådgiver vil anbefale som en investeringsstrategi for klienter.
Her er nogle flere eksempler på almindelige falske korrelationer:
- Dykningen stiger, når salget af is stiger. Det kan se ud til, at øget salg af is forårsager mere drukning, men i virkeligheden kan stigende varme få flere til at svømme, samt købe mere is.
- Den amerikanske mordrate fra 2006-2011 faldt i samme takt som Microsoft Internet Explorer-brug.
- Ledere, der siger tak og tak, nyder oftere bedre resultater.
- Folk, der bærer Oakland Raiders teamudstyr, er mere tilbøjelige til at begå forbrydelser.
Sådan finder man fremragende korrelationer
Statistikere og andre videnskabsfolk, der analyserer data, skal hele tiden være på udkig efter svindelige forhold. Der er adskillige metoder, de bruger, herunder:
- Sikre en passende repræsentativ prøve.
- Opnåelse af en passende prøvestørrelse.
- At være på vagt over for vilkårlige slutpunkter.
- Styring af så mange eksterne variabler som muligt.
- Brug af en nulhypotese og kontrollere for en stærk p-værdi.