T-Test

Hvad er en T-test?

En t-test er en type inferentiel statistik, der bruges til at bestemme, om der er en signifikant forskel mellem midlerne til to grupper, som kan være relateret til visse funktioner. Det bruges mest, når datasættene, ligesom datasættet, der er registreret som resultatet af at vende en mønt 100 gange, ville følge en normal fordeling og kan have ukendte afvigelser. En t-test bruges som et hypotese-testværktøj, der tillader test af en antagelse, der er relevant for en population.

En t-test ser på t-statistikken, t-fordelingsværdierne og graden af frihed til at bestemme sandsynligheden for forskel mellem to datasæt. For at udføre en test med tre eller flere variabler skal man bruge en variansanalyse.

01:38

T-Test

Forklaring af T-testen

I det væsentlige giver en t-test os mulighed for at sammenligne gennemsnitsværdierne for de to datasæt og bestemme, om de kom fra den samme population. I ovenstående eksempler ville vi ikke forvente, at de havde nøjagtigt det samme gennemsnit og standardafvigelse, hvis vi skulle tage et stik af studerende fra klasse A og en anden prøve af studerende fra klasse B. På lignende måde skal prøver, der er taget fra den placebo-fodrede kontrolgruppe og de, der blev taget fra den lægemiddel, der blev ordineret med lægemidlet, have en lidt anden gennemsnit og standardafvigelse.

Matematisk tager t-testen en prøve fra hvert af de to sæt og fastlægger problemopgørelsen ved at antage en nulhypotese om, at de to midler er ens. Baseret på de gældende formler beregnes og sammenlignes visse værdier med standardværdierne, og den antagede nullhypotese accepteres eller afvises i overensstemmelse hermed.

Hvis nulhypotesen er kvalificeret til at blive afvist, indikerer det, at dataflæsningen er stærk og ikke er tilfældigvis. T-testen er kun en af mange test, der bruges til dette formål. Statistikere skal desuden bruge andre test end t-testen til at undersøge flere variabler og test med større prøvestørrelser. For en stor prøvestørrelse bruger statistikere en z-test. Andre testmuligheder inkluderer chi-square-testen og f-testen.

Der er tre typer t-tests, og de kategoriseres som afhængige og uafhængige t-tests.

Key takeaways

En t-test er en type inferentiel statistik, der bruges til at bestemme, om der er en signifikant forskel mellem midlerne til to grupper, som kan være relateret til visse funktioner.
T-testen er en af mange test, der bruges til formålet med hypotesetest i statistikker.
Beregning af en t-test kræver tre nøgledataværdier. De inkluderer forskellen mellem middelværdierne fra hvert datasæt (kaldet middelforskellen), standardafvigelsen for hver gruppe og antallet af dataværdier i hver gruppe.
Der er flere forskellige typer t-test, der kan udføres afhængigt af de data og den nødvendige analysetype.

Tvetydige testresultater

Overvej, at en lægemiddelproducent ønsker at teste en nyopfundet medicin. Det følger standardproceduren for at prøve medikamentet på en gruppe patienter og give en placebo til en anden gruppe, kaldet kontrolgruppen. Placeboen, der blev givet til kontrolgruppen, er et stof uden tilsigtet terapeutisk værdi og fungerer som et benchmark til at måle, hvordan den anden gruppe, der får det egentlige lægemiddel, reagerer.

Efter medikamentforsøget rapporterede medlemmerne af den placebo-fodrede kontrolgruppe en stigning i den gennemsnitlige levealder på tre år, mens medlemmerne af gruppen, der får ordineret det nye lægemiddel, rapporterer en stigning i den gennemsnitlige levealder på fire år. Øjeblikkelig observation kan indikere, at stoffet faktisk fungerer, da resultaterne er bedre for gruppen, der bruger stoffet. Det er dog også muligt, at observationen kan skyldes en tilfældig forekomst, især et overraskende stykke held. En t-test er nyttig til at konkludere, om resultaterne faktisk er korrekte og gælder for hele befolkningen.

I en skole scorede 100 studerende i klasse A i gennemsnit 85% med en standardafvigelse på 3%. Yderligere 100 studerende, der tilhørte klasse B, scorede i gennemsnit 87% med en standardafvigelse på 4%. Mens gennemsnittet af klasse B er bedre end klasse A, er det måske ikke korrekt at hoppe til den konklusion, at elevernes samlede præstation er bedre end eleverne i klasse A. Dette skyldes, sammen med middelafvigelsen for klasse B er også højere end for klasse A. Det indikerer, at deres ekstreme procentdele på lavere og højere sider var meget mere spredt sammenlignet med klasse A. En t-test kan hjælpe med at bestemme hvilken klasse klarede sig bedre.

T-test antagelser

Den første antagelse vedrørende t-tests vedrører målestokken. Antagelsen for en t-test er, at måleskalaen, der anvendes på de indsamlede data, følger en kontinuerlig eller ordinær skala, såsom scoringerne for en IQ-test.
Den anden antagelse er, at for en simpel tilfældig prøve, at dataene indsamles fra en repræsentativ, tilfældigt valgt del af den samlede befolkning.
Den tredje antagelse er dataene, når de er afbildet, resulterer i en normal fordeling, klokkeformet distributionskurve.
Den fjerde antagelse er en rimelig stor stikprøvestørrelse. Større prøvestørrelse betyder, at fordelingen af resultaterne skal nærme sig en normal klokkeformet kurve.
Den sidste antagelse er homogeniteten af varians. Homogen eller lige varians findes, når standardafvigelserne for prøver er omtrent lige store.

Beregning af T-test

Beregning af en t-test kræver tre nøgledataværdier. De inkluderer forskellen mellem middelværdierne fra hvert datasæt (kaldet middelforskellen), standardafvigelsen for hver gruppe og antallet af dataværdier i hver gruppe.

Resultatet af t-testen producerer t-værdien. Denne beregnede t-værdi sammenlignes derefter med en værdi opnået fra en kritisk værdistabel (kaldet T-distributionstabellen). Denne sammenligning hjælper med at bestemme, hvor sandsynligt forskellen mellem midlerne opstod ved en tilfældighed, eller om datasættene virkelig har indre forskelle. T-testen stiller spørgsmålstegn ved, om forskellen mellem grupperne repræsenterer en reel forskel i undersøgelsen, eller om det sandsynligvis er en meningsløs statistisk forskel.

T-distributionstabeller

T-distributionstabellen er tilgængelig i formater med en hale og to hale. Førstnævnte anvendes til vurdering af sager, der har en fast værdi eller interval med en klar retning (positiv eller negativ). For eksempel, hvad er sandsynligheden for, at outputværdien forbliver under -3, eller bliver mere end syv, når du ruller et par terninger? Sidstnævnte bruges til rækkevidde-analyse, såsom at spørge, om koordinaterne falder mellem -2 og +2.

Beregningerne kan udføres med standardprogrammer, der understøtter de nødvendige statistiske funktioner, ligesom dem, der findes i MS Excel.

T-værdier og frihedsgrader

T-testen producerer to værdier som dens output: t-værdi og frihedsgrader. T-værdien er et forhold mellem forskellen mellem gennemsnittet af de to prøvesæt og forskellen, der findes inden i prøvesættet. Mens tællerværdien (forskellen mellem middelværdien af de to prøvesæt) er let at beregne, kan nævneren (forskellen, der findes inden i prøvesættet) blive lidt kompliceret afhængigt af typen af involverede dataværdier. Nævneren af forholdet er en måling af spredning eller variation. Højere værdier af t-værdien, også kaldet t-score, indikerer, at der er en stor forskel mellem de to prøvesæt. Jo mindre t-værdi, desto mere lighed findes der mellem de to prøvesæt.

En stor t-score indikerer, at grupperne er forskellige.
En lille t-score indikerer, at grupperne er ens.

Grader af frihed henviser til værdierne i en undersøgelse, der har friheden til at variere og er essentielle for at vurdere vigtigheden og gyldigheden af nulhypotesen. Beregning af disse værdier afhænger normalt af antallet af dataposter, der er tilgængelige i prøvesættet.

Korreleret (eller parret) T-test

Den korrelerede t-test udføres, når prøverne typisk består af matchede par af lignende enheder, eller når der er tilfælde af gentagne mål. F.eks. Kan der være tilfælde af, at de samme patienter testes gentagne gange - før og efter at have modtaget en bestemt behandling. I sådanne tilfælde bruges hver patient som en kontrolprøve mod sig selv.

Denne metode gælder også for tilfælde, hvor prøverne er relateret på en eller anden måde eller har matchende egenskaber, såsom en komparativ analyse, der involverer børn, forældre eller søskende. Korrelerede eller parrede t-tests er af en afhængig type, da disse involverer tilfælde, hvor de to sæt prøver er relateret.

Formlen til beregning af t-værdien og frihedsgrader for en parret t-test er:

Gennemsnit1 og middelværdi er gennemsnitsværdierne for hvert prøvesæt, medens var1 og var2 repræsenterer variansen for hvert prøvesæt.

De resterende to typer hører til de uafhængige t-tests. Prøverne af disse typer vælges uafhængigt af hinanden - dvs. datasættene i de to grupper henviser ikke til de samme værdier. De inkluderer sager som en gruppe på 100 patienter, der opdeles i to sæt med 50 patienter hver. En af grupperne bliver kontrolgruppen og får en placebo, mens den anden gruppe får den ordinerede behandling. Dette udgør to uafhængige stikprøvegrupper, som er uparrede med hinanden.

Ligevariant (eller samlet) T-test

Den samme varians-t-test bruges, når antallet af prøver i hver gruppe er det samme, eller variansen af de to datasæt er den samme. Følgende formel bruges til beregning af t-værdi og frihedsgrader for samme varians-t-test:

T-værdi = middel1 − middel2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 hvor: middel1 og middelværdi2 = Gennemsnitsværdier for hver af prøven sætvar1 og var2 = Variation af hver af sample setsn1 og n2 = Antal poster i hvert prøvesæt \ begynde {justeret} & \ tekst {T-værdi} = \ frac {middel1 - middel2} {\ sqrt {\ frac {(n1 - 1) \ gange var1 ^ 2 + (n2 - 1) \ gange var2 ^ 2} {n1 + n2 - 2}} \ gange \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { hvor:} \\ & mean1 \ text {og} mean2 = \ text {Gennemsnitsværdier for hver} \\ & \ text {i prøvesættene} \\ & var1 \ text {og} var2 = \ text {Variance for hver af prøvesæt} \\ & n1 \ tekst {og} n2 = \ tekst {Antal poster i hvert prøvesæt} \\ \ end {alignet} T-værdi = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 middel1 − middel2 hvor: middel1 og middelværdi2 = Gennemsnitsværdier for hver prøvesætvar1 og var2 = Variation af hvert prøvesætn1 og n2 = Antal poster i hver prøve sæt

og,

Degrees of Freedom = n1 + n2−2where: n1 og n2 = Antal poster i hvert prøvesæt \ begynde {justeret} & \ tekst {Degrees of Freedom} = n1 + n2 - 2 \\ & \ textbf {hvor:} \\ & n1 \ tekst {og} n2 = \ tekst {Antal poster i hvert prøvesæt} \\ \ end {alignet} Grad of Freedom = n1 + n2−2where: n1 og n2 = Antal poster i hvert prøvesæt

Ujævn variation T-test

Den ulige varians t-test bruges, når antallet af prøver i hver gruppe er forskelligt, og variansen af de to datasæt er også forskellig. Denne test kaldes også Welchs t-test. Følgende formel bruges til beregning af t-værdi og frihedsgrader til en ulig varians-t-test:

T-værdi = middel1 − middel2var12n1 + var22n2 hvor: middel1 og middelværdi = Gennemsnitsværdier for hver prøvesætvar1 og var2 = Variation af hvert prøvesæt n1 og n2 = Antal poster i hvert prøvesæt \ begynde {justert} & \ tekst {T-værdi} = \ frac {mean1 - middel2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {hvor:} \ \ & mean1 \ text {og} mean2 = \ text {Gennemsnitsværdier for hver} \\ & \ text {i prøvesættene} \\ & var1 \ text {og} var2 = \ text {Variance for hvert prøvesæt} \ \ & n1 \ tekst {og} n2 = \ tekst {Antal poster i hvert prøvesæt} \\ \ end {alignet} T-værdi = n1var12 + n2var22 middel1 − middel2 hvor: middel1 og middelværdi2 = Gennemsnitlige værdier af hver prøvesætvar1 og var2 = Variation af hvert prøvesæt n1 og n2 = Antal poster i hvert prøvesæt

og,

Frihedsgrader = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1 hvor: var1 og var2 = Variation af hvert prøvesæt n1 og n2 = Antal poster i hvert prøvesæt \ begynde {justeret } & \ text {Degrees of Freedom} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ højre) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ højre) ^ 2} {n1 - 1} + \ frac {\ venstre (\ frac {var2 ^ 2} {n2} \ højre) ^ 2} {n2 - 1}} \\ & \ textbf {hvor:} \\ & var1 \ text {og} var2 = \ text {Varians af hvert prøvesæt} \\ & n1 \ tekst {og} n2 = \ tekst {Antal poster i hvert prøvesæt } \\ \ end {alignet} Grad of Freedom = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 hvor: var1 og var2 = Variation af hver af prøvesætn1 og n2 = Antal poster i hvert prøvesæt

Bestemmelse af den korrekte T-test, der skal bruges

Følgende flowdiagram kan bruges til at bestemme, hvilken t-test der skal bruges på baggrund af prøvesættets karakteristika. De vigtigste elementer, der skal overvejes, inkluderer, om eksempelposterne er ens, antallet af dataposter i hvert prøvesæt og variansen for hvert prøvesæt.

Billede af Julie Bang © Investopedia 2019

Unormal variation T-testeksempel

Antag, at vi foretager en diagonal måling af malerier modtaget i et kunstgalleri. Den ene gruppe prøver inkluderer 10 malerier, mens den anden indeholder 20 malerier. Datasættene med de tilsvarende gennemsnit og variansværdier er som følger:

	Sæt 1	Sæt 2
	19, 7	28.3
	20, 4	26.7
	19.6	20, 1
	17, 8	23, 3
	18.5	25.2
	18.9	22.1
	18.3	17, 7
	18.9	27.6
	19.5	20, 6
	21.95	13.7
		23.2
		17.5
		20, 6
		18
		23, 9
		21, 6
		24.3
		20, 4
		23, 9
		13.3
Betyde	19.4	21, 6
varians	1.4	17.1

Selvom gennemsnittet for Sæt 2 er højere end det for Sæt 1, kan vi ikke konkludere, at alle malerier har en gennemsnitlig længde på omkring 21, 6 enheder, da variationen af Sæt 2 er væsentligt højere end Sæt 1. Er dette tilfældigt, eller eksisterer der forskelle virkelig? i den samlede befolkning af alle malerier, der er modtaget i kunstgalleriet ">

Da antallet af dataposter er forskelligt (n1 = 10 og n2 = 20), og variansen også er forskellig, beregnes t-værdien og frihedsgraderne for ovennævnte datasæt ved hjælp af formlen, der er nævnt i T-test med uafhængig variation afsnit.

T-værdien er -2.24787. Da minus-tegnet kan ignoreres, når man sammenligner de to t-værdier, er den beregnede værdi 2.24787.

Graden af frihedsværdi er 24, 38 og reduceres til 24 på grund af formeldefinitionen, der kræver afrunding af værdien til den mindst mulige heltalværdi.

Hver gang der antages en normal fordeling, kan man specificere et sandsynlighedsniveau (alfa-niveau, niveau af betydning, p ) som et kriterium for accept. I de fleste tilfælde kan en 5% -værdi antages.

Ved hjælp af graden af frihedsværdi som 24 og et 5% -niveau af betydning giver et kig på t-værdifordelingstabellen en værdi på 2.064. Sammenligning af denne værdi med den beregnede værdi på 2.247 indikerer, at den beregnede t-værdi er større end tabelværdien ved et signifikansniveau på 5%. Derfor er det sikkert at afvise nulhypotesen om, at der ikke er nogen forskel mellem midler. Befolkningssættet har iboende forskelle, og de er ikke tilfældigt.

Sammenlign Navn på udbydere af investeringskonti Beskrivelse Annoncørens viden × De tilbud, der vises i denne tabel, er fra partnerskaber, hvorfra Investopedia modtager kompensation.

Relaterede vilkår

Sådan fungerer analyse af variation (ANOVA) Variansanalyse (ANOVA) er et statistisk analyseværktøj, der adskiller den samlede variation, der findes i et datasæt, i to komponenter: tilfældige og systematiske faktorer. mere Forståelse af T-distribution AT-distribution er en type sandsynlighedsfunktion, der er passende til at estimere populationsparametre for små prøvestørrelser eller ukendte afvigelser. mere Degrees of Freedom Definition Degrees of Freedom refererer til det maksimale antal logisk uafhængige værdier, som er værdier, der har frihed til at variere, i dataprøven. mere Sådan fungerer den resterende standardafvigelse Den resterende standardafvigelse er et statistisk udtryk, der bruges til at beskrive forskellen i standardafvigelser af observerede værdier kontra forudsagte værdier som vist ved punkter i en regressionsanalyse. mere Sådan fungerer Chi-kvadratstatistikken En chi-kvadrat (χ2) -statistik er en test, der måler, hvordan forventningerne sammenlignes med faktiske observerede data (eller modelresultater). De data, der bruges til beregning af en chi-kvadratstatistik, skal være tilfældige, rå, gensidigt eksklusive, trukket fra uafhængige variabler og trukket fra en stor nok prøve. mere Sådan bruges Wilcoxon-testen Wilcoxon-testen, der refererer til enten Rank Sum-testen eller Signed Rank-testen, er en ikke-parametrisk test, der sammenligner to parrede grupper. flere Partner Links

← Reverse / Forward Stock Split

Spilteori og forretning →

Anbefalet

Efterlad Din Kommentar