Effektstørrelse

Der kendes ca. 50 til 100 forskellige målinger af effektstørrelse. Mange effektstørrelser af forskellige typer kan konverteres til andre typer, da mange estimerer adskillelsen af to distributioner, så det er matematisk relateret. For eksempel kan en korrelationskoefficient konverteres til en Cohen “sd og omvendt.

Korrelationsfamilie: Effektstørrelser baseret på” forklaret varians “Rediger

Disse effektstørrelser estimerer mængden af variansen inden for et eksperiment, der er “forklaret” eller “redegjort for” ved hjælp af eksperimentets model (Forklaret variation).

Pearson r eller korrelationskoefficient Rediger

Pearson’s korrelation , ofte betegnet r og introduceret af Karl Pearson, bruges i vid udstrækning som en effektstørrelse, når parrede kvantitative data er tilgængelige; for eksempel hvis man studerede sammenhængen mellem fødselsvægt og levetid. Korrelationskoefficienten kan også bruges, når dataene er binære . Pearson “sr kan variere i størrelsesorden fra -1 til 1, hvor -1 indikerer et perfekt negativt lineært forhold, 1 indikerer et perfekt positivt lineært forhold og 0 indikerer ingen lineær relation mellem to variabler. Cohen giver følgende retningslinjer for samfundsvidenskaben:

Effektstørrelse r
Lille 0,10
Medium 0,30
Stor 0,50
Bestemmelseskoefficient (r2 eller R2) Rediger

En relateret effektstørrelse er r2, bestemmelseskoefficienten (også kaldet R2 eller “r-kvadrat”), beregnet som firkanten af Pearson-korrelationen r. I tilfælde af parrede data er dette et mål for andelen af varians, der deles af de to variabler, og varierer fra 0 til 1. For eksempel med en r på 0,21 er bestemmelseskoefficienten 0,0441, hvilket betyder at 4,4% af variansen for hver variabel deles med den anden variabel. R2 er altid positiv, så formidler ikke retningen af korrelationen mellem de to variabler.

Eta-kvadrat (η2) Rediger

Eta-kvadrat beskriver det forklarede variansforhold i den afhængige variabel af en forudsigelse, mens den kontrollerer for andre forudsigere, hvilket gør den analog med r2. Eta-kvadrat er en forudindtaget estimator for variansen forklaret af modellen i populationen (den estimerer kun effektstørrelsen i prøven). Dette skøn deler svagheden med r2, at hver yderligere variabel automatisk øger værdien af η2. Derudover måler den den forklarede varians af prøven, ikke populationen, hvilket betyder, at den altid vil overvurdere effektstørrelsen, skønt bias bliver mindre, når prøven bliver større.

η 2 = S S Behandling S S I alt. {\ displaystyle \ eta ^ {2} = {\ frac {SS _ {\ text {Treatment}}} {SS _ {\ text {Total}}}}.}

Omega-kvadrat (ω2) Rediger
Se også: Justeret R2

En mindre forudindtaget estimator for variansen, der er forklaret i populationen, er ω2

ω 2 = SS-behandling – df-behandling ⋅ MS-fejl SS-total + MS-fejl. {\ displaystyle \ omega ^ {2} = {\ frac {{\ text {SS}} _ {\ text {treatment}} – df _ {\ text {treatment}} \ cdot {\ text {MS}} _ {\ tekst {error}}} {{\ text {SS}} _ {\ text {total}} + {\ text {MS}} _ {\ text {error}}}}.}

Denne formular med formlen er begrænset til analyse mellem forsøgspersoner med lige stikprøvestørrelser i alle celler. Da det er mindre partisk (selvom det ikke er upartisk), foretrækkes ω2 frem for η2; det kan dog være mere besværligt at beregne for komplekse analyser. En generaliseret form af estimatoren er blevet offentliggjort til analyse mellem forsøgspersoner og indenfor forsøgspersoner, gentaget mål, blandet design og randomiserede blokdesigneksperimenter. Derudover er metoder til beregning af delvis ω2 for individuelle faktorer og kombinerede faktorer i designs med op til tre uafhængige variabler blevet offentliggjort.

Cohen “s ƒ2Edit

Cohen” s ƒ2 er en af flere effektstørrelsesmål, der skal bruges i forbindelse med en F-test til ANOVA eller multipel regression. Dens størrelse af bias (overestimering af effektstørrelsen for ANOVA) afhænger af bias af dens underliggende forklarede variansmåling (fx R2, η2, ω2).

ƒ2-effektstørrelsesmål for multipel regression er defineret som:

f 2 = R 2 1 – R 2 {\ displaystyle f ^ {2} = {R ^ {2} \ over 1-R ^ {2}}} hvor R2 er den kvadratiske multiple korrelation .

Ligeledes kan ƒ2 defineres som:

f 2 = η 2 1 – η 2 {\ displaystyle f ^ {2} = {\ eta ^ {2} \ over 1- \ eta ^ {2} }} eller f 2 = ω 2 1 – ω 2 {\ displaystyle f ^ {2} = {\ omega ^ {2} \ over 1- \ omega ^ {2}}} til modeller beskrevet af disse effektstørrelsesmål.

F 2 {\ displaystyle f ^ {2}} – effektstørrelsesmål for sekventiel multipel regression og også almindeligt for PLS-modellering er defineret som:

f 2 = RAB 2 – RA 2 1 – RAB 2 {\ displaystyle f ^ {2} = {R_ {AB} ^ {2} -R_ {A} ^ {2} \ over 1-R_ {AB} ^ {2}}} hvor R2A er den varians, der tegnes af et sæt en eller flere uafhængige variabler A og R2AB er den kombinerede varians, der tages højde for A og et andet sæt af en eller flere uafhængige variabler af interesse B. Efter konvention er ƒ2 effektstørrelser på 0,1 2 {\ displaystyle 0,1 ^ {2}}, 0,25 2 {\ displaystyle 0.25 ^ {2}} og 0.4 2 {\ displaystyle 0.4 ^ {2}} betegnes henholdsvis små, mellemstore og store.

Cohen “sf ^ {\ displaystyle {\ hat {f}}} kan også findes til faktoriel analyse af varians (ANOVA), der arbejder baglæns ved hjælp af:

f ^ effekt = (F effekt df effekt / N ). {\ displaystyle {\ hat {f}} _ {\ text {effect}} = {\ sqrt {(F _ {\ text {effect}} df _ {\ text {effect}} / N)}}.}

I et afbalanceret design (ækvivalente prøvestørrelser på tværs af grupper) af ANOVA er den tilsvarende populationsparameter for f 2 {\ displaystyle f ^ {2}}

SS (μ 1, μ 2,…, μ K) K × σ 2, {\ displaystyle {SS (\ mu _ {1}, \ mu _ {2}, \ prikker, \ mu _ {K})} \ over {K \ gange \ sigma ^ {2}}, }

hvor μj betegner populationens middelværdi inden for jth-gruppen af de samlede K-grupper, og σ den ækvivalente populationsstandardafvigelse inden for hver gruppe. SS er summen af firkanter i ANOVA.

Cohen “s qEdit

Et andet mål, der bruges med korrelationsforskelle, er Cohens q. Dette er forskellen mellem to Fisher-transformerede Pearson-regressionskoefficienter. I symboler er dette

q = 1 2 log ⁡ 1 + r 1 1 – r 1 – 1 2 log ⁡ 1 + r 2 1 – r 2 {\ displaystyle q = {\ frac {1} {2}} \ log {\ frac {1 + r_ {1}} {1-r_ {1}}} – {\ frac {1} {2} } \ log {\ frac {1 + r_ {2}} {1-r_ {2}}}}

hvor r1 og r2 er de regressioner, der sammenlignes. Den forventede værdi af q er nul, og dens varians er

var ⁡ (q) = 1 N 1 – 3 + 1 N 2 – 3 {\ displaystyle \ operatorname {var} (q) = {\ frac {1} {N_ {1} -3}} + {\ frac {1} {N_ {2} -3}}}

hvor N1 og N2 er antallet af datapunkter i henholdsvis den første og anden regression.

Forskellefamilie: Effektstørrelser baseret på forskelle mellem middel Rediger

Plotter af gaussiske tætheder, der illustrerer forskellige værdier af Cohen’s d.

En (populations) effektstørrelse θ baseret på middel betragter normalt den standardiserede gennemsnitlige forskel mellem to populationer: 78

θ = μ 1 – μ 2 σ, {\ displaystyle \ theta = {\ frac {\ mu _ {1} – \ mu _ {2}} {\ sigma}},}

hvor μ1 er gennemsnittet for en population, μ2 er middelværdien for den anden population, og σ er en standardafvigelse baseret på den ene eller begge populationer.

I den praktiske indstilling er populationsværdierne typisk ikke kendte og skal estimeres ud fra stikprøvestatistikker. ns af effektstørrelser baseret på gennemsnit adskiller sig med hensyn til hvilken statistik der anvendes.

Denne form for effektstørrelsen ligner beregningen for en t-teststatistik med den kritiske forskel, som t-teststatistikken inkluderer en faktor n {\ displaystyle {\ sqrt {n}}}. Dette betyder, at signifikansniveauet for en given effektstørrelse øges med prøveens størrelse. I modsætning til t-teststatistikken sigter effektstørrelsen mod at estimere en populationsparameter og påvirkes ikke af stikprøvestørrelsen.

Cohen “sd Edit

Cohen” sd er defineret som forskel mellem to midler divideret med en standardafvigelse for dataene, dvs.

d = x ¯ 1 – x ¯ 2 s = μ 1 – μ 2 s. {\ displaystyle d = {\ frac {{\ bar {x}} _ {1} – {\ bar {x}} _ {2}} {s}} = {\ frac {\ mu _ {1} – \ mu _ {2}} {s}}.}

Jacob Cohen definerede s, den samlede standardafvigelse, som (for to uafhængige prøver) :: 67

s = (n 1 – 1) s 1 2 + (n 2 – 1) s 2 2 n 1 + n 2 – 2 {\ displaystyle s = {\ sqrt {\ frac {(n_ {1} -1) s_ {1} ^ {2} + (n_ {2 } -1) s_ {2} ^ {2}} {n_ {1} + n_ {2} -2}}}

hvor variansen for en af grupperne er defineret som

s 1 2 = 1 n 1 – 1 ∑ i = 1 n 1 (x 1, i – x ¯ 1) 2, {\ displaystyle s_ {1} ^ {2} = {\ frac {1} {n_ {1} -1} } \ sum _ {i = 1} ^ {n_ {1}} (x_ {1, i} – {\ bar {x}} _ {1}) ^ {2},}

og lignende for de andre gruppe.

Tabellen nedenfor indeholder deskriptorer for størrelser af d = 0,01 til 2,0, som oprindeligt foreslået af Cohen og udvidet af Sawilowsky.

Effektstørrelse d Reference
Meget lille 0,01
Lille 0,20
Medium 0,50
Stor 0,80
Meget stor 1,20
Kæmpe 2.0

Andre forfattere vælger en lidt anden beregning af standardafvigelsen, når der henvises til “Cohen” sd “, hvor nævneren er uden” -2 “: 14

s = (n 1 – 1) s 1 2 + (n 2 – 1) s 2 2 n 1 + n 2 {\ displaystyle s = {\ sqrt {\ frac {(n_ {1} -1) s_ {1} ^ {2} + (n_ {2} -1) s_ {2} ^ {2}} { n_ {1} + n_ {2}}}}

Denne definition af “Cohen” sd “kaldes den maksimale sandsynlighedsestimator af Hedges og Olkin, og den er relateret til Hedges” g ved en skaleringsfaktor (se nedenfor ).

Med to parrede prøver ser vi på fordelingen af forskelsscorerne. I så fald er s standardafvigelsen for denne fordeling af forskelsscorerne. Dette skaber følgende forhold mellem t-statistikken for at teste for en forskel i middelværdien af de to grupper og Cohen “sd:

t = X ¯ 1 – X ¯ 2 SE = X ¯ 1 – X ¯ 2 SD N = N (X ¯ 1 – X ¯ 2) SD {\ displaystyle t = {\ frac {{\ bar {X}} _ {1} – {\ bar {X}} _ {2}} {\ text {SE}}} = {\ frac {{ \ bar {X}} _ {1} – {\ bar {X}} _ {2}} {\ frac {\ text {SD}} {\ sqrt {N}}}} = {\ frac {{\ sqrt {N}} ({ \ bar {X}} _ {1} – {\ bar {X}} _ {2})} {SD}}}

og

d = X ¯ 1 – X ¯ 2 SD = t N {\ displaystyle d = {\ frac {{\ bar {X}} _ {1} – {\ bar {X}} _ {2}} {\ text {SD}}} = {\ frac {t} {\ sqrt {N}}}}

Cohen “sd bruges ofte til at estimere stikprøvestørrelser til statistisk test. En lavere Cohen “sd indikerer nødvendigheden af større stikprøvestørrelser og omvendt, som efterfølgende kan bestemmes sammen med de yderligere parametre for ønsket signifikansniveau og statistisk effekt.

Glas” ΔEdit

I 1976 foreslog Gene V. Glass en estimator af effektstørrelsen, der kun bruger standardafvigelsen for den anden gruppe: 78

Δ = x ¯ 1 – x ¯ 2 s 2 {\ displaystyle \ Delta = { \ frac {{\ bar {x}} _ {1} – {\ bar {x}} _ {2}} {s_ {2}}}}

Den anden gruppe kan betragtes som en kontrolgruppe, og Glass hævdede, at hvis flere behandlinger blev sammenlignet med kontrolgruppen, ville det være bedre kun at bruge standardafvigelsen beregnet fra kontrolgruppen, så effektstørrelser ikke ville adskille sig under lige store midler og forskellige afvigelser.

en korrekt antagelse om lige befolkningsvariationer et samlet skøn for σ er mere præcist.

Hedges “gEdit

Hedges” g, foreslået af Larry Hedges i 1981, er som de andre baserede målinger på en standardiseret di fference: 79

g = x ¯ 1 – x ¯ 2 s ∗ {\ displaystyle g = {\ frac {{\ bar {x}} _ {1} – {\ bar {x}} _ {2} } {s ^ {*}}}}

hvor den samlede standardafvigelse s ∗ {\ displaystyle s ^ {*}} beregnes som:

s ∗ = (n 1 – 1) s 1 2 + (n 2 – 1) s 2 2 n 1 + n 2 – 2. {\ displaystyle s ^ {*} = {\ sqrt {\ frac {(n_ {1} -1) s_ {1} ^ {2} + (n_ {2} -1) s_ {2} ^ {2}} {n_ {1} + n_ {2} -2}}}.}

Men som en estimator for populationseffektstørrelsen b er den partisk. Ikke desto mindre kan denne bias korrigeres omtrent ved multiplikation med en faktor

g ∗ = J (n 1 + n 2 – 2) g ≈ (1 – 3 4 (n 1 + n 2) – 9) g {\ displaystyle g ^ {*} = J (n_ {1} + n_ {2} -2) \, \, g \, \ approx \, \ left (1 – {\ frac {3} {4 (n_ {1} + n_ {2}) – 9}} \ right) \, \, g} J (a) = Γ (a / 2) a / 2 Γ ((a – 1) / 2). {\ displaystyle J (a) = {\ frac {\ Gamma (a / 2)} {{\ sqrt {a / 2 \,}} \, \ Gamma ((a-1) / 2)}}.}

Ψ, rod-middel-kvadrat standardiseret effekt Rediger

En lignende effektstørrelsesestimator til flere sammenligninger (f.eks. ANOVA) er den standardiserede effekt på rod-middel-kvadrat. Dette præsenterer i det væsentlige omnibusforskellen for hele modellen justeret af rodgennemsnittet, analogt med d eller g. Den enkleste formel for Ψ, der passer til envejs ANOVA, er

Ψ = 1 k – 1 ⋅ ∑ (x ¯ j – X ¯) 2 MS-fejl {\ displaystyle \ Psi = {\ sqrt {{\ frac {1} {k-1}} \ cdot {\ frac {\ sum ({\ bar {x}} _ {j} – {\ bar {X}}) ^ {2}} {MS _ {\ text {fejl }}}}}}}

Der er desuden leveret en generalisering til multifaktoriske designs.

Fordeling af effektstørrelser baseret på middelRediger

Fra fordelingen er det muligt at beregne forventning og varians for effektstørrelserne.

I nogle tilfælde anvendes store stikprøve tilnærmelser for variansen. Et forslag til variansen af Hedges “upartisk estimator er: 86

σ ^ 2 (g ∗) = n 1 + n 2 n 1 n 2 + (g ∗) 2 2 (n 1 + n 2). { \ displaystyle {\ hat {\ sigma}} ^ {2} (g ^ {*}) = {\ frac {n_ {1} + n_ {2}} {n_ {1} n_ {2}}} + {\ frac {(g ^ {*}) ^ {2}} {2 (n_ {1} + n_ {2})}}.}

Andre metricsRediger

Mahalanobis afstand (D) er en multivariat generalisering af Cohen “sd, som tager højde for forholdet mellem variablerne.

Kategorisk familie: Effektstørrelser for associering mellem kategoriske variabler Rediger

φ = χ 2 N {\ displaystyle \ varphi = {\ sqrt {\ frac {\ chi ^ {2}} {N}}}}

φ c = χ 2 N (k – 1) {\ displaystyle \ varphi _ {c} = {\ sqrt {\ frac {\ chi ^ {2}} {N (k-1)}}}}

Phi (φ) Cramér “s V (φc)

Almindeligt anvendte mål for associering til chi-kvadrat-testen er Phi-koefficienten og Cramér’s V (undertiden kaldet Cramér’s phi og betegnet som φc) Phi er relateret til den punkt-biseriale korrelationskoefficient og Cohen “sd og estimerer omfanget af forholdet mellem to variabler (2 × 2). Cramér’s V kan bruges med variabler, der har mere end to niveauer.

Phi kan beregnes ved at finde kvadratroden af chi-kvadratstatistikken divideret med stikprøvestørrelsen.

På samme måde beregnes Cramér’s V ved at tage kvadratroden af den chi-kvadratiske statistik divideret med stikprøvestørrelsen og længden af minimumsdimensionen (k er den mindste af antallet af rækker r eller kolonner c).

φc er interkorrelationen mellem de to diskrete variabler og kan beregnes for en hvilken som helst værdi på r eller c. Da chi-kvadratiske værdier har en tendens til at stige med antallet af celler, jo større forskellen mellem r og c er, jo mere sandsynligt vil V have tendens til 1 uden stærke tegn på en meningsfuld sammenhæng.

Cramér ” s V kan også anvendes til “godhed af pasform” chi-kvadrerede modeller (dvs. dem hvor c = 1). I dette tilfælde fungerer det som et mål for tendensen mod et enkelt resultat (dvs. ud af k-resultater). hvis man skal bruge r til k for at bevare 0 til 1-området for V. Ellers reducerer ligningen ligningen med Phi ved at bruge c.

Cohen’s wEdit

Et andet mål for effektstørrelse anvendt til chi-kvadratiske tests er Cohen’s w. Dette defineres som

w = ∑ i = 1 m (p 1 i – p 0 i) 2 p 0 i {\ displaystyle w = {\ sqrt {\ sum _ {i = 1} ^ {m} {\ frac {(p_ {1i} -p_ {0i}) ^ {2}} {p_ {0i}}}}}}

hvor p0i er værdien af ith-cellen under H0, p1i er værdien af ith-cellen under H1 og m er antallet af celler.

Effektstørrelse w
Lille 0,10
Medium 0,30
Large 0,50

Odds ratioEdit

Odds ratio (OR) er en anden nyttig effektstørrelse. Det er passende, når forskningsspørgsmålet fokuserer på graden af sammenhæng mellem to binære variabler. Overvej for eksempel en undersøgelse af staveevne. I en kontrolgruppe passerer to studerende klassen for enhver, der fejler, så oddsene for at bestå er to til en (eller 2/1 = 2). I behandlingsgruppen passerer seks studerende for hver, der fejler, så oddsene for at bestå er seks til en (eller 6/1 = 6). Effektstørrelsen kan beregnes ved at bemærke, at oddsene for at passere i behandlingsgruppen er tre gange højere end i kontrolgruppen (fordi 6 divideret med 2 er 3). Derfor er oddsforholdet 3. Odds ratio statistik er på en anden skala end Cohen “sd, så denne” 3 “kan ikke sammenlignes med en Cohen” sd på 3.

Relativ risikoRediger

Den relative risiko (RR), også kaldet risikoforhold, er simpelthen risikoen (sandsynligheden) for en begivenhed i forhold til en eller anden uafhængig variabel. Dette mål for effektstørrelse adskiller sig fra oddsforholdet, idet det sammenligner sandsynligheder i stedet for odds, men nærmer sig asymptotisk sidstnævnte for små sandsynligheder. Ved hjælp af eksemplet ovenfor er sandsynligheden for dem i kontrolgruppen og behandlingsgruppen, der passerer, henholdsvis 2/3 (eller 0,67) og 6/7 (eller 0,86). Effektstørrelsen kan beregnes på samme måde som ovenfor, men ved at bruge sandsynlighederne i stedet. Derfor er den relative risiko 1,28. Da der blev brugt temmelig store sandsynligheder for at passere, er der en stor forskel mellem relativ risiko og oddsforhold. Havde fiasko (mindre sandsynlighed) været brugt som begivenheden (i stedet for at passere), ville forskellen mellem de to mål for effektstørrelse ikke være så stor.

Selvom begge mål er nyttige, har de forskellige statistiske anvendelser. I medicinsk forskning bruges oddsforholdet almindeligvis til case-control undersøgelser, da odds, men ikke sandsynligheder, normalt estimeres. Relativ risiko bruges ofte i randomiserede kontrollerede forsøg og kohortestudier, men relativ risiko bidrager til overvurderinger af effektiviteten af interventioner.

Risikoforskel Rediger

Risikoforskellen (RD), undertiden kaldet absolut risikoreduktion, er simpelthen forskellen i risiko (sandsynlighed) for en begivenhed mellem to grupper. Det er et nyttigt mål i eksperimentel forskning, da RD fortæller dig, i hvilket omfang en eksperimentel intervention ændrer sandsynligheden for en begivenhed eller et resultat.Ved hjælp af eksemplet ovenfor er sandsynlighederne for dem i kontrolgruppen og behandlingsgruppen, der passerer, henholdsvis 2/3 (eller 0,67) og 6/7 (eller 0,86), og derfor er RD-effektstørrelsen 0,86 – 0,67 = 0,19 (eller 19%). RD er den overlegne foranstaltning til vurdering af effektiviteten af interventioner.

Cohen’s hEdit

Hovedartikel: Cohen “sh

Ét mål, der anvendes i effektanalyse ved sammenligning to uafhængige proportioner er Cohen “s h. Dette defineres som følger

h = 2 (arcsin ⁡ p 1 – buesin ⁡ p 2) {\ displaystyle h = 2 (\ arcsin {\ sqrt {p_ { 1}}} – \ arcsin {\ sqrt {p_ {2}}})}

hvor p1 og p2 er andelene af de to prøver, der sammenlignes, og arcsin er buesinetransformationen.

Effektstørrelse for fælles sprogEdit

For lettere at beskrive betydningen af en effektstørrelse for folk uden for statistik var den fælles sprogeffektstørrelse, som navnet antyder, designet til at kommunikere den på almindelig engelsk. Det bruges til at beskrive forskellen mellem to grupper og blev foreslået såvel som navngivet af Kenneth McGraw og SP Wong i 1992. De brugte følgende eksempel (om mænds og kvinders højder): “i enhver tilfældig parring af ung voksen mænd og kvinder, probabi lity af den mandlige, der er højere end kvinden, er .92, eller i enklere vendinger endnu, i 92 ud af 100 blinde datoer blandt unge voksne, vil hannen være højere end kvinden “, når man beskriver befolkningsværdien af den fælles sprogeffekt størrelse.

Befolkningsværdien for størrelsen af den fælles sprogeffekt rapporteres ofte på denne måde, udtrykt i par, der tilfældigt er valgt blandt befolkningen. Kerby (2014) bemærker, at et par, defineret som en score i en gruppe parret med en score i en anden gruppe, er et kernekoncept for den fælles sprogeffektstørrelse.

Som et andet eksempel, overvej en videnskabelig undersøgelse (måske af en behandling for en eller anden kronisk sygdom, såsom gigt) med ti personer i behandlingsgruppen og ti personer i en kontrolgruppe. Hvis alle i behandlingsgruppen sammenlignes med alle i kontrolgruppen, så er der (10 × 10 =) 100 par. I slutningen af undersøgelsen vurderes resultatet til en score for hver enkelt person (for eksempel på en skala fra mobilitet og smerte, i tilfælde af en gigtundersøgelse), og derefter sammenlignes alle scoringer mellem parene. Resultatet, som procentdelen af par, der understøtter hypotesen, er den almindelige sprogeffektstørrelse. I eksempelstudiet kunne det være (lad os sige) .80, hvis 80 ud af 100 sammenligningspar viser et bedre resultat for behandlingsgruppen end kontrolgruppen, og rapporten kan lyde som følger: “Når en patient i behandlingsgruppen blev sammenlignet med en patient i kontrolgruppen, i 80 af 100 par viste den behandlede patient et bedre behandlingsresultat. “Prøveværdien, i for eksempel en undersøgelse som denne, er en upartisk estimator af populationsværdien.

Vargha og Delaney generaliserede den almindelige sprogeffektstørrelse (Vargha-Delaney A) for at dække ordinært niveau data.

Rank-biserial correlationEdit

Hovedartikel: Mann –Whitney U-test § Rank-biserial korrelation

En effektstørrelse relateret til den almindelige sprogeffektstørrelse er den rang-biseriale korrelation. Denne foranstaltning blev introduceret af Cureton som en effektstørrelse for Mann – Whitney U-testen Der er to grupper, og score for grupperne er blevet konverteret til rækker. Den enkle Kerby-formel beregner rang-tosær korrelation ud fra den fælles sprogeffektstørrelse. At lade f være den andel af par, der er gunstig for hypotesen (den almindelige sprogeffektstørrelse), og lade u være andelen af par, der ikke er gunstige, er den rang-tosidige r den enkle forskel mellem de to proportioner: r = f – u. Med andre ord er sammenhængen forskellen mellem den fælles sprogeffektstørrelse og dens komplement. For eksempel, hvis størrelsen af den fælles sprogeffekt er 60%, så er den rang-tosidige r lig med 60% minus 40% eller r = 0,20. Kerby-formlen er retningsbestemt, med positive værdier, der indikerer, at resultaterne understøtter hypotesen.

En ikke-retningsbestemt formel for den rang-tosærlige korrelation blev leveret af Wendt, således at korrelationen altid er positiv. Fordelen ved Wendt-formlen er, at den kan beregnes med information, der er let tilgængelig i offentliggjorte papirer. Formlen bruger kun testværdien af U fra Mann-Whitney U-testen og prøvestørrelserne for de to grupper: r = 1 – (2U) / (n1 n2). Bemærk, at U er defineret her i henhold til den klassiske definition som den mindste af de to U-værdier, der kan beregnes ud fra dataene. Dette sikrer, at 2U < n1n2, da n1n2 er den maksimale værdi af U-statistikken.

Et eksempel kan illustrere brugen af de to formler. Overvej en sundhedsundersøgelse af tyve ældre voksne, hvor ti er i behandlingsgruppen og ti i kontrolgruppen; der er derfor ti gange ti eller 100 par.Sundhedsprogrammet bruger kost, motion og kosttilskud til at forbedre hukommelsen, og hukommelsen måles ved en standardiseret test. En Mann-Whitney U-test viser, at den voksne i behandlingsgruppen havde den bedre hukommelse i 70 af de 100 par og den dårligere hukommelse i 30 par. Mann-Whitney U er den mindste på 70 og 30, så U = 30. Korrelationen mellem hukommelse og behandlingsydelse ved Kerbys simple forskelformel er r = (70/100) – (30/100) = 0,40. Korrelationen ved Wendt-formlen er r = 1 – (2 · 30) / (10 · 10) = 0,40.

Effektstørrelse for ordinaldata Rediger

Cliff’s delta eller d {\ displaystyle d}, oprindeligt udviklet af Norman Cliff til brug med ordinære data, er et mål for, hvor ofte værdierne i en distribution er større end værdierne i en anden distribution. Det er afgørende, at det ikke kræver nogen antagelser om formen eller spredning af de to distributioner.

Prøveestimatet d {\ displaystyle d} gives ved:

d = ∑ i, j – mn {\ displaystyle d = {\ frac {\ sum _ {i, j} -} {mn}}}

d {\ displaystyle d} er lineært relateret til Mann – Whitney U-statistikken; den fanger dog retningen af forskellen i sit tegn. Givet Mann – Whitney U {\ displaystyle U}, d {\ displaystyle d} er:

d = 2 U mn – 1 {\ displaystyle d = {\ frac {2U} {mn}} – 1}

Write a Comment

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *