Effektstørrelse (Norsk)

Cirka 50 til 100 forskjellige mål på effektstørrelse er kjent. Mange effektstørrelser av forskjellige typer kan konverteres til andre typer, ettersom mange estimerer separasjonen av to distribusjoner, så er matematisk relatert. For eksempel kan en korrelasjonskoeffisient konverteres til en Cohen «sd og omvendt.

Korrelasjonsfamilie: Effektstørrelser basert på» avvik forklart «Rediger

Disse effektstørrelsene estimerer mengden av variansen i et eksperiment som er «forklart» eller «redegjort for» av eksperimentets modell (Explained variation).

Pearson r eller korrelasjonskoeffisient Rediger

Pearson’s korrelasjon , ofte betegnet r og introdusert av Karl Pearson, brukes mye som en effektstørrelse når parede kvantitative data er tilgjengelige, for eksempel hvis man studerte sammenhengen mellom fødselsvekt og lang levetid. Korrelasjonskoeffisienten kan også brukes når dataene er binære . Pearson «sr kan variere i størrelse fra −1 til 1, med −1 som indikerer et perfekt negativt lineært forhold, 1 som indikerer et perfekt positivt lineært forhold, og 0 indikerer ingen lineær sammenheng mellom to variabler. Cohen gir følgende retningslinjer for samfunnsvitenskapene:

Effektstørrelse r
Lite 0,10
Medium 0,30
Stor 0,50
Bestemmelseskoeffisient (r2 eller R2) Rediger

En relatert effektstørrelse er r2, beregningskoeffisienten (også referert til som R2 eller «r-kvadrat») som kvadratet til Pearson-korrelasjonen r. Når det gjelder parede data, er dette et mål på andelen av varians som deles av de to variablene, og varierer fra 0 til 1. For eksempel, med en r på 0,21 er bestemmelseskoeffisienten 0,0441, noe som betyr at 4,4% av variansen til en variabel deles med den andre variabelen. R2 er alltid positiv, så formidler ikke retningen på korrelasjonen mellom de to variablene.

Eta-kvadrat (η2) Rediger

Eta-kvadrat beskriver det forklarte variansforholdet i den avhengige variabelen av en prediktor mens du kontrollerer for andre prediktorer, noe som gjør den analog med r2. Eta-kvadrat er en partisk estimator av variansen forklart av modellen i populasjonen (den estimerer bare effektstørrelsen i utvalget). Dette estimatet deler svakheten med r2 at hver ekstra variabel automatisk vil øke verdien av η2. I tillegg måler den variansen som er forklart av prøven, ikke populasjonen, noe som betyr at den alltid vil overvurdere effektstørrelsen, selv om skjevheten blir mindre etter hvert som prøven blir større.

η 2 = S S Behandling S S Total. {\ displaystyle \ eta ^ {2} = {\ frac {SS _ {\ text {Treatment}}} {SS _ {\ text {Total}}}}.}

Omega-kvadrat (ω2) Rediger
Se også: Justert R2

En mindre partisk estimator av variansen forklart i populasjonen er is2

ω 2 = SS-behandling – df-behandling ⋅ MS-feil SS total + MS-feil. {\ displaystyle \ omega ^ {2} = {\ frac {{\ text {SS}} _ {\ text {treatment}} – df _ {\ text {treatment}} \ cdot {\ text {MS}} _ {\ tekst {error}}} {{\ text {SS}} _ {\ text {total}} + {\ text {MS}} _ {\ text {error}}}}.}

Denne formen for formelen er begrenset til mellompersonsanalyse med like utvalgstørrelser i alle celler. Siden det er mindre partisk (selv om det ikke er objektivt), er ω2 å foretrekke fremfor η2; det kan imidlertid være mer upraktisk å beregne for komplekse analyser. En generalisert form av estimatoren er publisert for analyse mellom forsøkspersoner og innen-forsøkspersoner, gjentatt mål, blandet design og randomiserte blokkdesigneksperimenter. I tillegg er metoder for å beregne delvis ω2 for individuelle faktorer og kombinerte faktorer i design med opptil tre uavhengige variabler blitt publisert.

Cohen «s ƒ2Edit

Cohen» s ƒ2 er en av flere effektstørrelsesmål som skal brukes i sammenheng med en F-test for ANOVA eller multippel regresjon. Mengden av forspenning (overestimering av effektstørrelsen for ANOVA) avhenger av forspenningen til den underliggende forklaringen av variansen (f.eks. R2, η2, ω2). er definert som:

f 2 = R 2 1 – R 2 {\ displaystyle f ^ {2} = {R ^ {2} \ over 1-R ^ {2}}} hvor R2 er den kvadratiske multiple korrelasjonen .

På samme måte kan ƒ2 defineres som:

f 2 = η 2 1 – η 2 {\ displaystyle f ^ {2} = {\ eta ^ {2} \ over 1- \ eta ^ {2} }} eller f 2 = ω 2 1 – ω 2 {\ displaystyle f ^ {2} = {\ omega ^ {2} \ over 1- \ omega ^ {2}}} for modeller beskrevet av disse effektstørrelsesmålene.

F 2 {\ displaystyle f ^ {2}} effektstørrelsesmål for sekvensiell multippel regresjon og også vanlig for PLS-modellering er definert som:

f 2 = RAB 2 – RA 2 1 – RAB 2 {\ displaystyle f ^ {2} = {R_ {AB} ^ {2} -R_ {A} ^ {2} \ over 1-R_ {AB} ^ {2}}} hvor R2A er variansen som et sett med en eller flere uavhengige variabler A og R2AB er den kombinerte variansen A og et annet sett med en eller flere uavhengige variabler av interesse B. Etter konvensjonen er ƒ2 effektstørrelser på 0,1 2 {\ displaystyle 0,1 ^ {2}}, 0,25 2 {\ displaystyle 0.25 ^ {2}} og 0.4 2 {\ displaystyle 0.4 ^ {2}} betegnes henholdsvis små, mellomstore og store.

Cohen «sf ^ {\ displaystyle {\ hat {f}}} kan også bli funnet for faktoriell variansanalyse (ANOVA) som arbeider bakover, ved å bruke:

f ^ effekt = (F effekt df effekt / N {. \ displaystyle {\ hat {f}} _ {\ text {effect}} = {\ sqrt {(F _ {\ text {effect}} df _ {\ text {effect}} / N)}}.}

I et balansert design (ekvivalente utvalgstørrelser på tvers av grupper) av ANOVA, er den tilsvarende populasjonsparameteren for f 2 {\ displaystyle f ^ {2}}

SS (μ 1, μ 2,…, μ K) K × σ 2, {\ displaystyle {SS (\ mu _ {1}, \ mu _ {2}, \ dots, \ mu _ {K})} \ over {K \ times \ sigma ^ {2}}, }

hvor μj betegner populasjonsgjennomsnittet innen den jte gruppen av de totale K-gruppene, og σ ekvivalent populasjonsstandardavvik innenfor hver gruppe. SS er summen av kvadrater i ANOVA.

Cohen «s qEdit

Et annet mål som brukes med korrelasjonsforskjeller er Cohens q. Dette er forskjellen mellom to Fisher-transformerte Pearson regresjonskoeffisienter. I symboler er dette

q = 1 2 log ⁡ 1 + r 1 1 – r 1 – 1 2 log ⁡ 1 + r 2 1 – r 2 {\ displaystyle q = {\ frac {1} {2}} \ log {\ frac {1 + r_ {1}} {1-r_ {1}}} – {\ frac {1} {2} } \ log {\ frac {1 + r_ {2}} {1-r_ {2}}}}

der r1 og r2 er regresjonene som sammenlignes. Den forventede verdien av q er null og variansen er

var ⁡ (q) = 1 N 1 – 3 + 1 N 2 – 3 {\ displaystyle \ operatorname {var} (q) = {\ frac {1} {N_ {1} -3}} + {\ frac {1} {N_ {2} -3}}}

der N1 og N2 er antall datapunkter i henholdsvis første og andre regresjon.

Forskjell familie: Effektstørrelser basert på forskjeller mellom middel Rediger

Plott av gaussiske tettheter som illustrerer forskjellige verdier av Cohen’s d.

En (populasjons) effektstørrelse θ basert på gjennomsnitt vurderer vanligvis den standardiserte gjennomsnittsforskjellen mellom to populasjoner: 78

θ = μ 1 – μ 2 σ, {\ displaystyle \ theta = {\ frac {\ mu _ {1} – \ mu _ {2}} {\ sigma}},}

der μ1 er gjennomsnittet for en populasjon, μ2 er gjennomsnittet for den andre populasjonen, og σ er et standardavvik basert på den ene eller begge populasjonene.

I den praktiske innstillingen er populasjonsverdiene vanligvis ikke kjent og må estimeres fra utvalgstatistikk. Flere versio ns av effektstørrelser basert på gjennomsnitt varierer med hensyn til hvilken statistikk som brukes.

Dette skjemaet for effektstørrelsen ligner beregningen for en t-teststatistikk, med den kritiske forskjellen som t-teststatistikken inkluderer en faktor på n {\ displaystyle {\ sqrt {n}}}. Dette betyr at for en gitt effektstørrelse øker signifikansnivået med prøvestørrelsen. I motsetning til t-teststatistikken, har effektstørrelsen til hensikt å estimere en populasjonsparameter og påvirkes ikke av utvalgsstørrelsen.

Cohen «sd Edit

Cohen» sd er definert som forskjell mellom to midler delt på et standardavvik for dataene, dvs.

d = x ¯ 1 – x ¯ 2 s = μ 1 – μ 2 s. {\ displaystyle d = {\ frac {{\ bar {x}} _ {1} – {\ bar {x}} _ {2}} {s}} = {\ frac {\ mu _ {1} – \ mu _ {2}} {s}}.}

Jacob Cohen definerte s, den samlede standardavviket, som (for to uavhengige prøver) :: 67

s = (n 1 – 1) s 1 2 + (n 2 – 1) s 2 2 n 1 + n 2 – 2 {\ displaystyle s = {\ sqrt {\ frac {(n_ {1} -1) s_ {1} ^ {2} + (n_ {2 } -1) s_ {2} ^ {2}} {n_ {1} + n_ {2} -2}}}}

der variansen for en av gruppene er definert som

s 1 2 = 1 n 1 – 1 ∑ i = 1 n 1 (x 1, i – x ¯ 1) 2, {\ displaystyle s_ {1} ^ {2} = {\ frac {1} {n_ {1} -1} } \ sum _ {i = 1} ^ {n_ {1}} (x_ {1, i} – {\ bar {x}} _ {1}) ^ {2},}

og tilsvarende for den andre gruppe.

Tabellen nedenfor inneholder beskrivelser for størrelser på d = 0,01 til 2,0, som opprinnelig foreslått av Cohen og utvidet av Sawilowsky.

Effektstørrelse d Referanse
Veldig liten 0,01
Liten 0,20
Medium 0,50
Stor 0,80
Veldig stor 1,20
Stor 2.0

Andre forfattere velger en litt annen beregning av standardavviket når det refereres til «Cohen» sd «der nevneren er uten» -2 «: 14

s = (n 1 – 1) s 1 2 + (n 2 – 1) s 2 2 n 1 + n 2 {\ displaystyle s = {\ sqrt {\ frac {(n_ {1} -1) s_ {1} ^ {2} + (n_ {2} -1) s_ {2} ^ {2}} { n_ {1} + n_ {2}}}}

Denne definisjonen av «Cohen» sd «kalles den maksimale sannsynlighetsestimatoren av Hedges og Olkin, og den er relatert til Hedges» g av en skaleringsfaktor (se nedenfor ).

Med to sammenkoblede prøver ser vi på fordelingen av differansescore. I så fall er s standardavviket til denne fordelingen av differansescore. Dette skaper følgende forhold mellom t-statistikken for å teste for en forskjell i midlene til de to gruppene og Cohen «sd:

t = X ¯ 1 – X ¯ 2 SE = X ¯ 1 – X ¯ 2 SD N = N (X ¯ 1 – X ¯ 2) SD {\ displaystyle t = {\ frac {{\ bar {X}} _ {1} – {\ bar {X}} _ {2}} {\ text {SE}}} = {\ frac {{ \ bar {X}} _ {1} – {\ bar {X}} _ {2}} {\ frac {\ text {SD}} {\ sqrt {N}}}} = {\ frac {{\ sqrt {N}} ({ \ bar {X}} _ {1} – {\ bar {X}} _ {2})} {SD}}}

og

d = X ¯ 1 – X ¯ 2 SD = t N {\ displaystyle d = {\ frac {{\ bar {X}} _ {1} – {\ bar {X}} _ {2}} {\ text {SD}}} = {\ frac {t} {\ sqrt {N}}}}

Cohen «sd brukes ofte til å estimere prøvestørrelser for statistisk testing. En lavere Cohen «sd indikerer nødvendigheten av større prøvestørrelser, og omvendt, som senere kan bestemmes sammen med tilleggsparametrene for ønsket signifikansnivå og statistisk kraft.

Glass» ΔEdit

I 1976 foreslo Gene V. Glass en estimator av effektstørrelsen som bare bruker standardavviket til den andre gruppen: 78

Δ = x ¯ 1 – x ¯ 2 s 2 {\ displaystyle \ Delta = { \ frac {{\ bar {x}} _ {1} – {\ bar {x}} _ {2}} {s_ {2}}}}

Den andre gruppen kan betraktes som en kontrollgruppe, og Glass hevdet at hvis flere behandlinger ble sammenlignet med kontrollgruppen, ville det være bedre å bruke bare standardavvik beregnet fra kontrollgruppen, slik at effektstørrelser ikke ville være forskjellige under like gjennomsnitt og forskjellige avvik.

Under en riktig antagelse om like populasjonsvariasjoner et samlet estimat for σ er mer presist.

Hedges «gEdit

Hedges» g, foreslått av Larry Hedges i 1981, er som de andre tiltakene som er basert på en standardisert di fference: 79

g = x ¯ 1 – x ¯ 2 s ∗ {\ displaystyle g = {\ frac {{\ bar {x}} _ {1} – {\ bar {x}} _ {2} } {s ^ {*}}}}

der den samlede standardavviket s ∗ {\ displaystyle s ^ {*}} beregnes som:

s ∗ = (n 1 – 1) s 1 2 + (n 2 – 1) s 2 2 n 1 + n 2 – 2. {\ displaystyle s ^ {*} = {\ sqrt {\ frac {(n_ {1} -1) s_ {1} ^ {2} + (n_ {2} -1) s_ {2} ^ {2}} {n_ {1} + n_ {2} -2}}}.}

Som estimator for populasjonseffektstørrelsen θ er den partisk. Likevel kan denne skjevheten korrigeres omtrent ved å multiplisere med en faktor

g ∗ = J (n 1 + n 2 – 2) g ≈ (1 – 3 4 (n 1 + n 2) – 9) g {\ displaystyle g ^ {*} = J (n_ {1} + n_ {2} -2) \, \, g \, \ approx \, \ left (1 – {\ frac {3} {4 (n_ {1} + n_ {2}) – 9}} \ right) \, \, g} J (a) = Γ (a / 2) a / 2 Γ ((a – 1) / 2). {\ displaystyle J (a) = {\ frac {\ Gamma (a / 2)} {{\ sqrt {a / 2 \,}} \, \ Gamma ((a-1) / 2)}}.}

Ψ, root-mean-square standardized effectEdit

En lignende effektstørrelsesestimator for flere sammenligninger (f.eks. ANOVA) er Ψ root-mean-square standardisert effekt. Dette presenterer i hovedsak omnibusforskjellen for hele modellen justert av rotens middelkvadrat, analogt med d eller g. Den enkleste formelen for Ψ, egnet for enveis ANOVA, er

Ψ = 1 k – 1 ⋅ ∑ (x ¯ j – X ¯) 2 MS feil {\ displaystyle \ Psi = {\ sqrt {{\ frac {1} {k-1}} \ cdot {\ frac {\ sum ({\ bar {x}} _ {j} – {\ bar {X}}) ^ {2}} {MS _ {\ text {error }}}}}}}

I tillegg er det gitt en generalisering for flerfaktoriske design.

Distribusjon av effektstørrelser basert på middel Rediger

Fra fordelingen er det mulig å beregne forventningene og variansen til effektstørrelsene.

I noen tilfeller brukes store tilnærminger for variansen. Et forslag til variansen til Hedges «objektiv estimator er: 86

σ ^ 2 (g ∗) = n 1 + n 2 n 1 n 2 + (g ∗) 2 2 (n 1 + n 2). { \ displaystyle {\ hat {\ sigma}} ^ {2} (g ^ {*}) = {\ frac {n_ {1} + n_ {2}} {n_ {1} n_ {2}}} + {\ frac {(g ^ {*}) ^ {2}} {2 (n_ {1} + n_ {2})}}.}

Andre beregninger Rediger

Mahalanobis avstand (D) er en multivariat generalisering av Cohen «sd, som tar hensyn til forholdet mellom variablene.

Kategorisk familie: Effektstørrelser for assosiasjoner mellom kategoriske variabler Rediger

φ = χ 2 N {\ displaystyle \ varphi = {\ sqrt {\ frac {\ chi ^ {2}} {N}}}}

φ c = χ 2 N (k – 1) {\ displaystyle \ varphi _ {c} = {\ sqrt {\ frac {\ chi ^ {2}} {N (k-1)}}}}

Phi (φ) Cramér «s V (φc)

Vanlig forbundsmål for chi-kvadrat-testen er Phi-koeffisienten og Cramér’s V (noen ganger referert til som Cramérs phi og betegnet φc) . Phi er relatert til den punkt-biseriale korrelasjonskoeffisienten og Cohen «sd og estimerer omfanget av forholdet mellom to variabler (2 × 2). Cramér’s V kan brukes med variabler som har mer enn to nivåer.

Phi kan beregnes ved å finne kvadratroten til chi-kvadratstatistikken delt på utvalgsstørrelsen.

På samme måte beregnes Cramér’s V ved å ta kvadratroten til den chi-kvadratiske statistikken delt på utvalgsstørrelsen og lengden på minimumsdimensjonen (k er den minste av antall rader r eller kolonner c).

φc er interkorrelasjonen av de to diskrete variablene og kan beregnes for en hvilken som helst verdi på r eller c. Imidlertid, ettersom ki-kvadratiske verdier har en tendens til å øke med antall celler, jo større forskjell mellom r og c er, desto mer sannsynlig vil V ha en tendens til 1 uten sterke bevis for en meningsfull korrelasjon.

Cramér » s V kan også brukes på «godhet av passform» chi-kvadrerte modeller (dvs. de der c = 1). I dette tilfellet fungerer det som et mål på tendensen mot et enkelt resultat (dvs. ut av k-utfall). tilfelle man må bruke r for k, for å bevare 0 til 1-området av V. Ellers vil bruk av c redusere ligningen til den for Phi.

Cohen’s wEdit

Et annet mål på effektstørrelse brukt til ki-kvadratiske tester er Cohen’s w. Dette er definert som

w = ∑ i = 1 m (p 1 i – p 0 i) 2 p 0 i {\ displaystyle w = {\ sqrt {\ sum _ {i = 1} ^ {m} {\ frac {(p_ {1i} -p_ {0i}) ^ {2}} {p_ {0i}}}}}}

hvor p0i er verdien av ith-cellen under H0, p1i er verdien av ith-cellen under H1 og m er antallet celler.

Effektstørrelse w
Small 0.10
Medium 0,30
Large 0,50

Odds ratioEdit

Odds ratio (OR) er en annen nyttig effektstørrelse. Det er hensiktsmessig når forskningsspørsmålet fokuserer på graden av sammenheng mellom to binære variabler. Tenk for eksempel på en studie av staveevne. I en kontrollgruppe passerer to elever klassen for hver som mislykkes, så oddsen for å bestå er to til en (eller 2/1 = 2). I behandlingsgruppen passerer seks studenter for hver som mislykkes, så oddsen for bestått er seks til en (eller 6/1 = 6). Effektstørrelsen kan beregnes ved å merke seg at sjansen for å passere i behandlingsgruppen er tre ganger høyere enn i kontrollgruppen (fordi 6 delt på 2 er 3). Derfor er oddsforholdet 3. Odds ratio statistikk er på en annen skala enn Cohen «sd, så denne» 3 «kan ikke sammenlignes med en Cohen» sd på 3.

Relativ risikoEdit

Den relative risikoen (RR), også kalt risikoforhold, er ganske enkelt risikoen (sannsynligheten) for en hendelse i forhold til noen uavhengig variabel. Dette målet på effektstørrelse skiller seg fra oddsforholdet ved at det sammenligner sannsynligheter i stedet for odds, men nærmer sistnevnte asymptotisk for små sannsynligheter. Ved å bruke eksemplet ovenfor er sannsynlighetene for henholdsvis 2/3 (eller 0,67) og 6/7 (eller 0,86) for de i kontrollgruppen og behandlingsgruppen som passerer. Effektstørrelsen kan beregnes på samme måte som ovenfor, men bruk sannsynlighetene i stedet. Derfor er den relative risikoen 1,28. Siden det ble brukt ganske store sannsynligheter for å passere, er det stor forskjell mellom relativ risiko og oddsforhold. Hadde feil (mindre sannsynlighet) blitt brukt som hendelsen (i stedet for å passere), ville ikke forskjellen mellom de to målene for effektstørrelse være så stor.

Selv om begge målene er nyttige, har de forskjellige statistiske bruker. I medisinsk forskning blir oddsforholdet ofte brukt i case-control studier, da odds, men ikke sannsynligheter, vanligvis estimeres. Relativ risiko brukes ofte i randomiserte kontrollerte studier og kohortestudier, men relativ risiko bidrar til overvurderinger av effektiviteten av inngrep.

RisikoforskjellEdit

Risikoforskjellen (RD), noen ganger kalt absolutt risikoreduksjon, er ganske enkelt forskjellen i risiko (sannsynlighet) for en hendelse mellom to grupper. Det er et nyttig mål i eksperimentell forskning, siden RD forteller deg i hvilken grad en eksperimentell intervensjon endrer sannsynligheten for en hendelse eller et resultat.Ved å bruke eksemplet ovenfor er sannsynlighetene for de i kontrollgruppen og behandlingsgruppen som passerer henholdsvis 2/3 (eller 0,67) og 6/7 (eller 0,86), og derfor er RD-effektstørrelsen 0,86 – 0,67 = 0,19 (eller 19%). RD er det overlegne tiltaket for å vurdere effektiviteten av inngrep.

Cohen «s hEdit

Hovedartikkel: Cohen» sh

Ett mål som brukes i kraftanalyse når man sammenligner to uavhengige proporsjoner er Cohen «s h. Dette er definert som følger

h = 2 (buesin ⁡ p 1 – buesin ⁡ p 2) {\ displaystyle h = 2 (\ arcsin {\ sqrt {p_ { 1}}} – \ arcsin {\ sqrt {p_ {2}}})}

der p1 og p2 er proporsjonene til de to prøvene som sammenlignes, og buesin er buesintransformasjonen.

Vanlig språkeffektstørrelseRediger

For lettere å beskrive betydningen av en effektstørrelse, for personer utenfor statistikken, ble den vanlige språkeffektstørrelsen, som navnet antyder, designet for å kommunisere den på vanlig engelsk. Den brukes til å beskrive en forskjell mellom to grupper og ble foreslått, så vel som navngitt, av Kenneth McGraw og SP Wong i 1992. De brukte følgende eksempel (om høyder på menn og kvinner): «i enhver tilfeldig sammenkobling av ung voksen menn og kvinner, probabi lity of the mann som er høyere enn den kvinnelige er .92, eller i enklere termer ennå, i 92 av 100 blind dates blant unge voksne, vil hannen være høyere enn den kvinnelige «, når man beskriver populasjonsverdien til den vanlige språkeffekten størrelse.

Befolkningsverdien, for størrelsen på den vanlige språkeffekten, rapporteres ofte slik, når det gjelder par som er tilfeldig valgt fra befolkningen. Kerby (2014) bemerker at et par, definert som en poengsum i en gruppe sammenkoblet med en poengsum i en annen gruppe, er et kjernekonsept av den vanlige språkeffektstørrelsen.

Som et annet eksempel, vurder en vitenskapelig studie (kanskje av en behandling for en kronisk sykdom, for eksempel leddgikt) med ti personer i behandlingsgruppen og ti personer i en kontrollgruppe. Hvis alle i behandlingsgruppen sammenlignes med alle i kontrollgruppen, er det (10 × 10 =) 100 par. På slutten av studien blir resultatet vurdert til en poengsum, for hver enkelt person (for eksempel på en skala av mobilitet og smerte, i tilfelle en leddgiktstudie), og deretter blir alle poengene sammenlignet mellom parene. Resultatet, som prosentandelen av parene som støtter hypotesen, er den vanlige språkeffektstørrelsen. I eksempelstudien kan det være (la oss si det) .80, hvis 80 av de 100 sammenligningsparene viser et bedre resultat for behandlingsgruppen enn kontrollgruppen, og rapporten kan lyde som følger: «Når en pasient i behandlingsgruppen ble sammenlignet med en pasient i kontrollgruppen, i 80 av 100 par viste den behandlede pasienten et bedre behandlingsresultat. «Eksempelverdien, i for eksempel en studie som denne, er en upartisk estimator av populasjonsverdien.

Vargha og Delaney generaliserte den vanlige språkeffektstørrelsen (Vargha-Delaney A) for å dekke data på ordinært nivå.

Rang-biserial correlationEdit

Hovedartikkel: Mann –Whitney U-test § Rank-biserial korrelasjon

En effektstørrelse relatert til den vanlige språkeffektstørrelsen er den rang-biseriale korrelasjonen. Dette tiltaket ble introdusert av Cureton som en effektstørrelse for Mann – Whitney U-testen Det vil si at det er to grupper, og poengene for gruppene er konvertert til ranger. Den enkle forskjellen i Kerby beregner rang-biserial korrelasjon fra den vanlige språkeffektstørrelsen. La f være andelen par som er gunstig for hypotesen (den vanlige språkeffektstørrelsen), og la u være andelen par som ikke er gunstige, er den rangbisiale r den enkle forskjellen mellom de to proporsjonene: r = f – u. Med andre ord er korrelasjonen forskjellen mellom størrelsen på den vanlige språkeffekten og dens komplement. For eksempel, hvis størrelsen på den vanlige språkeffekten er 60%, er rangbisial r lik 60% minus 40%, eller r = 0,20. Kerby-formelen er retningsbestemt, med positive verdier som indikerer at resultatene støtter hypotesen.

En ikke-retningsbestemt formel for rang-tosidig korrelasjon ble gitt av Wendt, slik at korrelasjonen alltid er positiv. Fordelen med Wendt-formelen er at den kan beregnes med informasjon som er lett tilgjengelig i publiserte artikler. Formelen bruker bare testverdien av U fra Mann-Whitney U-testen, og prøvestørrelsene til de to gruppene: r = 1 – (2U) / (n1 n2). Merk at U er definert her i henhold til den klassiske definisjonen som den minste av de to U-verdiene som kan beregnes ut fra dataene. Dette sikrer at 2U < n1n2, da n1n2 er den maksimale verdien av U-statistikken.

Et eksempel kan illustrere bruken av de to formlene. Vurder en helsestudie av tjue eldre voksne, med ti i behandlingsgruppen og ti i kontrollgruppen; derfor er det ti ganger ti eller 100 par.Helseprogrammet bruker diett, trening og kosttilskudd for å forbedre hukommelsen, og hukommelsen måles ved en standardisert test. En Mann-Whitney U-test viser at den voksne i behandlingsgruppen hadde bedre hukommelse i 70 av de 100 parene, og dårligere hukommelse på 30 par. Mann-Whitney U er den minste av 70 og 30, så U = 30. Korrelasjonen mellom minne og behandlingsytelse ved Kerby-enkle forskjellsformel er r = (70/100) – (30/100) = 0,40. Korrelasjonen med Wendt-formelen er r = 1 – (2 · 30) / (10 · 10) = 0,40.

Effektstørrelse for ordinaldata Rediger

Cliff’s delta eller d {\ displaystyle d}, opprinnelig utviklet av Norman Cliff for bruk med ordinære data, er et mål på hvor ofte verdiene i en distribusjon er større enn verdiene i en andre fordeling. Det er avgjørende at det ikke krever noen antakelser om formen eller spredning av de to distribusjonene.

Eksempelanslaget d {\ displaystyle d} er gitt av:

d = ∑ i, j – mn {\ displaystyle d = {\ frac {\ sum _ {i, j} -} {mn}}}

d {\ displaystyle d} er lineært relatert til statistikken Mann – Whitney U, men den fanger retningen på forskjellen i tegnet. Gitt Mann – Whitney U {\ displaystyle U}, d {\ displaystyle d} er:

d = 2 U mn – 1 {\ displaystyle d = {\ frac {2U} {mn}} – 1}

Write a Comment

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *