Litteraturgjennomgangen identifiserte syv hovedkategorier, med en rekke punkter (dekket individuelt nedenfor) som ansett som viktige i forhold til videre utvikling av retningslinjer: (1) generelle punkter om retningslinjer for vurdering av GAF; (2) innføring i retningslinjer, med grunnregler; (3) starter på øverste, midtre eller nederste nivå av skalaen; (4) score for forskjellige tidsperioder og av forskjellige verdier (høyeste, laveste eller gjennomsnittlige); (5) den finere gradering av skalaen; (6) forskjellige retningslinjer for forskjellige forhold; og (7) forskjellige språk og kulturer.
Når presentasjonen av problemer angående retningslinjer ikke krever noe skille mellom GAF med en skala og dobbel skala, blir det ikke gjort noen bemerkninger om dette. Retningslinjer for å score enkeltskala og dobbeltskala GAF kan være ganske like. Når den enkle skalaen brukes, er «det som er det verste» av symptomene og funksjonsverdiene den enkeltverdien som er registrert (i henhold til manualen for DSM-IV-TR).
(1) Generelle punkter om retningslinjer for vurdering av GAF
Det finnes korte retningslinjer for vurdering av GAF, men deres manglende dybde vil sannsynligvis føre til subjektivitet i rating. De er også forskjellige i flere henseender. En tidlig versjon av GAF (Global Assessment Scale (GAS)) hadde poenginstruksjoner, men publiseringen av DSM-IV-TR oppdaterte GAF, med betydelige endringer i disse klassifiseringsinstruksjonene. Veterans Administration i USA og norske psykiatritjenester har retningslinjer. Andre systemer basert på GAF har også retningslinjer, for eksempel Modified GAF og Kennedy Axis V.
I praksis opererer erfarne klinikere ved å danne innledende hypoteser og teste dem gjennom vurdering, men de kan møte dilemmaer om hvilken GAF-verdi du skal velge. Hvis retningslinjer vil være av verdi for vurdering, må de være klare, spesifikke og fullstendige. Prosessen med å score må ta hensyn til alle de spesifikke egenskapene til GAF. Arbeid med retningslinjer for psykologiske tester kan danne læringsgrunnlaget for videre arbeid med retningslinjer for GAF; For eksempel har den internasjonale testkommisjonen utviklet retningslinjer for bruk av psykologiske tester, og flere av punktene i disse retningslinjene gjelder for vurderinger som brukes i psykiatrien.
Når vurderingsinstrumenter utvikles, bør studiet av vurderingsprosessen være en standard prosedyre, men det har vært liten interesse for retningslinjer for GAF-scoring. Internasjonale ekspertpaneler har spilt en begrenset rolle i utviklingen av retningslinjer, og få har sammenlignet innholdet i eksisterende retningslinjer eller undersøkt hva som er den riktige normen for poengprosessen. Det er begrenset empirisk forskning om selve poengprosessen, og en studie har vist at den faktiske prosessen stemmer godt overens med begrepet GAF; den faktiske prosessen er imidlertid ikke nødvendigvis den samme som den foreskrevne prosessen. Før trening vil utøverne ofte velge en feil strategi for å score GAF; for eksempel kan de bruke gjennomsnittet av funksjons- og symptompoengene (for GAF på en skala er bare en verdi registrert), det minst alvorlige av symptomene eller det høyeste funksjonsområdet.
Gap i kunnskap
I den historiske utviklingen av GAF har det vært lite forskning på eksisterende retningslinjer. Få studier har sammenlignet effekten av å bruke forskjellige eksisterende retningslinjer for vurdering og effekten av systematisk varierende retningslinjer. Vi vet ikke hvilke normer for retningslinjen som er best, eller om endrede og utvidede retningslinjer vil forbedre vurderingen.
(2) Introduksjon til retningslinjer, med grunnregler
Innledningen til retningslinjene bør gi rangere en grunnleggende forståelse av retningslinjene «andre spesifikasjoner og hva man skal se etter når man scorer GAF. Imidlertid har eksisterende retningslinjer for vurdering av GAF forskjellige introduksjoner. Når forskjellige introduksjoner får rangere til å tenke i forskjellige retninger, er det sannsynlig at det blir en effekt på GAF-score. Utvikling en god, kort innføring bør ikke betraktes som en irrelevant detalj; hvis den er svak og dårlig definert, er det en risiko for at rangere vil bruke sine individuelle perspektiver til å dømme og bruke normer fra andre kilder; for eksempel en kliniker som hovedsakelig arbeider med alvorlig syke pasienter kan utilsiktet bruke denne erfaringen som en norm for mindre alvorlig syke. Dette har imidlertid blitt gitt liten oppmerksomhet i internasjonale publikasjoner.
Introduksjonen artikkelavsnitt i en retningslinje for vurdering av GAF kan begynne med å forklare formålet med vurdering av GAF, for eksempel å score det totale nivået av funksjon eller alvorlighetsgraden av sykdom og hvorfor GAF-verdier er viktige.Deretter bør det gis et sentralt formål med retningslinjen, for eksempel å forbedre vurderingen ved å beskrive kompetent instrumentbruk, å hjelpe til med å standardisere rangering slik at påvirkning av endring i assessoren minimeres, og å hjelpe til med å tildele mer nøyaktige score.
I andre ledd kan det gis en definisjon av hva GAF er og et bilde av skalaen (e) (med ankerpunkter, stikkord og eksempler). Det neste punktet kan være grunnregler for selve rangeringen. Ettersom GAF betyr vurdering av funksjon og symptomer, bør disse begrepene defineres, med eksempler på symptomer og funksjon som bør og ikke bør tas i betraktning. Ved vurdering bør all tilgjengelig informasjon som er viktig for GAF-S og GAF-F vurderes, men denne informasjonen bør da være tilstrekkelig for en god samlet vurdering av både symptomer og funksjon. Både i DSM-IV-TR og de norske instruksjonene er det en grunnregel: «vurdere psykologisk, sosial og yrkesmessig funksjon på et hypotetisk kontinuum av psykisk helsesykdom», men det er lite publisert analyse av hvordan denne grunnregelen forstås av forskjellige vurderere og hvor godt det fungerer i praksis. I følge de norske retningslinjene betyr denne grunnregelen at symptomer (og funksjon) skal sees i sin bredere sammenheng, for eksempel behovet for behandling. I følge DSM-IV-TR er GAF-verdien nyttig for å planlegge behandling, måle effekten av behandlingen og forutsi utfallet, men det er begrenset informasjon tilgjengelig om tilstrekkelig GAF i prediksjon av utfallet. Informasjon om valg av omsorgsnivå for forskjellige rangeringer kan gis, for eksempel kan en pasient med poengsummen 1-30 være en potensiell kandidat for innleggelse, en pasient med poengsummen 31-69 en potensiell kandidat for poliklinisk behandling, og en pasient med en poengsum på 70 og høyere kan fungere for godt til å være kandidat til noen behandling.
Kunnskapshull
Introduksjoner til retningslinjer har blitt gitt liten oppmerksomhet i internasjonale litteratur. Grunnregler for vurdering har blitt lite analysert, og det er lite informasjon om hvordan de forstås av forskjellige rangere. Det er ikke kjent hva resultatet ville bli hvis internasjonale konsensuspaneler av eksperter jobbet med grunnregler.
(3) Begynner å score på øverste, midtre eller nederste nivå på skalaen
Det er kjent fra metodologistudier av utforming av spørreskjema at bestillingen av svarkategorier er et problem. Studier viser en tendens til å velge både den første oppførte responskategorien («primacy» -effekt) og den sist oppførte responsalternativet («recency» -effekten). Primacy-effekter er mer sannsynlig i undersøkelser om selvutfylling. Det finnes en likhet i metodeproblemer for GAF og spørreskjemaer. Klinikere utfører vurderingen ved å stille spørsmål, og GAFs desiler (med ankerpunkter) brukes som responskategorier. Det er ingen felles internasjonal norm for hvor man skal begynne. Eksisterende retningslinjer for GAF: (a) anbefaler å starte på toppnivå av skalaen med evaluering av om pasienten er verre enn angitt av hvert av desilets ankerpunkter; eller (b) anbefale å starte på bunnnivå; eller (c) gi ingen instruksjoner for hvor du skal begynne.
Det kan antas at start fra toppen resulterer i høyere verdier enn å starte fra bunnen, og det er kjent at med spørreskjemaer kan tilsynelatende mindre endringer ha en stor innvirkning. En alternativ tilnærming vil være å starte midt på skalaen (GAF = 50) og spørre om alvorlighetsgraden er verre eller pasienten er mer sunn, og deretter fortsette å bevege seg nedover eller oppover skalaen til det området som passer best til individets symptomens alvorlighetsgrad eller funksjonsnivå er nådd. For å dobbeltsjekke, vil det bli tatt en titt på neste øvre eller nedre område.
Kunnskapshull
Informasjon om effekten av å starte vurderingsprosess på topp-, mellom- eller bunnivå er vanskelig å finne.
(4) Scorer for forskjellige tidsperioder og av forskjellige verdier
Hvilken tidsperiode?
I psykiatrien kan symptomene endres over tid, for eksempel over 24 timer. I følge DSM-IV-TR-manualen skal GAF-poengsummen (i de fleste tilfeller) være nivået på tidspunktet for evaluering. Det nåværende funksjonsnivået kan være operasjonalisert til det laveste funksjonsnivået for den siste uken, som kan brukes til å representere en grunnlinje før behandlingsstart. o ble foreslått at symptomskalaer for alvorlighetsgraden av nåværende sykdom skulle dekke de siste 3 dagene, men på akuttavdelinger kan enda kortere tidsperioder være relevante.
Poengsummen for den siste uken kan være i konflikt med pasientens tidligere psykiske helse, og svingninger i pasientens tilstand kan være nødvendig å score flere ganger over lengre tid. Hvis dette ikke gjøres, kan klinisk nyttig informasjon gå tapt.Poengsummen kan også gjøres i tidsperioder, for eksempel for den siste uken og det siste året; Dette kan føre til betydelige forskjeller i poengsummer, og når det er relevant, kan poengsummen gjøres i mer enn en tidsperiode. Eksempler på foreslåtte tidsperioder er: i fjor, siste 6 måneder, minst noen få måneder i løpet av det siste året, og den foregående måneden.
Kunnskap om forløpet av forskjellige forhold over tid er viktig; for noen pasienter og studier kan det være aktuelt å score i lengre perioder. Langsgående beskrivelser av psykopatologien kan legge til informasjon. Viktigheten av premorbid funksjonsnivå har blitt lite utforsket og er sjelden dokumentert, men for kroniske tilstander er det logisk å vurdere å legge til score i lengre perioder. Depresjon kan skåres av for eksempel: depresjon det siste året i 2 uker eller mer, for mye av tiden det siste året, eller for de fleste dagene over en 2-års periode. For bipolar lidelse er det ikke nok å score nåværende symptomer, og det er nødvendig å se etter en tidligere historie med mani. Hvis psykose har vart i en lengre periode, bør GAF-poengsummen være lavere enn poengsummen gitt ved innleggelse for en første gangs psykose. For personlighetsforstyrrelser er personlighetens stabilitet et avgrensende trekk, og et langsgående perspektiv er viktig i diagnosen: scoring kan gjøres de siste årene, de siste 5 årene, de to årene før intervjuet, eller det «vanlige selvet».
Når effekten av behandlingen blir studert, bør GAF scorer både før og etter behandlingen; poengperioder på mellom 3 og 12 måneder etter utskrivning er foreslått. For pasienter som er i behandling over en lengre periode, kan poengsummen gjøres hver 2. eller 3. måned. For eksempel bør polikliniske pasienter som ikke har fått GAF-score de siste 90 dagene, få en ny score.
Gap i kunnskap
Den langsgående dimensjonen ved å bruke forskjellige GAF-score for forskjellige lidelser har blitt lite utforsket og eksisterende retningslinjer gir liten instruksjon. Det er lite forskningsdata tilgjengelig om tidsperioden som skal brukes til GAF-vurdering eller kriteriene for å velge en bestemt tidsperiode. Det er ikke kjent om scoring skal gjøres for samme tidsperiode for GAF-S og GAF-F-skalaene, om scoring skal gjøres for forskjellige tidsperioder for de øvre og nedre endene av hver GAF-skala, eller om scoring skal være gjort i forskjellige tidsperioder for forskjellige ankerpunkter.
Hvilken verdi (laveste, høyeste eller gjennomsnittlige)?
Målet med å score skal være å gi et sant bilde av pasientens mental helse som vil være nyttig for klinikere og forskning. Siden alvorlighetsgraden av sykdommen kan variere over tid, blir spørsmålet om hvilken GAF-verdi som skal registreres, relevant. Enkle alternativer er den laveste, høyeste eller gjennomsnittlige GAF for en tidsperiode. instruksjoner for GAF, når det nåværende funksjonsnivået er scoret, bør den laveste poengsummen for den siste uken brukes; det laveste funksjonsnivået velges på grunn av dets kliniske relevans. Vurdering GAF kan bety at du velger den laveste poengsummen for andre spesifiserte tidsperioder , for eksempel den laveste le vel den siste måneden eller for den verste uken i løpet av måneden før intervjuet.
Å tildele laveste GAF-poengsum er imidlertid ikke uten problemer. Det kan gi et feil inntrykk av både den generelle mentale situasjonen og den nåværende statusen; det høyeste funksjonsnivået bør ikke ses bort fra da det kan forutsi utfallet. For eksempel kan det høyeste funksjonsnivået i minst noen få måneder i løpet av det siste året være svært prediktivt for resultatet og indikere det potensielle funksjonsnivået. Det er også rapportert at det høyeste funksjonsnivået i løpet av det siste året kan være sterkt korrelert med dagens nivå.
Hvis pasienten ikke er godt beskrevet av verken den høyeste eller den laveste GAF for den siste uken. , kan en løsning være å bruke flere poeng; for eksempel score som høyeste og laveste for det siste året, den høyeste og laveste pasienten noen gang har hatt, eller score for når pasienten er symptomatisk og asymptomatisk. Vurdering av gjennomsnittlig funksjon har også blitt foreslått, for eksempel gjennomsnittlig funksjonsnivå i løpet av de siste 3 ukene. Hvis slike poeng beskriver pasienten godt, kan de legges til.
Internasjonalt er både enkeltskala og dobbeltskala GAF i bruk. For enkeltskala GAF, ifølge håndboken for DSM-IV-TR, skal bare en verdi registreres, nemlig «det som er verst» av symptom- og funksjonsverdiene. Det antas at GAF-S og GAF-F er sammenlignbare skalaer, så registrering av bare de alvorligste av GAF-S- og GAF-F-poengene er i samsvar med det generelle prinsippet om å bruke den mest alvorlige tilstanden som den totale poengsummen; imidlertid blir forskjellen mellom de to skalaene sett bort fra, så det er ikke klart hvilken faktor av symptomer og funksjon som blir målt.Et alternativ kan være å registrere gjennomsnittet av symptomer og funksjonsnivåer, men dette reiser spørsmålet om symptomer og funksjon har lik vekt eller ikke, og viktigheten av en vektingseffekt. Selv om verdiene på hver skala kan være nærme, er symptomer og funksjon forskjellige aspekter av pasientens tilstand, og de varierer ikke nødvendigvis sammen, så i noen land brukes en dobbel skala GAF der både GAF-S og GAF-F blir registrert.
I den kliniske setting kan kommentarer legges til en GAF-score på hvorfor en bestemt score ble valgt, noe som kan være viktig når andre overtar behandlingen. Det kan også ha en pedagogisk effekt, legge poeng til mening og forbedre påliteligheten mellom rater. Det ville imidlertid være nyttig hvis retningslinjer inkluderte en norm for valg av poengsum med mer detaljert informasjon om hvilken poengsum som skal registreres; dette er ikke en lett oppgave, ettersom psykisk sykdom er et mangesidig og sammensatt problem. Å bestemme kriteriene for en slik norm er problematisk.
Kunnskapshull
Det er vanskelig å finne empirisk forskning som tar sikte på å finne riktig GAF-verdi (laveste, høyeste eller gjennomsnittlige), eller kombinasjon av GAF-verdier, for å registrere for forskjellige applikasjoner. De potensielle applikasjonene for GAF-scoring er vidt spekterende og inkluderer forskjellige diagnostiske kategorier, kronisk og akutt syk, behandlingsbeslutninger, prediksjon eller måling av utfallet, valg av omsorgsnivå og måling av saksblanding. Det er lite kjent om hvilken poengsum som gir den beste interrater-påliteligheten og validiteten, og det er ikke kjent om separate GAF-S og GAF-F, eller den laveste av de to poengene, er best for behandlingsbeslutninger og måling av utfall, eller mye vekt bør tillegges GAF-S versus GAF-F for slike applikasjoner.
(5) Den finere gradering av skalaen
DSM-IV-TR, Veterans Administration og Norske retningslinjer har instruksjoner for poengsum innen 10-punktsintervaller, men instruksjonene er begrensede. Poengvurdering innen 10-punktsintervallene er åpen for subjektiv vurdering og finere skiller blir lett noe tilfeldige. I praksis pleier klinikere å score rundt desil- eller midt-desilinndelingene på skalaen. Pasienter som er scoret i det samme 10-punktsintervallet, bør være relativt homogene i funksjon, men funksjon er en konstruksjon med mange fasetter, og når informasjon for en mer nøyaktig score mangler, velges mellompoeng i desilene.
Det er mulig at mer detaljerte verbale instruksjoner vil resultere i mer nøyaktige poeng. Et alternativ til å ha flere ankerpunkter er å bruke kategoriske skalaer for å score innenfor 10-punktsintervallene, i hvilket tilfelle ankerpunktene (med stikkord og eksempler på symptomer og fungerende elementer) skal klassifiseres. Både symptomer og funksjon kan klassifiseres på forskjellige måter. En kategorisk skala krever en beslutning om antall kategorier; slike skalaer har ofte fem kategorier, for eksempel: veldig markert, markert, verken markert eller svak, svak eller veldig svak. Antall andre kategorier enn fem kan også vurderes. Mer erfarne rangere kan være i stand til å gjøre finere skiller og score riktig med flere kategorier, men poengbehandling på klinikken utføres ofte av personer med forskjellig utdannelsesbakgrunn. En alternativ prosedyre for scoring innenfor 10-punktsintervaller finnes i «modifisert GAF», som bruker antall oppfylte kriterier: for eksempel for intervallet 41-50, når et kriterium er oppfylt, skal poengsummen være 48-50 og når to kriterier er oppfylt, bør det være 44-47.
Kunnskapshull
I historien til GAF er systematisk arbeid for å forbedre poengsummen innenfor 10-punktsintervaller begrenset, og det er ikke kjent hvordan man best scorer innen 10-punktsintervaller. Dette gjelder også bruk av kategoriske skalaer for poengsum, noe som krever hensyn til kategorienes art og antall.
(6) Ulike retningslinjer for forskjellige forhold
Det kan være enorme forskjellen mellom de mentale tilstandene til forskjellige pasienter. Imidlertid bruker en dobbel skala GAF-poengsum to rette linjer (det vil si at et flerdimensjonalt fenomen blir scoret på en todimensjonal måte), noe som kanskje ikke gjenspeiler denne kompleksiteten. Svaret på problemet er ikke nødvendigvis å ha flere skalaer som dekker forskjellige aspekter ved, for eksempel å fungere, da dette vil kreve en mer kompleks poengprosess. Men hvis retningslinjer for vurdering ikke er gode nok, reduseres verdien av et vurderingsinstrument. Det synes hensiktsmessig å vurdere utvikling av retningslinjer for forskjellige forhold.
Eksperter med hjelp fra empiriske data kan utvikle normer med områder av relevante GAF-verdier. Forståeligheten av forankringspunkter (med stikkord og eksempler) for forskjellige diagnosegrupper bør vurderes, og det vil være nyttig å inkludere eksempler på pasienter som er scoret og ikke scoret i hver desil.Påliteligheten til score er ikke nødvendigvis den samme for alle diagnostiske grupper. For å sikre tildeling av riktig GAF-verdi, kan det gis råd om hvordan du får god informasjon for hver pasient (for eksempel hvilket psykiatrisk intervju du skal bruke). For noen diagnostiske grupper kan dette bety å samle inn mer informasjon enn for andre. Retningslinjene bør ha informasjon om hvordan man tar hensyn til forskjellige comorbide forhold.
Hvis det forventes forskjellige GAF-verdier for forskjellige aldre og kjønn, bør dette bemerkes i retningslinjene, men det er lite informasjon tilgjengelig om dette. Ulike funksjonsnormer kan representere forskjellige grunnlinjer som pasienten blir evaluert mot, så for eksempel bør instrumenter tilpasses for å vurdere eldre pasienter, for å inkludere poengsum for demens og lykke ved livets slutt. Retningslinjer kan også være forskjellige for forskjellige situasjoner, for eksempel for innleggelse på døgnavdelinger og for samfunnstudier.
GAF bør score nedsatt på grunn av mental tilstand, men effekten av somatisk og psykisk svekkelse kan være sammenhengende og den kan være vanskelig å skille mellom dem. GAF-vurderingen bør ikke påvirkes av hensyn til prognose, tidligere diagnose, antatt karakter av den underliggende lidelsen, eller om pasienten får medisiner eller annen form for hjelp.
Kunnskapshull
Det er begrenset empirisk informasjon om egnetheten til eksisterende retningslinjer for forskjellige tilstander, forskjellige pasientgrupper og pasienter med flere andre egenskaper. Effekten av å tilpasse retningslinjene til disse variasjonene er ikke kjent. Å ha forskjellige retningslinjer for symptomer og funksjon har blitt lite utforsket.
(7) Ulike språk og kulturer
GAF har blitt oversatt til mange språk, men språk koder for mening på forskjellige måter. Instrumenter bør tilpasses forskjellige kulturer og språk.
Mennesker fra forskjellige kulturer kan svare på forskjellige måter når det stilles spørsmål, av en rekke årsaker, og dette kan få konsekvenser for GAF-verdier. Det er viktig å forstå sykdomsforklaringer og hjelpesøkende atferd innenfor pasientenes «kulturelle rammeverk og pasienter bør vurderes opp mot det som er» normalt «i deres egen kultur. Kulturelle faktorer kan være viktige for holdninger til uorden, og bruken av GAF i multietniske samfunn gir utfordringer for vurdering.
Språkforskjeller kan også by på problemer; en pasient kan være tydelig psykotisk når han blir intervjuet på sitt eget språk, men ikke når han blir intervjuet på et fremmed språk. retningslinjer for vurdering av GAF, intervjuer for vurdering av GAF og GAF selv (for eksempel forankringspunkter med stikkord og eksempler) kan påvirkes. Oversettelse av vurderingsinstrumenter kan innebære oversettelse, oversettelse, gjennomgang og endring, og retningslinjer er tilgjengelige for å oversette tester og vurderingsinstrumenter.
Kunnskapshull
Lite er kjent om betydningen av oversettelse og kultur for GAF-guid elines. Sikkerheten ved internasjonale sammenligninger bør settes i tvil. Metaanalyser basert på data fra land med forskjellige språk og kulturer kan påvirkes av disse forskjellene.
Videre utvikling for GAF
Vi er langt fra å ha et omfattende sett med heuristisk retningslinjer som kan støtte vurdereren i å utføre poengprosessen, men det forventes fremdrift i studien av vurderingsprosessen. Retningslinjer bør være basert på både teori og empirisk kunnskap om hvordan hver retningslinje fungerer i praksis. Utvikling av nye retningslinjer for GAF vil bli tilrettelagt ved først å gjennomgå litteraturen om retningslinjer for psykologisk vurdering, og trekke ut relevante punkter. Ny empirisk forskning kan deretter utføres, for eksempel ved å utføre kvalitative studier av selve poengprosessen, for å søke etter elementer som er relevante for retningslinjer, mens man tar i betraktning at hvis poengprosessen blir for komplisert, er det mer sannsynlig at feil bli introdusert. Eksistensen av internasjonale retningslinjer vil gi støtte til implementering og bruk av retningslinjene i forskjellige land. Retningslinjer bør gjenspeile konsensus om praksis, og et utkast til nye retningslinjer for GAF bør derfor sirkuleres bredt for å gi god mulighet for kommentarer. En GAF-skala med nye retningslinjer bør også testes for pålitelighet og validitet for forskjellige diagnoser, med forskjellige poenggivere, på tvers av forskjellige nettsteder og med forskjellige pasientpopulasjoner. For å studere effekten av varierende retningslinjer, vil kunnskap om «sanne» verdier være nyttig, og gjennomsnittlige score fra ekspertpaneler kan fungere som referansenormer.
Når du designer en norm for poengprosessen, er det viktig å vurdere hvilken prosess som best kan nå målene.Det er viktig å først definere formålet med et scoringssystem. For eksempel bør et system som hovedsakelig er ment for klinisk bruk, betraktes av klinikere som fornuftig og enkel å bruke. Å ha en kort versjon av retningslinjene for klinikken og mer detaljerte retningslinjer for forskning kan imidlertid resultere i score som ikke er direkte sammenlignbare; evidensbasert behandling er per definisjon basert på forskning, og dette kan utgjøre et problem for implementeringen.
En håndbok med mer informasjon om GAF og scoring av GAF kan også utvikles ved siden av retningslinjene. Kravet om at retningslinjene skal være korte og konsise, gjør det nødvendig å bestemme hvilken informasjon som skal gis i retningslinjene og hvilken i håndboken. Håndboken kan tjene som hovedinformasjonskilde og kan inneholde informasjon om spørsmål knyttet til GAF, som historien om utviklingen; det teoretiske grunnlaget; omfanget av GAF for forskjellige forhold; påliteligheten og gyldigheten av GAF med forklaringer på problemer; statistisk informasjon for forskjellige diagnostiske grupper (gjennomsnittsverdi, standardavvik, rekkevidde og statistisk fordeling, enten normal eller skjev, og i hvilken retning); informasjon om hvilke metoder som skal brukes sammen med GAF (multimetodevurdering er vanlig); GAF-verdier sammenlignet med verdier fra andre metoder; implikasjoner av forskjellige GAF-score for behandling, med eksempler og terskler for alvorlighetsverdier som definerer når behandling er ønskelig; ledelsesbruk av GAF (for eksempel i planlegging og sammenligning av saksblanding); vurdering av lag og enkeltpersoner; bruk av GAF for pasienter med ulik kulturell og språklig bakgrunn; og opplæringsmateriell med beskrivelser av flere saker med tildelte GAF-verdier.
Datastyring av vurdering kan godt være fremtiden. Å tildele poeng kan begynne med en synlig GAF-skala på skjermen, der plassering av markøren på forskjellige steder langs skalaen avslører forskjellige vinduer med informasjon om kriteriene for scoring; å klikke med musen i et av disse vinduene kan gjøre enda mer detaljert informasjon tilgjengelig i et annet vindu. Bruken av elektroniske pasientjournaler representerer en mulighet for nye kvalitetssikringsmetoder. Noen diagnoser kan ikke kombineres med høy GAF-score; hvis en slik diagnose er gitt, kan en advarsel dukke opp på skjermen hvis det blir gitt en GAF-score som er for høy. Hvis en lav GAF-S er gitt, kan det oppstå en advarsel hvis en høy GAF-F blir gitt. En påminnelse kan komme opp hvis den psykiatriske posten er fullført for en ny pasient uten å ha oppgitt en GAF-score. Når en GAF-score ikke er gitt for en poliklinisk pasient de siste 3 månedene, kan en påminnelse dukke opp på skjermen. Databasert scoring av GAF kan gi høy korrelasjon med scoring basert på klinisk inntrykk, men vanskeligheter med datamaskinstøttet vurdering antyder en rekke retningslinjer for brukerne. Den internasjonale testkommisjonen har utviklet retningslinjer for datamaskinbasert og internettlevert testing, men disse retningslinjene ble ikke utviklet med tanke på GAF.
Arbeid med et poenginstrument er ikke komplett uten testing eller pilotstudie. Endringer i poengprosessen er ikke nødvendigvis alltid forbedringer, og det er nødvendig med en pilotstudie for å avdekke eventuelle nødvendige endringer.