Litteraturoversigten identificerede syv hovedkategorier med et antal punkter (dækket individuelt nedenfor) betragtet som vigtige i forhold til den videre udvikling af retningslinjer: (1) generelle punkter om retningslinjer for vurdering af GAF; (2) introduktion til retningslinjer med grundregler; (3) start på øverste, midterste eller nederste niveau af skalaen; (4) scoring for forskellige tidsperioder og af forskellige værdier (højeste, laveste eller gennemsnitlige); (5) den finere klassificering af skalaen; (6) forskellige retningslinjer for forskellige forhold og (7) forskellige sprog og kulturer.
Hvor præsentationen af problemer vedrørende retningslinjer ikke kræver nogen sondring mellem GAF med en enkelt skala og dobbelt skala, fremsættes der ingen bemærkninger til dette. Retningslinjer for scoring af enkeltskala og dobbeltskala GAF kan være ret ens. Når den enkelte skala bruges, er “det, der er værst” af symptom- og funktionsværdier, den registrerede enkeltværdi (ifølge manualen til DSM-IV-TR).
(1) Generelle punkter om retningslinjer for vurdering af GAF
Der findes korte retningslinjer for vurdering af GAF, men deres manglende dybde vil sandsynligvis resultere i subjektivitet i rating. De er også forskellige i flere henseender. En tidlig version af GAF (Global Assessment Scale (GAS)) havde scoreinstruktioner, men offentliggørelsen af DSM-IV-TR opdaterede GAF med betydelige ændringer i disse klassificeringsinstruktioner. Veterans Administration i USA og norske psykiatritjenester har retningslinjer. Andre systemer baseret på GAF har også retningslinjer, for eksempel Modified GAF og Kennedy Axis V.
I praksis opererer erfarne klinikere ved at danne indledende hypoteser og teste dem gennem vurdering, men de kan stå over for dilemmaer om hvilken GAF-værdi du skal vælge. Hvis retningslinjer har værdi for vurdering, skal de være klare, specifikke og komplette. Scoringsprocessen skal tage hensyn til alle de specifikke egenskaber ved GAF. Arbejde med retningslinjer for psykologiske tests kan danne læringsgrundlaget for yderligere arbejde med retningslinjer for GAF; F.eks. har Den Internationale Testkommission udviklet retningslinjer for brug af psykologiske tests, og flere af punkterne i disse retningslinjer gælder for vurderinger, der anvendes i psykiatrien.
Når vurderingsinstrumenter udvikles, bør undersøgelse af vurderingsprocessen være standardprocedure, men der har været ringe interesse for retningslinjer for GAF-scoring. Internationale ekspertpaneler har spillet en begrænset rolle i udviklingen af retningslinjer, og kun få har sammenlignet indholdet af eksisterende retningslinjer eller undersøgt, hvad den korrekte norm for scoringsprocessen skal være. Der er begrænset empirisk forskning i selve scoringsprocessen, og en undersøgelse har vist, at den egentlige proces stemmer godt overens med begrebet GAF; den egentlige proces er dog ikke nødvendigvis den samme som den foreskrevne proces. Før træning vælger praktikere ofte en forkert strategi for at score GAF; for eksempel kan de bruge gennemsnittet af funktions- og symptomscore (for GAF med en enkelt skala registreres kun en værdi), det mindst alvorlige af symptomerne eller det højeste funktionsområde.
Gap i viden
I den historiske udvikling af GAF har der været lidt forskning i eksisterende retningslinjer. Få studier har sammenlignet effekten af at bruge forskellige eksisterende retningslinjer til vurdering og effekten af systematisk forskellige retningslinjer. Vi ved ikke, hvilke normer for retningslinjen der er bedst, eller om ændrede og udvidede retningslinjer vil forbedre vurderingen.
(2) Introduktion til retningslinjer med grundregler
Introduktionen til retningslinjer skal give vurdererne en grundlæggende forståelse af retningslinjerne “andre specifikationer, og hvad man skal se efter, når man scorer GAF. Imidlertid har eksisterende retningslinjer for vurdering af GAF forskellige introduktioner. Når forskellige introduktioner får ratere til at tænke i forskellige retninger, er en sandsynlighed for GAF-score sandsynligvis. en god kortfattet introduktion bør ikke betragtes som en irrelevant detalje; hvis den er svag og dårligt defineret, er der en risiko for, at raterne bruger deres individuelle perspektiver til at foretage vurderinger og bruge normer fra andre kilder; for eksempel en kliniker, der hovedsagelig arbejder med alvorligt syge patienter kan utilsigtet bruge denne oplevelse som en norm for de mindre alvorligt syge. Dette er dog blevet givet lidt opmærksomhed i internationale publikationer.
Introduktionen Stk. afsnit i en retningslinje til vurdering af GAF kan starte med at forklare formålet med vurdering af GAF, for eksempel at score det samlede niveau af funktion eller sværhedsgrad af sygdom, og hvorfor GAF-værdier er vigtige.Derefter skal der gives et centralt formål med retningslinjen, for eksempel at forbedre vurderingen ved at beskrive kompetent instrumentbrug, at hjælpe med at standardisere klassificeringen, så indflydelse på ændringer i vurdereren minimeres og at hjælpe med at tildele mere nøjagtige scores.
I andet afsnit kan der gives en definition af, hvad GAF er, og et billede af skalaen / skalaerne (med ankerpunkter, nøgleord og eksempler). Det næste punkt kunne være grundregler for selve vurderingen. Da GAF betyder vurdering af funktion og symptomer, skal disse udtryk defineres med eksempler på symptomer og funktion, der bør og ikke bør tages i betragtning. Ved vurdering skal alle de tilgængelige oplysninger, der er vigtige for GAF-S og GAF-F, overvejes, men disse oplysninger skal derefter være tilstrækkelige til god samlet vurdering af både symptomer og funktion. Både i DSM-IV-TR og de norske instruktioner er der en grundregel: “Overvej psykologisk, social og erhvervsmæssig funktion på et hypotetisk kontinuum af psykisk sygdom”, men der er kun få offentliggjorte analyser af, hvordan denne grundregel forstås af forskellige vurderere, og hvor godt det fungerer i praksis. Ifølge de norske retningslinjer betyder denne grundregel, at symptomer (og funktion) skal ses i deres bredere sammenhæng, for eksempel behovet for behandling. Ifølge DSM-IV-TR er GAF-værdien nyttig til planlægning af behandling, måling af effekt af behandling og forudsigelse af resultat, men der er begrænset information tilgængelig om GAF’s tilstrækkelighed i forudsigelse af resultatet. Oplysninger om valg af plejeniveau for forskellige vurderinger kunne gives, for eksempel kan en patient med en score på 1-30 være en potentiel kandidat til indlæggelse, en patient med en score på 31-69 en potentiel kandidat til ambulant pleje, og en patient med en score på 70 og højere fungerer muligvis for godt til at være en kandidat til enhver behandling.
Manglende viden
Introduktioner til retningslinjer har fået lidt opmærksomhed i internationale litteratur. Grundregler for vurdering er lidt analyseret, og der er kun få oplysninger om, hvordan de forstås af forskellige ratere. Det vides ikke, hvad resultatet ville være, hvis internationale konsensuspaneler af eksperter arbejdede med grundregler.
(3) Start af scoringen på øverste, midterste eller nederste niveau på skalaen
Det er kendt fra metodestudier af design af spørgeskemaer, at rækkefølgen af svarskategorier er et problem. Undersøgelser viser en tendens til at vælge både den første anførte responskategori (“primacy” -effekt) og den sidst anførte responsmulighed (“recency” -effekt). Forrangseffekter er mere sandsynlige i selvudfyldende undersøgelser. En lighed med metodeproblemer findes for GAF og spørgeskemaer. Klinikere udfører vurderingen ved at stille spørgsmål, og GAF’s deciler (med ankerpunkter) bruges som reaktionskategorier. Der er ingen fælles international norm for, hvor man skal starte; eksisterende retningslinjer for GAF: (a) anbefaler, at man starter på det øverste niveau af skalaen med evaluering af, om patienten er værre end angivet af hver af decilets ankerpunkter; eller (b) anbefale at starte på det nederste niveau; eller (c) giver ingen instruktioner om, hvor man skal starte.
Det kan antages, at start fra toppen resulterer i højere værdier end startende fra bunden, og det er kendt, at selv tilsyneladende mindre ændringer med spørgeskemaer kan have en stor indvirkning. En alternativ tilgang ville være at starte midt på skalaen (GAF = 50) og spørge, om sværhedsgraden er værre, eller om patienten er mere sund og derefter fortsætte med at bevæge sig ned eller op på skalaen, indtil det interval, der passer bedst til individets symptomens sværhedsgrad eller funktionsniveau er nået. For at dobbelttjekke ville et kig på det næste øverste eller nedre interval blive taget.
Gap i viden
Oplysninger om virkningerne af at starte ratingproces på øverste, midterste eller nederste niveau er vanskelig at finde.
(4) Scoring for forskellige tidsperioder og af forskellige værdier
Hvilken tidsperiode?
I psykiatrien kan symptomer ændre sig over tid, for eksempel i løbet af 24 timer. Ifølge DSM-IV-TR-manualen skal GAF-scoren (i de fleste tilfælde) være niveauet på evalueringstidspunktet. Det nuværende funktionsniveau kan være operationel til det laveste funktionsniveau i den sidste uge, som kan bruges til at repræsentere en basislinie inden behandlingens begyndelse. o blev foreslået, at symptomskalaer for sværhedsgraden af nuværende sygdom skulle dække de sidste 3 dage, men i akutte afdelinger kan endnu kortere tidsperioder være relevante.
Scoren for den sidste uge kan være i konflikt med patientens tidligere mentale helbred, og udsving i patientens tilstand kan være nødvendigt at score flere gange over en længere periode. Hvis dette ikke gøres, kan klinisk nyttige oplysninger gå tabt.Scoring kan også udføres i perioder, for eksempel i den sidste uge og det sidste år; dette kan medføre betydelige forskelle i scoringer, og så når det er relevant, kan scoringen udføres i mere end en tidsperiode. Eksempler på foreslåede tidsperioder er: sidste år, sidste 6 måneder, mindst et par måneder i løbet af det forløbne år og den foregående måned.
Kendskab til forløbet af forskellige forhold over tid er afgørende; for nogle patienter og studier kan score i længere perioder være passende. Langsgående beskrivelser af psykopatologien kan tilføje information. Betydningen af præforbidt funktionsniveau er blevet lidt udforsket og er sjældent dokumenteret, men for kroniske tilstande er det logisk at overveje at tilføje score i længere perioder. Depression kan f.eks. Scorer ved hjælp af depression i det forløbne år i 2 uger eller mere, meget af tiden i det forløbne år eller de fleste dage over en periode på 2 år. For bipolar lidelse er det ikke tilstrækkeligt at score aktuelle symptomer, og det er nødvendigt at kontrollere for en tidligere mani-historie. Hvis psykose har varet i længere tid, skal GAF-scoren være lavere end den score, der blev givet ved optagelse til en første gangs psykose. For personlighedsforstyrrelser er personlighedens stabilitet et definerende træk, og et langsgående perspektiv er afgørende for diagnosen: scoring kan udføres i de sidste mange år, de sidste 5 år, de 2 år før interviewet eller det “sædvanlige selv”.
Når effekten af behandling undersøges, skal GAF scorer både før og efter behandlingen; scoringsperioder på mellem 3 og 12 måneder efter udskrivning foreslås. For patienter, der er i behandling i en længere periode, kan der foretages point hver 2. eller 3. måned. For eksempel bør ambulante patienter, der ikke har fået en GAF-score i de sidste 90 dage, få en ny score.
Manglende viden
Den langsgående dimension af at bruge forskellige GAF-scorer for forskellige lidelser er blevet lidt udforsket, og eksisterende retningslinjer giver ringe instruktion. Der er kun få forskningsdata tilgængelige om den tidsperiode, der skal bruges til GAF-vurdering eller kriterierne for valg af en bestemt tidsperiode. Det vides ikke, om scoring skal udføres i samme tidsperiode for GAF-S- og GAF-F-skalaerne, om scoring skal udføres i forskellige tidsperioder for de højere og nedre ender af hver GAF-skala, eller om scoring skal være udført i forskellige tidsperioder for forskellige ankerpunkter.
Hvilken værdi (laveste, højeste eller gennemsnitlige)?
Målet med at score skal være at give et ægte billede af patientens mental sundhed, der vil være nyttigt for klinikere og forskning. Da sygdommens sværhedsgrad kan variere over tid, bliver spørgsmålet om, hvilken GAF-værdi der skal registreres, relevant. Enkle alternativer er den laveste, højeste eller gennemsnitlige GAF i en periode. Ifølge scoring instruktioner til GAF, når det nuværende funktionsniveau er scoret, skal den laveste score for den sidste uge anvendes; det laveste funktionsniveau vælges på grund af dets kliniske relevans. Vurdering GAF kan betyde at vælge den laveste score for andre specificerede tidsperioder , for eksempel den laveste le vel i den sidste måned eller i den værste uge i måneden forud for interviewet.
Det er dog ikke uden problemer at tildele den laveste GAF-score. Det kan give et forkert indtryk af både den overordnede mentale situation og den nuværende status; det højeste funktionsniveau bør ikke ses bort fra, da det kan forudsige resultatet. For eksempel kan det højeste funktionsniveau i mindst et par måneder i løbet af det sidste år være meget forudsigeligt for resultatet og indikere det potentielle funktionsniveau. Det er også blevet rapporteret, at det højeste funktionsniveau i det forløbne år kan være stærkt korreleret med det aktuelle niveau.
Hvis patienten ikke er godt beskrevet af hverken den højeste eller den laveste GAF i den sidste uge , kan en løsning være at bruge flere scores; for eksempel scoringer som højeste og laveste for det sidste år, det højeste og laveste patienten nogensinde har haft, eller scorer for når patienten er symptomatisk og asymptomatisk. Bedømmelse af gennemsnitlig funktion er også blevet foreslået, for eksempel det gennemsnitlige funktionsniveau i de foregående 3 uger. Hvis sådanne scores beskriver patienten godt, kan de tilføjes.
Internationalt er både single-scale og dual-scale GAF i brug. For GAF med en enkelt skala skal der ifølge manualen til DSM-IV-TR kun registreres en værdi, nemlig “alt efter hvad der er værst” af symptomerne og funktionsværdierne. Det antages, at GAF-S og GAF-F er sammenlignelige skalaer, så registrering af kun de mest alvorlige af GAF-S- og GAF-F-scores er i overensstemmelse med det generelle princip om at bruge den mest alvorlige tilstand som den samlede score; forskellen mellem de to skalaer ignoreres imidlertid, så det er ikke klart, hvilken faktor af symptomer og funktion der måles.Et alternativ kan være at registrere gennemsnittet af symptomer og funktionsniveauer, men dette rejser spørgsmålet om, hvorvidt symptomer og funktion har lige vægt eller ej, og vigtigheden af enhver vægtningseffekt. Selv om værdierne på hver skala kan være tætte, er symptomer og funktion forskellige aspekter af patientens tilstand, og de varierer ikke nødvendigvis sammen, så i nogle lande bruges en GAF med to skalaer, hvor både GAF-S og GAF-F registreres.
I den kliniske indstilling kan kommentarer tilføjes en GAF-score på, hvorfor en bestemt score blev valgt, hvilket kan være vigtigt, når andre overtager behandlingen. Det kan også have en pædagogisk effekt, tilføje mening til scoringerne og forbedre pålideligheden af inter-rater. Det ville dog være nyttigt, hvis retningslinjer indeholdt en norm for valg af score med mere detaljerede oplysninger om, hvilken score der skal registreres; dette er ikke en let opgave, da mental sygdom er et mangesidet og komplekst problem. At beslutte kriterierne for en sådan norm er problematisk.
Manglende viden
Det er vanskeligt at finde empirisk forskning med det formål at finde den rigtige GAF-værdi (laveste, højeste eller gennemsnitlige) eller kombination af GAF-værdier for at registrere for forskellige applikationer. De potentielle applikationer til GAF-scoring er vidt forskellige og inkluderer forskellige diagnostiske kategorier, kronisk og akut syg, behandlingsbeslutninger, forudsigelse eller måling af resultat, valg af plejeniveau og måling af sagsblanding. Der vides ikke meget om, hvilken score der giver den bedste inter-rater-pålidelighed og validitet, og det vides ikke, om separat GAF-S og GAF-F eller det laveste af de to scores er bedst til behandlingsbeslutninger og måling af resultatet, eller hvordan der skal tildeles meget vægt til GAF-S versus GAF-F for sådanne applikationer.
(5) Den finere gradering af skalaen
DSM-IV-TR, Veterans Administration og Norske retningslinjer har instruktioner til scoring inden for 10-punkts intervaller, men instruktionerne er begrænsede. Scoring inden for 10-punktsintervallerne er åben for subjektiv vurdering, og finere forskelle bliver let noget tilfældige. I praksis har klinikere en tendens til at score omkring decil- eller mid-decilinddelinger på skalaen. Patienter, der er scoret i det samme 10-punktsinterval, skal være relativt homogene i funktion, men funktion er en konstruktion med mange facetter, og når information for en mere nøjagtig score mangler, vælges mellemliggende scores i deciler.
Det er muligt, at mere detaljerede verbale instruktioner vil resultere i mere nøjagtige scores. Et alternativ til at have flere ankerpunkter er at bruge kategoriske skalaer til at score inden for 10-punktsintervallerne, i hvilket tilfælde ankerpunkterne (med nøgleord og eksempler på symptomer og funktionsgenstande) skal klassificeres. Både symptomer og funktion kan klassificeres på forskellige måder. En kategorisk skala kræver en beslutning om antallet af kategorier; sådanne skalaer har ofte fem kategorier, for eksempel: meget markeret, markeret, hverken markeret eller svag, svag eller meget svag. Antallet af andre kategorier end fem kan også overvejes. Mere erfarne ratere kan muligvis gøre mere skelne og score korrekt med flere kategorier, men scoring i klinikken udføres ofte af mennesker med forskellige uddannelsesmæssige baggrunde. En alternativ procedure til scoring inden for 10-punktsintervaller findes i den “modificerede GAF”, der bruger antallet af opfyldte kriterier: for eksempel for intervallet 41-50, når et kriterium er opfyldt, skal scoren være 48-50 og når to kriterier er opfyldt, skal det være 44-47.
Gap i viden
I GAF’s historie er systematisk arbejde med at forbedre scoringen inden for 10-punkts intervaller begrænset, og det er vides ikke, hvordan man bedst scorer inden for 10-punkts intervaller. Dette gælder også brugen af kategoriske skalaer til scoring, hvilket kræver overvejelser vedrørende karakteren og antallet af kategorier.
(6) Forskellige retningslinjer for forskellige forhold
Der kan være en enorm forskellen mellem de mentale tilstande hos forskellige patienter. Dog bruger en GAF-scoring med to skalaer to lige linjer (det vil sige, at et flerdimensionelt fænomen bliver scoret på en todimensional måde), hvilket muligvis ikke afspejler denne kompleksitet. Svaret på problemet er ikke nødvendigvis at have flere skalaer, der dækker forskellige aspekter af for eksempel at fungere, da dette ville kræve en mere kompleks scoringsproces. Men hvis retningslinjer for vurdering ikke er gode nok, reduceres værdien af et vurderingsinstrument. Det synes hensigtsmæssigt at overveje at udvikle retningslinjer for forskellige forhold.
Eksperter med hjælp fra empiriske data kan udvikle normer med intervaller af relevante GAF-værdier. Forståeligheden af forankringspunkter (med nøgleord og eksempler) for forskellige diagnosegrupper bør overvejes, og det ville være nyttigt at medtage eksempler på patienter, der blev scoret og ikke scoret i hvert decil.Pålideligheden af scoringer er ikke nødvendigvis den samme for alle diagnostiske grupper. For at sikre tildeling af den korrekte GAF-værdi kunne der gives rådgivning om, hvordan man får god information til hver patient (for eksempel hvilket psykiatrisk interview der skal bruges). For nogle diagnostiske grupper kan dette betyde at indsamle flere oplysninger end for andre. Retningslinjer skal have information om, hvordan man tager forskellige comorbide forhold i betragtning.
Hvis der forventes forskellige GAF-værdier for forskellige aldre og køn, skal dette bemærkes i retningslinjerne, men der er kun få oplysninger om dette. Forskellige funktionsnormer kan repræsentere forskellige basislinjer, som patienten evalueres mod, så f.eks. Bør instrumenter tilpasses til vurdering af ældre patienter, så de inkluderer score på demens og lykke ved livets afslutning. Retningslinjer kan også være forskellige i forskellige situationer, for eksempel for indlæggelse på indlæggelsesafdelinger og for samfundsstudier.
GAF bør score svækkelse på grund af mental tilstand, men effekten af somatisk og mental svækkelse kan være indbyrdes forbundet, og det kan være vanskeligt at skelne mellem dem. GAF-klassificeringen bør ikke påvirkes af overvejelser om prognose, tidligere diagnose, formodet karakter af den underliggende lidelse, eller om patienten modtager medicin eller anden form for hjælp.
Manglende viden
Der er begrænset empirisk information om egnetheden af eksisterende retningslinjer til forskellige tilstande, forskellige patientgrupper og patienter med flere andre egenskaber. Effekten af at tilpasse retningslinjer til disse variationer er ikke kendt. At have forskellige retningslinjer for symptomer og funktion har været lidt udforsket.
(7) Forskellige sprog og kulturer
GAF er blevet oversat til mange sprog, men sprog koder betydning på forskellige måder. Instrumenter skal tilpasses forskellige kulturer og sprog.
Folk fra forskellige kulturer kan svare på forskellige måder, når der stilles spørgsmål af en række årsager, og dette kan have konsekvenser for GAF-værdier. Det er vigtigt at forstå sygdomsforklaringer og hjælpesøgende adfærd inden for patienternes “kulturelle rammer, og patienter skal vurderes i forhold til, hvad der er” normalt “i deres egen kultur. Kulturelle faktorer kan være vigtige for holdning til uorden og brugen af GAF i multietniske samfund udfordrer vurderingen.
Sprogforskelle kan også give problemer; en patient kan være tydelig psykotisk, når han interviewes på deres eget sprog, men ikke når han interviewes på et fremmed sprog. Når det oversættes til andre sprog, retningslinjer for vurdering af GAF, interviews for vurdering af GAF og selve GAF (f.eks. forankringspunkter med nøgleord og eksempler) kan påvirkes. Oversættelse af vurderingsinstrumenter kan omfatte oversættelse, tilbageoversættelse, gennemgang og ændring, og der findes retningslinjer til oversættelse af tests og vurderingsinstrumenter.
Manglende viden
Man ved ikke meget om betydningen af oversættelse og kultur for GAF-guid elines. Sikkerheden ved internationale sammenligninger bør sættes i tvivl. Metaanalyser baseret på data fra lande med forskellige sprog og kulturer kan blive påvirket af disse forskelle.
Yderligere udvikling for GAF
Vi er langt fra at have et omfattende sæt heuristisk retningslinjer, der kan støtte vurdereren i udførelsen af scoringsprocessen, men der forventes fremskridt i studiet af vurderingsprocessen. Retningslinjer skal baseres på både teori og empirisk viden om, hvordan hver retningslinje fungerer i praksis. Udvikling af nye retningslinjer for GAF vil blive lettere ved først at gennemgå litteraturen om retningslinjer for psykologisk vurdering og udtrække relevante punkter. Ny empirisk forskning kan derefter udføres, for eksempel ved at udføre kvalitative undersøgelser af den faktiske score-proces, for at søge efter emner, der er relevante for retningslinjer, mens man tager i betragtning, at hvis scoringsprocessen gøres for kompleks, er der større sandsynlighed for, at fejl blive introduceret. Eksistensen af internationale retningslinjer vil understøtte implementeringen og anvendelsen af retningslinjerne i forskellige lande. Retningslinjer bør afspejle konsensus om praksis, og et udkast til nye retningslinjer for GAF bør derfor cirkuleres bredt for at give rig mulighed for kommentarer. En GAF-skala med nye retningslinjer bør også testes for pålidelighed og validitet for forskellige diagnoser, med forskellige målscorer, på tværs af forskellige steder og med forskellige patientpopulationer. For at studere effekterne af forskellige retningslinjer ville viden om “sande” værdier være nyttigt, og gennemsnitlige scores fra ekspertpaneler kan fungere som referencenormer.
Når man designer en norm til scoringsprocessen, er det vigtigt at overveje hvilken proces bedst kan nå målene.Det er vigtigt først at definere formålet med et scoringssystem. For eksempel skal et system, der hovedsageligt er beregnet til klinisk brug, betragtes af klinikere som fornuftigt og let at bruge. At have en kort version af retningslinjerne for klinikken og mere detaljerede retningslinjer for forskning kan imidlertid resultere i scores, der ikke er direkte sammenlignelige; evidensbaseret behandling er pr. definition baseret på forskning, og dette kan udgøre et problem for dets implementering.
En manual med mere information om GAF og scoring af GAF kunne også udvikles ved siden af retningslinjerne. Kravet om, at retningslinjer skal være korte og koncise, gør det nødvendigt at beslutte, hvilke oplysninger der skal gives i retningslinjerne, og hvilke i manualen. Manualen kan fungere som den vigtigste kilde til information og kan indeholde oplysninger om problemer i forbindelse med GAF, såsom historien om dens udvikling; det teoretiske grundlag omfanget af GAF under forskellige forhold GAF’s pålidelighed og gyldighed med forklaringer på problemer statistisk information for forskellige diagnostiske grupper (middelværdi, standardafvigelse, rækkevidde og statistisk fordeling, hvad enten den er normal eller skæv, og i hvilken retning) information om, hvilke metoder der skal bruges sammen med GAF (multimetodevaluering er almindelig); GAF-værdier sammenlignet med værdier fra andre metoder; implikationer af forskellige GAF-score for behandling med eksempler og tærskler for alvorlighedsværdier, der definerer, hvornår behandling er ønskelig; ledelsesanvendelse af GAF (for eksempel i planlægning og sammenligning af sagsblanding); vurdering af hold og enkeltpersoner brug af GAF til patienter med forskellige kulturelle og sproglige baggrunde; og træningsmateriale med beskrivelser af flere sager med tildelte GAF-værdier.
Computerisering af vurdering kan meget vel være fremtiden. Tildeling af scoringer kunne begynde med en synlig GAF-skala på skærmen, hvor placeringen af markøren forskellige steder langs skalaen afslører forskellige vinduer med information om kriterierne for scoring; ved at klikke med musen i et af disse vinduer kan blive endnu mere detaljerede oplysninger tilgængelige i et andet vindue. Brugen af elektroniske patientjournaler udgør en mulighed for nye kvalitetssikringsmetoder. Nogle diagnoser kan ikke kombineres med høje GAF-score; hvis en sådan diagnose er givet, kan en advarsel dukke op på skærmen, hvis der gives en GAF-score, der er for høj. Hvis der gives en lav GAF-S, kan en advarsel dukke op, hvis der gives en høj GAF-F. En påmindelse kan komme op, hvis den psykiatriske journal er udfyldt for en ny patient uden at have indtastet en GAF-score. Når der ikke er givet en GAF-score for en ambulant i de sidste 3 måneder, kan en påmindelse dukke op på skærmen. Computerbaseret scoring af GAF kan give høj sammenhæng med scoring baseret på klinisk indtryk, men vanskeligheder med computerassisteret vurdering antyder en række retningslinjer for brugerne. Den Internationale Testkommission har udviklet retningslinjer for computerbaseret og internetleveret test, men disse retningslinjer blev ikke udviklet med GAF i tankerne.
Arbejde med et scoringsinstrument er ikke komplet uden test eller pilotundersøgelse. Ændringer i scorprocessen er ikke nødvendigvis altid forbedringer, og der er behov for en pilotundersøgelse for at afsløre eventuelle yderligere ændringer, der er nødvendige.