4 systemovervågningsværktøjer til Linux

Information er nøglen til at løse ethvert computerproblem, herunder problemer med eller relateret til Linux og den hardware, den kører på. Der er mange tilgængelige værktøjer til og inkluderet i de fleste distributioner, selvom de ikke alle er installeret som standard. Disse værktøjer kan bruges til at få enorme mængder information.

Denne artikel diskuterer nogle af de interaktive kommandolinjegrænseflader (CLI) -værktøjer, der leveres med, eller som let kan installeres på Red Hat-relaterede distributioner, herunder Red Hat Enterprise Linux, Fedora, CentOS og andre derivatdistributioner. Selvom der findes GUI-værktøjer, og de tilbyder god information, leverer CLI-værktøjerne alle de samme oplysninger, og de er altid anvendelige, fordi mange servere ikke har en GUI-grænseflade, men alle Linux-systemer har en kommandolinjegrænseflade.

Denne artikel koncentrerer sig om de værktøjer, som jeg typisk bruger. Hvis jeg ikke dækkede dit yndlingsværktøj, så tilgiv mig, og lad os alle vide, hvilke værktøjer du bruger, og hvorfor i kommentarfeltet.

Min gå til værktøjer til problembestemmelse i et Linux-miljø er næsten altid systemovervågningsværktøjer. For mig er disse top, top, htop og blik.

Alle disse værktøjer overvåger CPU og hukommelsesforbrug, og de fleste af dem viser i det mindste oplysninger om kørende processer. Nogle overvåger også andre aspekter af et Linux-system. Alle giver næsten realtidsvisninger af systemaktivitet.

Belastningsgennemsnit

Før jeg fortsætter med at diskutere overvågningsværktøjerne, er det vigtigt at diskutere belastningsgennemsnit mere detaljeret.

Belastningsgennemsnit er et vigtigt kriterium for måling af CPU-forbrug, men hvad betyder det virkelig, når jeg siger, at 1 (eller 5 eller 10) minuts gennemsnitsbelastning er f.eks. 4,04? Belastningsgennemsnit kan betragtes som et mål for efterspørgslen efter CPU; det er et tal, der repræsenterer det gennemsnitlige antal instruktioner, der venter på CPU-tid. Så dette er et sandt mål for CPU-ydeevne, i modsætning til standard “CPU-procent”, der inkluderer I / O-ventetider, hvor CPU’en ikke rigtig fungerer.

For eksempel en fuldt udnyttet CPU med en enkelt processor ville have et belastningsgennemsnit på 1. Dette betyder, at CPU’en følger nøjagtigt med efterspørgslen; med andre ord har den perfekt udnyttelse. Et belastningsgennemsnit på mindre end en betyder, at CPU’en er underudnyttet, og et belastningsgennemsnit på mere end 1 betyder, at CPU’en er overudnyttet, og at der er opdæmpet, utilfredsstillende efterspørgsel. For eksempel angiver et belastningsgennemsnit på 1,5 i et enkelt CPU-system, at en tredjedel af CPU-instruktionerne er tvunget til at vente på at blive udført, indtil den foregående er afsluttet.

Dette gælder også for flere processorer. Hvis et 4 CPU-system har et belastningsgennemsnit på 4, har det perfekt udnyttelse. Hvis den f.eks. Har et belastningsgennemsnit på 3,24, er tre af dens processorer fuldt udnyttede, og en bruges på cirka 76%. I eksemplet ovenfor har et 4 CPU-system et belastningsgennemsnit på 1 minut på 4,04, hvilket betyder, at der ikke er nogen resterende kapacitet blandt de 4 CPU’er, og et par instruktioner er tvunget til at vente. Et perfekt anvendt 4 CPU-system ville vise et belastningsgennemsnit på 4,00, så systemet i eksemplet er fuldt belastet, men ikke overbelastet.

Den optimale betingelse for belastningsgennemsnit er, at det svarer til det samlede antal CPU’er i et system. Det vil betyde, at hver CPU er fuldt udnyttet, og alligevel må ingen instruktioner tvinges til at vente. De længerevarende belastningsgennemsnit giver en indikation af den samlede udnyttelsestendens.

Linux Journal har en fremragende artikel, der beskriver belastningsgennemsnit, teorien og matematikken bag dem, og hvordan man fortolker dem i 1. december 2006 udgave.

Signaler

Alle de her beskrevne skærme giver dig mulighed for at sende signaler til kørende processer. Hver af disse signaler har en bestemt funktion, selvom nogle af dem kan defineres af det modtagende program ved hjælp af signalhåndterere.

Den separate kill-kommando kan også bruges til at sende signaler til processer uden for monitorerne. Drab-l kan bruges til at liste alle mulige signaler, der kan sendes. Tre af disse signaler kan bruges til at dræbe en proces.

  • SIGTERM (15): Signal 15, SIGTERM er standardsignalet, der sendes af toppen og de andre skærme, når der trykkes på k-tasten. Det kan også være det mindst effektive, fordi programmet skal have en signalbehandler indbygget i det. Programmets signalbehandler skal opfange indkommende signaler og handle i overensstemmelse hermed. Så for scripts, hvoraf de fleste ikke har signalhåndterere, ignoreres SIGTERM. Ideen bag SIGTERM er, at ved blot at fortælle programmet, at du vil have det til at afslutte sig selv, det vil drage fordel af det og rydde op i ting som åbne filer og derefter afslutte sig selv på en kontrolleret og pæn måde.
  • SIGKILL (9): Signal 9, SIGKILL giver et middel til at dræbe selv de mest modstridende programmer , inklusive scripts og andre programmer, der ikke har nogen signalhåndterere.For scripts og andre programmer uden signalhåndterer dræber det ikke kun det kørende script, men det dræber også shell-sessionen, hvor scriptet kører; dette er muligvis ikke den adfærd, du ønsker. Hvis du vil dræbe en proces, og du er ligeglad med at være god, er dette det signal, du ønsker. Dette signal kan ikke opfanges af en signalbehandler i programkoden.
  • SIGINT (2): Signal 2, SIGINT kan bruges, når SIGTERM ikke fungerer, og du ønsker, at programmet skal dø lidt pænere, fx uden at dræbe shell-sessionen, hvor den kører. SIGINT sender en afbrydelse til den session, hvor programmet er kører. Dette svarer til at afslutte et kørende program, især et script, med Ctrl-C-tastekombinationen.

For at eksperimentere med dette skal du åbne en terminalsession og oprette en fil i / tmp navngivet cpuHog og gør det eksekverbart med tilladelserne rwxr_xr_x. Føj følgende indhold til filen.

#!/bin/bash# This little program is a cpu hogX=0;while ;do echo $X;X=$((X+1));done

Åbn en anden terminalsession i et andet vindue, placer dem ved siden af til hinanden, så du kan se resultaterne og løbe øverst i den nye session. Kør cpuHog-programmet med følgende kommando:

Dette program tæller simpelthen op med en og udskriver den aktuelle værdi af X til STDOUT. Og det suger op CPU-cyklusser. Den terminalsession, hvor cpuHog kører, skal vise en meget høj CPU-brug øverst. Overhold den virkning dette har på systemets ydeevne i toppen. CPU-brug skal straks gå langt op, og belastningsgennemsnittene skal også begynde at stige over tid. Hvis du vil, kan du åbne yderligere terminalsessioner og starte cpuHog-programmet i dem, så du har flere forekomster, der kører.

Bestem PID for det cpuHog-program, du vil dræbe. Tryk på k-tasten og se på meddelelsen under swap-linjen nederst i oversigtssektionen. Top beder om PID for den proces, du vil dræbe. Indtast denne PID, og tryk på Enter. Nu beder top om signalnummeret og viser standardværdien på 15. Prøv hvert af de signaler, der er beskrevet her, og følg resultaterne.

4 open source-værktøjer til Linux-systemovervågning

En af de første værktøjer, jeg bruger, når jeg udfører problembestemmelse, er top. Jeg kan godt lide det, fordi det har eksisteret siden evigt og altid er tilgængeligt, mens de andre værktøjer muligvis ikke er installeret.

Topprogrammet er et meget kraftfuldt værktøj, der giver en masse information om dit kørende system. Dette inkluderer data om hukommelsesforbrug, CPU-belastninger og en liste over kørende processer inklusive mængden af CPU-tid og hukommelse, der bruges af hver proces. Top viser systemoplysninger i næsten realtid og opdateres (som standard) hvert tredje sekund. Fraktionerede sekunder er tilladt af toppen, selvom meget små værdier kan lægge en betydelig belastning på systemet. Det er også interaktivt, og de datakolonner, der skal vises, og sorteringskolonnen kan ændres.

Et eksempel på output fra det øverste program er vist i figur 1 nedenfor. Outputtet fra toppen er opdelt i to sektioner, der kaldes “resume” sektionen, som er den øverste sektion af outputtet, og “proces” sektionen, som er den nedre del af output; Jeg vil bruge denne terminologi til top, top, htop og blik af interesse for konsistens.

Topprogrammet har et antal nyttige interaktive kommandoer, du kan bruge til at styre visning af data og til at manipulere individuelle processer . Brug h-kommandoen til at få vist en kort hjælpeside for de forskellige interaktive kommandoer. Sørg for at trykke på h to gange for at se begge sider af hjælp. Brug kommandoen q til at afslutte.

Resume sektion

Resumé sektionen af output fra toppen er en oversigt over systemets status. Den første linje viser systemets oppetid og gennemsnittet for belastning på 1, 5 og 15 minutter. I eksemplet nedenfor er belastningsgennemsnittene henholdsvis 4,04, 4,17 og 4,06.

Den anden linje viser antallet af processer, der aktuelt er aktive, og status for hver.

Linjerne, der indeholder CPU-statistikker vises derefter. Der kan være en enkelt linje, der kombinerer statistikken for alle CPU’er til stede i systemet, som i eksemplet nedenfor, eller en linje for hver CPU; i tilfælde af computeren, der er brugt til eksemplet, er dette en enkelt quad-core CPU. Tryk på 1-tasten for at skifte mellem den konsoliderede visning af CPU-brug og visningen af de enkelte CPU’er. Dataene i disse linjer vises som procentdele af den samlede tilgængelige CPU-tid.

Disse og de andre felter for CPU-data er beskrevet nedenfor.

  • us: userpace – Applications og andre programmer, der kører i brugerrummet, dvs. ikke i kernen.
  • sy: systemopkald – funktioner på kerneniveau. Dette inkluderer ikke CPU-tid, som selve kernen tager, kun kernesystemet kalder.
  • ni: nice – Processer, der kører på et positivt pænt niveau.
  • id: inaktiv – Inaktiv tid, dvs. tid, der ikke bruges af nogen kørende proces.
  • wa: vent – CPU-cyklusser, der bruges på at vente på, at I / O skal forekomme. Dette er spildt CPU-tid.
  • hej: hardwareafbrydelser – CPU-cyklusser, der bruges på at håndtere hardwareafbrydelser.
  • si: softwareafbrydelser – CPU-cyklusser brugt på at håndtere softwareskabte afbrydelser som sådan som systemopkald.
  • st: stjæletid – Procentdelen af CPU-cyklusser, som en virtuel CPU venter på en rigtig CPU, mens hypervisoren servicerer en anden virtuel processor.

De sidste to linjer i oversigtsafsnittet er hukommelsesforbrug. De viser den fysiske hukommelsesforbrug inklusive både RAM og swap-plads.


Figur 1: Den øverste kommando, der viser en fuldt udnyttet 4-core CPU.

Du kan bruge kommandoen 1 til at vise CPU-statistik som et enkelt, globalt tal som vist i figur 1 ovenfor eller som en enkelt CPU. Kommandoen l slår belastningsgennemsnit til og fra. Kommandoerne t og m roterer henholdsvis proces- / CPU- og hukommelseslinjerne i oversigtssektionen gennem fra, kun tekst og et par typer søjlediagramformater.

Processektion

Processektionen i output fra toppen er en oversigt over de kørende processer i systemet – i det mindste for antallet af processer, som der er plads til på terminalens display. Standardkolonnerne, der vises øverst, er beskrevet nedenfor. Flere andre kolonner er tilgængelige, og hver kan normalt tilføjes med et enkelt tastetryk. Se den øverste mandside for detaljer.

  • PID – proces-id’et.
  • BRUGER – brugernavnet til procesindehaveren.
  • PR – Processens prioritet.
  • NI – Det fine antal af processen.
  • VIRT – Den samlede mængde virtuel hukommelse, der er allokeret til processen.
  • RES – Resident størrelse (i kb, medmindre andet er angivet) af ikke-byttet fysisk hukommelse, der forbruges af en proces.
  • SHR – Mængden af delt hukommelse i kb, der bruges af processen.
  • S – Status for processen. Dette kan være R til løb, S for at sove og Z for zombie. Mindre hyppigt sete status kan være T for spores eller stoppes, og D for uafbrydelig søvn.
  • % CPU – Procentdelen af CPU-cyklusser eller tid brugt af denne proces i den sidst målte tidsperiode.
  • % MEM – Procentdelen af fysisk systemhukommelse, der bruges af processen.
  • TIME + – Samlet CPU-tid til 100 sekunder af processen, der er forbrugt af processen siden processen blev startet.
  • KOMMANDO – Dette er den kommando, der blev brugt til at starte processen.

Brug Page Up og Page Down tasterne til at rulle gennem listen over kørende processer. D- eller s-kommandoerne er udskiftelige og kan bruges til at indstille forsinkelsesintervallet mellem opdateringer. Standard er tre sekunder, men jeg foretrækker et interval på et sekund. Intervallgranularitet kan være så lav som en tiendedel (0,1) af et sekund, men dette vil forbruge flere af de CPU-cyklusser, du prøver at måle.

Du kan bruge < og > taster for at rækkefølge sorteringskolonnen til venstre eller højre.

Kommandoen k bruges til at dræbe en proces eller kommandoen r til fortryde det. Du skal kende proces-id (PID) for den proces, du vil dræbe eller nægte, og disse oplysninger vises i procesafsnittet i den øverste skærm. Når du dræber en proces, beder top først om PID og derefter om signalnummeret, der skal bruges til at dræbe processen. Indtast dem, og tryk på enter-tasten efter hver. Start med signal 15, SIGTERM, og hvis det ikke dræber processen, skal du bruge 9, SIGKILL.

Konfiguration

Hvis du ændrer den øverste skærm, kan du bruge W (i store bogstaver) kommando til at skrive ændringerne til konfigurationsfilen ~ / .toprc i dit hjemmekatalog.

ovenpå

Jeg kan også godt lide ovenpå. Det er en fremragende skærm at bruge, når du har brug for flere detaljer om den type I / O-aktivitet. Standard opdateringsintervallet er 10 sekunder, men dette kan ændres ved hjælp af kommandoen interval i til det, der passer til det, du prøver at gøre. ovenpå kan ikke opdateres med intervaller på under et sekund som den øverste kan.

Brug kommandoen h til at få vist hjælp. Sørg for at bemærke, at der er flere sider med hjælp, og du kan bruge mellemrumstasten til at rulle ned for at se resten.

En god funktion ved ovenpå er, at den kan gemme rå ydeevnedata til en fil og afspil det derefter senere for nøje inspektion. Dette er praktisk til at spore intermitterende problemer, især dem, der opstår i tider, hvor du ikke direkte kan overvåge systemet. Atopsar-programmet bruges til at afspille dataene i den gemte fil.

.
Figur 2: Systemet på toppen giver information om disk og netværksaktivitet ud over CPU- og procesdata.

Resume sektion

ovenpå indeholder meget af de samme oplysninger som top, men viser også oplysninger om netværk, rå disk og logisk volumenaktivitet. Figur 2 ovenfor viser disse yderligere data i kolonnerne øverst på skærmen.Bemærk, at hvis du har den vandrette skærm fast ejendom til at understøtte en bredere skærm, vises der yderligere kolonner. Omvendt, hvis du har mindre vandret bredde, vises der færre kolonner. Jeg kan også godt lide, at oven viser den aktuelle CPU-frekvens og skaleringsfaktor – noget jeg ikke har set på nogen anden af disse skærme – på anden linje i de to højre kolonner i figur 2.

Processektion

Ovenstående procesdisplay inkluderer nogle af de samme kolonner som for toppen, men det inkluderer også disk I / O-information og trådantal for hver proces samt virtuel og reel hukommelsesvækststatistik for hver proces. Som med oversigtsafsnittet vises yderligere kolonner, hvis der er tilstrækkelig vandret skærm fast ejendom. For eksempel vises i figur 2 RUID (Real User ID) for proceseejeren. Udvidelse af displayet viser også EUID (Effektiv bruger-ID), som kan være vigtigt, når programmer kører SUID (Set User ID).

ovenpå kan også give detaljerede oplysninger om disk-, hukommelses-, netværks- og planlægningsoplysninger for hver proces. Tryk bare på henholdsvis d, m, n eller s for at se disse data. G-tasten returnerer displayet til det generiske procesdisplay.

Sortering kan let udføres ved at bruge C til at sortere efter CPU-brug, M til hukommelsesforbrug, D til diskbrug, N til netværksbrug og A for automatisk sortering. Automatisk sortering sorterer normalt processer efter den mest travle ressource. Netværksforbruget kan kun sorteres, hvis netatop-kernemodulet er installeret og indlæst.

Du kan bruge k-tasten til at dræbe en proces, men der er ingen mulighed for at nægte en proces.

Som standard vises net- og diskenheder, for hvilke der ikke forekommer aktivitet i et givet tidsinterval. Dette kan føre til forkerte antagelser om værts hardwarekonfiguration. F-kommandoen kan bruges til at tvinge ovenpå til at vise de inaktive ressourcer.

Konfiguration

Atop man-siden refererer til globale konfigurationsfiler på brugerniveauer, men ingen kan findes i min egne Fedora- eller CentOS-installationer. Der er heller ingen kommando til at gemme en ændret konfiguration, og en gemning finder ikke sted automatisk, når programmet afsluttes. Så der ser ud til at være en måde at gøre konfigurationsændringerne permanent på.

htop

Htop-programmet ligner meget top men på steroider. Det ser meget ud som toppen, men det giver også nogle muligheder, som toppen ikke gør. I modsætning til oven indeholder den dog ingen disk-, netværks- eller I / O-oplysninger af nogen art.

Figur 3: htop har pæne søjlediagrammer til at angive ressourceforbrug, og det kan vise procestræet.

Resume sektion

Resume sektionen af htop vises i to kolonner. Det er meget fleksibelt og kan konfigureres med flere forskellige typer oplysninger i stort set enhver rækkefølge, du kan lide. Selvom CPU-brugssektionerne øverst og ovenpå kan skiftes mellem en kombineret skærm og en skærm, der viser et søjlediagram for hver CPU, kan htop ikke. Så det har en række forskellige muligheder for CPU-displayet, herunder en enkelt kombineret bjælke, en bjælke for hver CPU og forskellige kombinationer, hvor specifikke CPU’er kan grupperes i en enkelt bjælke.

Jeg tror dette er en renere oversigtsvisning end nogle af de andre systemmonitorer, og det er lettere at læse. Ulempen ved dette resumé er, at nogle oplysninger ikke er tilgængelige på htop, der er tilgængelige på de andre skærme, såsom CPU-procentdele efter bruger, inaktivitet og systemtid.

F2 (Setup) -tasten er bruges til at konfigurere resume sektionen af htop. En liste over tilgængelige datavisninger vises, og du kan bruge funktionstasterne til at føje dem til venstre eller højre kolonne og flytte dem op og ned inden for den valgte kolonne.

Processektion

Procesafsnittet på htop ligner meget det øverste. Som med de andre skærme kan processer sorteres efter en eller flere faktorer, herunder CPU- eller hukommelsesforbrug, bruger eller PID. Bemærk, at sortering ikke er mulig, når trævisningen er valgt.

F6-tasten giver dig mulighed for at vælge sorteringskolonnen; det viser en liste over de kolonner, der er tilgængelige til sortering, og du vælger den ønskede kolonne og trykker på Enter-tasten.

Du kan bruge pil op og pil ned til at vælge en proces. For at dræbe en proces skal du bruge pil op og pil ned for at vælge målprocessen og trykke på k-tasten. En liste over signaler til afsendelse af processen vises med 15, SIGTERM, valgt. Du kan specificere det signal, der skal bruges, hvis det er forskelligt fra SIGTERM. Du kan også bruge F7- og F8-tasterne til at nægte den valgte proces.

En kommando, som jeg især kan lide, er F5, som viser de kørende processer i et træformat, hvilket gør det nemt at bestemme forældre / barn-forholdet til at køre processer.

Konfiguration

Hver bruger har sin egen konfigurationsfil ~ / .config / htop / htoprc, og ændringer i htop-konfigurationen gemmes der automatisk.Der er ingen global konfigurationsfil til htop.

blik

Jeg har lige for nylig lært om blik, som kan vise mere information om din computer end nogen af de andre skærme, jeg kender i øjeblikket med. Dette inkluderer disk- og netværks-I / O, termiske aflæsninger, der kan vise CPU- og andre hardwaretemperaturer samt blæserhastigheder, og diskbrug efter hardwareenhed og logisk volumen.

Ulempen ved at have alle disse oplysninger er, at blik bruger en betydelig mængde CPU, der resurces sig selv. På mine systemer finder jeg, at det kan bruge fra ca. 10% til 18% af CPU-cyklusser. Det er meget, så du skal overveje den indflydelse, når du vælger din skærm.

Resume sektion

Resumé sektionen af blik indeholder de fleste af de samme oplysninger som resumé sektionerne for de andre skærme. Hvis du har nok vandret skærm fast ejendom, kan det vise CPU-brug med både et søjlediagram og en numerisk indikator, ellers viser det kun tallet.


Figur 4: Oversigtsgrænsefladen med netværk, disk, filsystem og sensorinformation.

Jeg kan godt lide denne oversigtsdel bedre end de andre skærme; Jeg tror, det giver de rigtige oplysninger i et let forståeligt format. Som med top og htop kan du trykke på 1-tasten for at skifte mellem en visning af de enkelte CPU-kerner eller en global med alle CPU-kernerne som et enkelt gennemsnit som vist i figur 4 ovenfor.

Procesafsnit

Procesafsnittet viser standardoplysningerne om hver af de kørende processer. Processer kan sorteres automatisk a, eller ved CPU c, hukommelse m, navn p, bruger u, I / O-hastighed i eller tid t. Når der automatisk sorteres sorteres processer først efter den mest anvendte ressource.

Blik viser også advarsler og kritiske alarmer helt nederst på skærmen, inklusive tidspunktet og varigheden af begivenheden. Dette kan være nyttigt, når du forsøger at diagnosticere problemer, når du ikke kan stirre på skærmen i timevis ad gangen. Disse alarmlogfiler kan slås til eller fra med l-kommandoen, advarsler kan ryddes med w-kommandoen, mens alarmer og advarsler alle kan ryddes med x.

Det er interessant, at blik er den eneste af disse skærme, der hverken kan bruges til at dræbe eller afvise en proces. Det er strengt ment som en skærm. Du kan bruge de eksterne kill og renice-kommandoer til at manipulere processer.

Sidebjælke

Glances har et meget flot sidebjælke, der viser information, der ikke er tilgængelig i top eller htop. Atop viser nogle af disse data, men blik er den eneste skærm, der viser sensordataene. Nogle gange er det rart at se temperaturen inde i computeren. De enkelte moduler, disk, filsystem, netværk og sensorer kan tændes og slukkes ved hjælp af henholdsvis d, f, n og s kommandoerne. Hele sidebjælken kan skiftes ved hjælp af 2.

Docker-statistik kan vises med D.

Konfiguration

Blik kræver ikke, at en konfigurationsfil fungerer korrekt. Hvis du vælger at have en, vil konfigurationsfilens systemomfattende forekomst være placeret i /etc/glances/glances.conf. Individuelle brugere kan have en lokal forekomst på ~ / .config / glances / glances.conf, som tilsidesætter den globale konfiguration. Det primære formål med disse konfigurationsfiler er at indstille tærskler for advarsler og kritiske alarmer. Der er ingen måde, jeg kan finde andre konfigurationsændringer – såsom sidepanelmoduler eller CPU-skærme – på permanent. Det ser ud til, at du skal omkonfigurere disse emner, hver gang du starter et blik.

Der er et dokument /usr/share/doc/glances/glances-doc.html, der giver en masse information om brug af kigger, og det står udtrykkeligt, at du kan bruge konfigurationsfilen til at konfigurere, hvilke moduler der vises. Imidlertid beskriver hverken de givne oplysninger eller eksemplerne, hvordan man gør det.

Konklusion

Sørg for at læse mandsiderne for hver af disse skærme, fordi der er en stor mængde oplysninger om konfiguration og interaktion med dem. Brug også h-tasten til hjælp i interaktiv tilstand. Denne hjælp kan give dig information om at vælge og sortere datakolonnerne, indstille opdateringsintervallet og meget mere.

Disse programmer kan fortælle dig meget, når du leder efter årsagen til et problem. De kan fortælle dig, hvornår en proces, og hvilken, suger CPU-tid, om der er nok ledig hukommelse, om processer er gået i stå, mens de venter på, at I / O, f.eks. Disk- eller netværksadgang, er afsluttet og meget mere.

Jeg anbefaler stærkt, at du bruger tid på at se disse overvågningsprogrammer, mens de kører på et system, der fungerer normalt, så du vil være i stand til at skelne mellem de ting, der kan være unormale, mens du leder efter årsagen til et problem.

Du skal også være opmærksom på, at brugen af disse overvågningsværktøjer ændrer systemets brug af ressourcer inklusive hukommelse og CPU-tid.top, og de fleste af disse skærme bruger måske 2% eller 3% af et systems CPU-tid. blik har meget større indflydelse end de andre og kan bruge mellem 10% og 20% af CPU-tiden. Sørg for at overveje dette, når du vælger din værktøjer.

Jeg havde oprindeligt til hensigt at medtage SAR (System Activity Reporter) i denne artikel, men da denne artikel blev længere, blev det også klart for mig, at SAR er væsentligt forskellig fra disse overvågningsværktøjer og fortjener at have en separat artikel. Så med det i tankerne planlægger jeg at skrive en artikel om SAR og / proc-filsystemet og en tredje artikel om, hvordan man bruger alle disse værktøjer til at finde og løse problemer.

Write a Comment

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *