[foreløbig slut på denne tråd]Hvad kan være orsagen til at computeren genstarter
Jeg har en computer der 1 uger over 3 år. Jeg opledede tier og tier at den genstatede. Den var så op hos mm vision imellem jul og nytår inden 3 års garantien udløb,
Det skal siges at den altid har kørt Linux. De installerede vindows og gennegik alle de test der findes og der genstrtede den ikke? siger de. Den kørte i 48 timer.
Jeg læste min backup ind med Garuda Linux. Men den genstartede stadigvæk med 5 minturs interval og op til 2 timer.
Jeg har også prøvet at installere Manjaro og MX linux. Men desvære med samme resultat. Er der nogle forslag på hvad der kanvære galt.
Det skal siges at den altid har kørt Linux. De installerede vindows og gennegik alle de test der findes og der genstrtede den ikke? siger de. Den kørte i 48 timer.
Jeg læste min backup ind med Garuda Linux. Men den genstartede stadigvæk med 5 minturs interval og op til 2 timer.
Jeg har også prøvet at installere Manjaro og MX linux. Men desvære med samme resultat. Er der nogle forslag på hvad der kanvære galt.
Kommentarer50
Står der noget i /var/log
Nu er den lige stillet til
Så der er prøvet meget, så jeg kan ikke se at det skulle være noget kernel panic, der opstår pga. noget driverrelateret.
Når jeg har prøvet forskillige distroes. Det må være noget andet.
Jeg har også kørt Smartctl og efterfølgende:
sudo smartctl -l error /dev/nvme0n1
og uden fejl
Prøv evt. at åbne en
dmesg -w
Kernen må brokke sig over fejlen.
Du kan sikkert filme forløbet, med et web-cam.
Det kunne lyde som en termisk, fejl i et komponent.
Den kører endnu: jeg
Den kører endnu: jeg vender tilbage med rsultatet når den er færdig. Det tager åbenbar lang tid
Den kører endnu: jeg
Den kører endnu: jeg vender tilbage med rsultatet når den er færdig. Det tager åbenbar lang tid
Nu prøver jeg lidt ud af
Har du prøvet, at pille grafikkortet ud og ladet maskinen køre i meget lang tid, for at se, om den stadig genstarter?
Har du prøvet, at rense maskinen for støv?
Tjek, om alle dele sidder rigtigt i deres forbindelser inde i kabinettet. En enkelt løs del, kan medføre genstart.
Prøv lige hukommelsestest
Nu prøver jeg lidt ud
Har du prøvet, at pille grafikkortet ud og ladet maskinen køre i meget lang tid, for at se, om den stadig genstarter?
Har du prøvet, at rense maskinen for støv?
Tjek, om alle dele sidder rigtigt i deres forbindelser inde i kabinettet. En enkelt løs del, kan medføre genstart.
Det er alsammen afprøvet og lavet hos mm vision
Prøv lige
Ja det var det første jeg har afprøvet her kørte den i 10 1/2 time med 4 test unden at lukke ned og genstarte og der fortalte at der okke var nogle error
dmesg -wKernel command
Kernel command line: BOOT_IMAGE=/@/boot/vmlinuz-linux-zen root=UUID=5078a506-c0e0-4d44-84e9-03d20542a3c1 rw rootflags=subvol=@ quiet quiet splash rd.udev.log_priority=3 vt.global_cursor_default=0 loglevel=3 ibt=off
[ 0.101354] Unknown kernel command line parameters "splash BOOT_IMAGE=/@/boot/vmlinuz-linux-zen", will be passed to user space.
Memory: 65586620K/66954448K available (18439K kernel code, 2152K rwdata, 10996K rodata, 2156K init, 3188K bss, 1367568K reserved, 0K cma-reserved)
.285792] DMA: preallocated 4096 KiB GFP_KERNEL pool for atomic allocations
[ 0.286004] DMA: preallocated 4096 KiB GFP_KERNEL|GFP_DMA pool for atomic allocations
[ 0.286220] DMA: preallocated 4096 KiB GFP_KERNEL|GFP_DMA32 pool for atomic allocation
Loaded X.509 cert 'Build time autogenerated kernel key: 09a414196e54429380051946fda2bf80af9b4c50'
1.080634] Freeing unused kernel image (initmem) memory: 2156K
[ 1.083922] Write protecting the kernel read-only data: 32768k
[ 1.085278] Freeing unused kernel image (text/rodata gap) memory: 2040K
[ 1.085887] Freeing unused kernel image (rodata/data gap) memory: 1292K
2.919934] [drm] amdgpu kernel modesetting enabled.
2.983004] [drm] radeon kernel modesetting enabled.
4.387519] systemd[1]: Listening on udev Kernel Socket.
4.388832] systemd[1]: Mounting Kernel Debug File System...
4.389278] systemd[1]: Mounting Kernel Trace File System...
4.390725] systemd[1]: Starting Load Kernel Module configfs...
4.391198] systemd[1]: Starting Load Kernel Module drm...
4.391652] systemd[1]: Starting Load Kernel Module fuse...
4.393066] systemd[1]: Starting Load Kernel Modules...
4.393493] systemd[1]: Starting Remount Root and Kernel File Systems...
4.394881] systemd[1]: Mounted Kernel Debug File System.
4.394968] systemd[1]: Mounted Kernel Trace File System.
4.411144] vboxdrv: loading out-of-tree module taints kernel.
4.411255] .(fejl her) vboxdrv: module verification failed: signature and/or required key missing - tainting kernel
4.414969] systemd[1]: Finished Load Kernel Module configfs.
Men fejlen skulle jo ikke betyde noget?
4.411255] .(fejl her) vboxdrv: module verification failed: signature and/or required key missing - tainting kernel
Hmm.. Hvad med at
-
Jeg ser du kører med zen-kernen. Den kan i teorien godt til tider være ustabil. Har du prøvet en generisk kerne, og set om det ændrer noget?
Gammel maskine skal have
Jeg ser du kører med
Ja men jeg kan også vælge lts kerne 5.15 ved opstart og her er det samme problem
Gammel maskine skal
Gammeæ og gammel 3 år 0g 14 dage. Er det gammel. UFI (BIOS) er også opdatret til nyeste version
#2: Her kørte jeg med PClinuxOS der genstartede den cirka hver 14 dag. Siden har jeg kørte jeg med manjaro og FreeBSD og Pop!_OS og sidst Garuda Linux hvor de var det samme.
Jeg hælder til vbox
Ellers tror jeg simpelthen det er strømforsyningen. Men det forklarer jo på ingen måde, at MM-Vision godt kunne have den kørende, uden det skete.
Noget må du gøre anderledes, end de gør. Hvad, kan være meget svært at vide.
Jeg hælder til vbox
Ja men det lyder mærkeligt fordi
Her kørte jeg med PClinuxOS der genstartede den cirka hver 14 dag. Siden har jeg kørte jeg med manjaro og FreeBSD og Pop!_OS og sidst Garuda Linux hvor de var det samme.
Og jeg glemte og MX Linux er afprøvet med samme resultat uden at Virtualbox er installeret
Når du bruger andre
Når du bruger andre distros, er det så med samme homedir, dvs dit rigtige home? Hvis ja, så ville jeg nok også prøve med en spritny konto/homedir.
Nej når jeg
Nej når jeg installerer bliver harddisk slettet og der oprettes nye partioner
Og ud over det, så har
Skrivebordssession, samt . filer er brugerens indstillinger. Det har intet med systemet at gøre.
Glibc derimod, samt toolchain… /sys, /usr, /lib osv. De er kritiske.
-
Men jeg tror heller ikke det er VirtualBox, - studsede bare over den postboot besked. Men jeg tror ikke der er noget i det.
Derimod er vi på bar bund nu, når MM-Vision kunne køre den uden den genstartede.
Skrivebordssession,
He he. Ja sådan skulle det være. Men et autostartet program der er gået grassat og har brugt al ram er fælt. Tro mig ;-)
Men et autostartet program
Kernens OOM killer sætter ind før det går sådan. Tro mig ;-)
Det er rigtigt, at den ikke altid fungerer perfekt, - det var bl.a. derfor systemd-oomd blev implementeret.
Derimod er vi på bar
Jamen - deres test er ikke ok! QED.
I hvert fald er deres test
Umiddelbart synes jeg det lyder som en varmeting, så måske noget med noget varmeledende pasta, der er størknet, el.lign. Jeg har ikke selv erfaring med det, men måske du kan bruge nogle af tipsene herfra, til at holde øje med, om temperaturen bliver for høj:
https://www.geeksforgeeks.org/how-to-monitor-cpu-and-gpu-temperature-in…
I hvert fald er deres
Fordi de installerede Windows fordi det er de testprogrammer der bruger for at teste maskinen. Det blev selvfølgelig slettet da jeg fik masikenen tilbage.
#22: Umiddelbart synes jeg det lyder som en varmeting, så måske noget med noget varmeledende pasta, der er størknet, el.lign. Jeg har ikke selv erfaring med det, men måske du kan bruge nogle af tipsene herfra, til at holde øje med, om temperaturen bliver for høj:
Dem du foreslår har jeg også afprøvet.
Computeren kan også finde på at genstarte lige efter at jeg er logget ind.
Det bliver jo nok til at jeg
Jeg har kig på den her:
https://abook.dk/adeskbusiness/
https://www.computerworld.dk/art/280019/test-adesk-business-naar-du-ikk…
De er ved at undersøge om den kan køre med Linux hos Gigabyte
RAM kredse
Prøv at fjerne en efter en for at se om de fejler eller køb nye som passer til computeren og bundkortet.
Kernens OOM killer
#26: Kernens OOM killer sætter ind før det går sådan. Tro mig ;-)
Nu er det sådan at konkret erfaring belaster og modvirker tro. OOM killer er som regel nok, men kan være utilstrækkelig.
User is offlineRAM
Den mest sandsynlige årsag kan være RAM-kredse der fejler.
Prøv at fjerne en efter en for at se om de fejler eller køb nye som passer til computeren og bundkortet.
Enig
Jeg plerj nu: halvdelen ud ->halvldelen (- en fjerdedel) ind/ud .... Binær søgning ;-)
Nu er det sådan at
Hvad betyder det her så
systemctl status systemd-oomd
● systemd-oomd.service - Userspace Out-Of-Memory (OOM) Killer
Loaded: loaded (/usr/lib/systemd/system/systemd-oomd.service; enabled; preset: disabled)
Active: active (running) since Tue 2023-01-17 10:02:09 CET; 3h 49min ago
TriggeredBy: ● systemd-oomd.socket
Docs: man:systemd-oomd.service(8)
Main PID: 507 (systemd-oomd)
Status: "Processing requests..."
Tasks: 1 (limit: 18969)
Memory: 1.5M (min: 64.0M low: 64.0M)
CPU: 8.730s
CGroup: /system.slice/systemd-oomd.service
└─507 /usr/lib/systemd/systemd-oomd
jan 17 10:02:09 andersen systemd[1]: Starting Userspace Out-Of-Memory (OOM) Killer...
jan 17 10:02:09 andersen systemd[1]: Started Userspace Out-Of-Memory (OOM) Killer.
Prøv at fjerne en
Det prøver jeg ad og melder tilbage. men jeg forstår ikke at når jeg har kørt ram test i over 10 timer og der er igen fejlmedelser?
Nu er det sådan at konkret
Min erfaring siger mig, at ja, det er sket, at et program har forårsaget en out-of-memory situation, hvor swap er fyldt - at systemd-oomd ikke er perfekt, men at det problem er blevet meget mere sjældent, end det var, før systemd-oomd blev implementeret, især grundet at OOM killer (i kernen) var meget sent på den med, at dræbe processer der var gået haywire. - Nu klager Ubuntu-brugere nærmest over, at systemd-oomd er for hurtig, - der var en sag, hvor Canonical fik lidt hug i foråret for ikke, at have konfigueret systemd-oomd på en helt velabalanceret måde, så GNOME skrivebordssession, samt browser og andet blev dræbt meget hurtigt. Det fik mange brugere til, at bruge Earlyoom i stedet, - som har nogle lidt mere fintunede regler.
-
Jamen jeg taler også af erfaring. Grundløse postulater er ligeså meget værd, som Zimbabwe dollars, så selvfølgelig sidder jeg ikke bare og påstår noget, jeg ikke selv har erfaring med. :)
At du har slået status
At du har slået status op for dæmonen
Kør blot 30-60
Kør blot 30-60 minutter og se om der er fejl. Det plejer at inkludere de værste tests
Hvad betyder det her så
At
At du har slået status op og at systemd-oomd kører og er aktiv og virker som den skal.
Jog lige den der dmesg over
I en terminal: sudo dmesg -w -T | tee log
Hold terminalen åben (indtil den crasher) - så har du kernens log i dit homedir, når du crasher
Hvordan crasher du? Slukker du selv eller er det maskinen der booter af sig selv?
I en terminal: sudo
Hold terminalen åben (indtil den crasher) - så har du kernens log i dit homedir, når du crasher
Det prøver jeg
#35: Hvordan crasher du? Slukker du selv eller er det maskinen der booter af sig selv?
Det er maskinen der booter af sig selv
Nu tænker jeg lige på
Har du nogen måde, at finde ud af om spændingen i din strømforsyning bliver ved med, at være rigtig? Jeg tænker, det er værd at undersøge.
Du kan også prøve noget andet:
Prøv at slut maskinen til en anden stikkontakt med en forlænger. Se om det er stikkontakten, der ikke leverer nok strøm, eller har udfald. Det er også en mulighed, at prøve.
Prøv at slut maskinen
Mine computere ha deres helt egen gruppe, og en gruppe levere 2700 Watt, så dt kan ikke være problemet
#37: Har du nogen måde, at finde ud af om spændingen i din strømforsyning bliver ved med, at være rigtig? Jeg tænker, det er værd at undersøge.
Det ved jeg så ikke hvordan det gøres
"spændingen i din
"spændingen i din strømforsyning "
Det ved jeg så ikke hvordan det gøres
Det er ikke noget, man lige gør.
https://ip1.i.lithium.com/a31033d964097837e6fe042bb780f8ccd4a837d0/6874…
Som det ses, er der mange spændinger, der skal følges - samtidigt.
Det er ikke noget, man
https://ip1.i.lithium.com/a31033d964097837e6fe042b...
Som det ses, er der mange spændinger, der skal følges - samtidigt.
Nej det er vist noget for en elotronik inginør.
#35: I en terminal: sudo dmesg -w -T | tee log
Hold terminalen åben (indtil den crasher) - så har du kernens log i dit homedir, når du crasher
Det er mærkeligt, når maskinen bliver belastet også med adre testprogrammer jeg har brugt i Linux, ja så genstater maskinen ike????????????????
Det er mærkeligt, når
Det er mærkeligt, når
Er der en indstilling i din bios, der har en timer, der har indflydelse på genstart?
Jeg kunne også godt tænke mig, at du prøvede en af disse råd på StackExchange.
https://unix.stackexchange.com/questions/9819/how-to-find-out-from-the-…
Hvis der heller ikke står noget om hvad årsagen er i /var/log, så er jeg ret sikker på, at det ikke er styresystemet, men hardwaren. Et kernel crash dump bliver **altid** rapporteret til /var/log, hvis det er kernen, der crasher/rebooter. Kernen har så ikke noget, at gøre med, hvis det er hardwaren der fejler, hvorfor den heller ikke vil vise noget i /var/log, såfremt det er hardwaren den er gal med.
Er der en indstilling i
Som sagt startede problemet for 11 måneder siden. Der var ikke ikke ændret noget i BIOS.
#42: Jeg kunne også godt tænke mig, at du prøvede en af disse råd på StackExchange.
Swr på imorgen er lidt træt idag
#42: Hvis der heller ikke står noget om hvad årsagen er i /var/log, så er jeg ret sikker på, at det ikke er styresystemet, men hardwaren. Et kernel crash dump bliver **altid** rapporteret til /var/log, hvis det er kernen, der crasher/rebooter.
Ser jeg også på imorgen. Så jeg vil sige godnat herfra og foreløbig tak for hjæpen
Er der en indstilling i
Som sagt startede problemet for 11 måneder siden. Der var ikke ikke ændret noget i BIOS.
#42: Jeg kunne også godt tænke mig, at du prøvede en af disse råd på StackExchange.
Swr på imorgen er lidt træt idag
#42: Hvis der heller ikke står noget om hvad årsagen er i /var/log, så er jeg ret sikker på, at det ikke er styresystemet, men hardwaren. Et kernel crash dump bliver **altid** rapporteret til /var/log, hvis det er kernen, der crasher/rebooter.
Ser jeg også på imorgen. Så jeg vil sige godnat herfra og foreløbig tak for hjæpen
Godnat og sov godt. Vi leder
I en terminal: sudo
Nu har den stået og tæsket i 6 timer uden at genstrate med der er nogle fejl
[ons jan 18 09:26:27 2023] RAS: Correctable Errors collector initialized.
[ons jan 18 09:26:30 2023] vc032x: probe of 1-1:1.0 failed with error -32
[ons jan 18 09:26:27 2023] pcieport 0000:00:1b.0: DPC: error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 4, DL_ActiveErr+
[ons jan 18 09:26:27 2023] pcieport 0000:00:1c.5: DPC: error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 4, DL_ActiveErr+
[ons jan 18 09:26:27 2023] RAS: Correctable Errors collector initialized.
[ons jan 18 09:26:30 2023] vc032x: probe of 1-1:1.0 failed with error -32.
#45: Godnat og sov godt. Vi leder videre i morgen :)
Jeg vender lige 5tilbage når jeg har afprøvet det forskellige
Googlede lige lidt, og så,
-
Vi spekulerer stadig meget på, hvad det kan være, og jeg må indrømme, at det er helt vildt hvad du må trækkes igennem mht. det her problem. Jeg håber vi finder sorteper snart (for din skyld) - for det er da irriterende.
Jeg kunne også godt
https://unix.stackexchange.com/questions/9819/how-...
#47:
ja der er irentewrende men nu har den kørtn i over 6 timer unden atb genstarte ?
uptime
15:38:57 up 6:12, 1 user, load average: 0,38, 0,42, 0,20
Jeg er ved, at løbe tør
Kan vi få julemand på banen, - jeg synes egentlig det kunne være interessant, om han har nogle ideer. :)
Hvad med spændings
Har du prøvet en mindre aggressiv strøm/pefromance profil i BIOS?
Hvilket bundkort er det?