Blade83
Anmeldungsdatum: 23. November 2014
Beiträge: 46
Wohnort: Hillesheim
|
Hallo Leute! Meine Kubuntu installation schmiert immer ab. Auf allen Monitoren friert alles ein, dann werden die Bildschirme schwarz. Das wars.
Danach drücke ich reset und es geht wieder von neuem los. Weiss jemand Rat wie ich ermitteln kann was da schief läuft?
|
Thomas_Do
Moderator
Anmeldungsdatum: 24. November 2009
Beiträge: 8493
|
Ich würde mir die Logdateien ansehen. Aber vor allem die Hardware prüfen, insbesondere RAM und Festplatte(n).
|
Bleys
Anmeldungsdatum: 13. August 2006
Beiträge: 6172
Wohnort: Essen, NRW
|
Thomas_Do schrieb: Aber vor allem die Hardware prüfen, insbesondere RAM und Festplatte(n).
ich ergänze mal: CPU Kühlrippen und Lüfter. GraKa Kühlrippen und Lüfter. Wenn die Kühlrippen zu sitzen (und das passiert wirklich häufig), schalten sich moderne CPUs und GPUs einfach mal ab wenn es zu heiß wird. Netzteil, Mainboard auf defekte Kondensatoren.
|
dingsbums
Anmeldungsdatum: 13. November 2010
Beiträge: 3532
|
Ohne verwertbare Angaben zum System reines Traumdeuten a la "mein Auto bleibt am Tag 5mal stehen".
Wenn es hängt: Kannst du das System noch per systemctl poweroff über eine virtuelle Konsole herunterfahren? (präventiv da anmelden, wenn noch "Normalzustand" herrscht)
Danach drücke ich reset
Und irgendwann ist dein Dateisystem dann geschrottet. Probiere Magic SysRQ, wenn gar nichts mehr hilft. Ansonsten wie bereits erwähnt:
|
dingsbums
Anmeldungsdatum: 13. November 2010
Beiträge: 3532
|
Und bitte alle Ausgaben liefern / Fragen beantworten / Prüfungen durchführen.
|
Blade83
(Themenstarter)
Anmeldungsdatum: 23. November 2014
Beiträge: 46
Wohnort: Hillesheim
|
Danke für die Antworten. Sauber gemacht habe ich schon ein Jahr nicht mehr. Aber daran kanns eigentlich nicht liegen da die Abstürze schon ein halbes Jahr kommen und es da definitiv noch sauber war. Eine USB Live Stick Version habe ich noch nicht ausprobiert aber habe schon selber daran gedacht um den Fehler zu lokalisieren. Hier mal die angefragte Ausgabe für dingsbums inxi -xFz
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31 | System: Host: Tux Kernel: 5.4.0-65-generic x86_64 bits: 64 gcc: 7.5.0 Desktop: KDE Plasma 5.12.9 (Qt 5.9.5)
Distro: Ubuntu 18.04.5 LTS
Machine: Device: desktop Mobo: ASUSTeK model: Crosshair IV Formula v: Rev 1.xx serial: N/A
BIOS: American Megatrends v: 3029 date: 10/09/2012
CPU: 8 core AMD FX-8350 Eight-Core (-MCP-) arch: Bulldozer rev.0 cache: 16384 KB
flags: (lm nx sse sse2 sse3 sse4_1 sse4_2 sse4a ssse3 svm) bmips: 64215
clock speeds: max: 4000 MHz 1: 1402 MHz 2: 1403 MHz 3: 1394 MHz 4: 1403 MHz 5: 1409 MHz 6: 1450 MHz
7: 1427 MHz 8: 1405 MHz
Graphics: Card: Advanced Micro Devices [AMD/ATI] Tahiti PRO [Radeon HD 7950/8950 OEM / R9 280] bus-ID: 06:00.0
Display Server: x11 (X.Org 1.20.8 ) drivers: ati,radeon (unloaded: modesetting,fbdev,vesa)
Resolution: 1920x1080@59.99hz, 1920x1080@59.99hz
OpenGL: renderer: AMD TAHITI (DRM 2.50.0, 5.4.0-65-generic, LLVM 10.0.0)
version: 4.5 Mesa 20.0.8 Direct Render: Yes
Audio: Card-1 Advanced Micro Devices [AMD/ATI] Tahiti HDMI Audio [Radeon HD 7870 XT / 7950/7970]
driver: snd_hda_intel bus-ID: 06:00.1
Card-2 Advanced Micro Devices [AMD/ATI] SBx00 Azalia (Intel HDA)
driver: snd_hda_intel bus-ID: 00:14.2
Sound: Advanced Linux Sound Architecture v: k5.4.0-65-generic
Network: Card: Marvell Yukon Optima 88E8059 [PCIe Gigabit Ethernet Controller with AVB]
driver: sky2 v: 1.30 port: b800 bus-ID: 03:00.0
IF: enp3s0 state: up speed: 100 Mbps duplex: full mac: <filter>
Drives: HDD Total Size: 240.1GB (64.3% used)
ID-1: /dev/sda model: TOSHIBA size: 240.1GB temp: 16C
Partition: ID-1: / size: 218G used: 143G (70%) fs: ext4 dev: /dev/dm-1
ID-2: /boot size: 704M used: 167M (26%) fs: ext4 dev: /dev/sda1
ID-3: swap-1 size: 1.03GB used: 0.00GB (0%) fs: swap dev: /dev/dm-2
RAID: No RAID devices: /proc/mdstat, md_mod kernel module present
Sensors: System Temperatures: cpu: 30.0C mobo: 31.0C gpu: 50.0
Fan Speeds (in rpm): cpu: N/A
Info: Processes: 298 Uptime: 8:38 Memory: 3145.3/7943.9MB Init: systemd runlevel: 5 Gcc sys: 7.5.0
Client: Shell (bash 4.4.201) inxi: 2.3.56
|
sudo journalctl | grep -iE "error|fail" | tail -n 50
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50 | Feb 13 08:02:44 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:44 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:44 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:44 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:44 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:46 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:46 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:46 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:46 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:46 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:02:46 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:03:28 Tux certbot[1058]: Attempting to renew cert (home.cplusplus-development.de) from /etc/letsencrypt/renewal/home.cplusplus-development.de.conf produced an unexpected error: Failed authorization procedure. home.cplusplus-development.de (http-01): urn:ietf:params:acme:error:connection :: The server could not connect to the client to verify the domain :: Fetching http://home.cplusplus-development.de/.well-known/acme-challenge/CTu-e_eQuTsH7pbaernK8RHic_a4XAsQK5bkFNBIDOc: Error getting validation data. Skipping.
Feb 13 08:03:28 Tux certbot[1058]: All renewal attempts failed. The following certs could not be renewed:
Feb 13 08:03:28 Tux certbot[1058]: /etc/letsencrypt/live/home.cplusplus-development.de/fullchain.pem (failure)
Feb 13 08:03:28 Tux certbot[1058]: 1 renew failure(s), 0 parse failure(s)
Feb 13 08:03:28 Tux systemd[1]: certbot.service: Main process exited, code=exited, status=1/FAILURE
Feb 13 08:03:28 Tux systemd[1]: certbot.service: Failed with result 'exit-code'.
Feb 13 08:03:28 Tux systemd[1]: Failed to start Certbot.
Feb 13 08:05:17 Tux dbus-daemon[1011]: [system] Rejected send message, 1 matched rules; type="method_return", sender=":1.67" (uid=0 pid=2905 comm="/usr/bin/python3 /usr/share/apt-xapian-index/updat" label="unconfined") interface="(unset)" member="(unset)" error name="(unset)" requested_reply="0" destination=":1.30" (uid=1000 pid=1557 comm="kded5 [kdeinit5] " label="unconfined")
Feb 13 08:07:18 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:07:18 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:07:18 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:07:18 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:07:18 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:11:24 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
Feb 13 08:32:12 Tux smartd[1069]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 194 Temperature_Celsius changed from 89 to 86
Feb 13 09:02:12 Tux smartd[1069]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 194 Temperature_Celsius changed from 86 to 84
Feb 13 10:32:12 Tux smartd[1069]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 194 Temperature_Celsius changed from 84 to 83
Feb 13 12:02:12 Tux smartd[1069]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 194 Temperature_Celsius changed from 83 to 84
Feb 13 12:32:12 Tux smartd[1069]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 194 Temperature_Celsius changed from 84 to 83
Feb 13 14:03:54 Tux colord[1199]: CdMain: failed to emit DeviceAdded: failed to register object: Für die Schnittstelle org.freedesktop.ColorManager.Device auf /org/freedesktop/ColorManager/devices/sysfs__null_ wurde bereits ein Objekt exportiert
Feb 13 14:03:54 Tux colord[1199]: CdMain: failed to emit DeviceAdded: failed to register object: Für die Schnittstelle org.freedesktop.ColorManager.Device auf /org/freedesktop/ColorManager/devices/sysfs__null_ wurde bereits ein Objekt exportiert
Feb 13 14:03:54 Tux colord[1199]: CdMain: failed to emit DeviceAdded: failed to register object: Für die Schnittstelle org.freedesktop.ColorManager.Device auf /org/freedesktop/ColorManager/devices/sysfs__null_ wurde bereits ein Objekt exportiert
Feb 13 14:04:26 Tux ModemManager[1009]: <warn> Parse error in step 2: SIM reference data not found.
Feb 13 14:04:27 Tux ModemManager[1009]: <warn> Parse error in step 3: SIM reference data not found.
Feb 13 14:14:23 Tux colord[1199]: CdMain: failed to emit DeviceAdded: failed to register object: Für die Schnittstelle org.freedesktop.ColorManager.Device auf /org/freedesktop/ColorManager/devices/sysfs__null_ wurde bereits ein Objekt exportiert
Feb 13 14:14:23 Tux colord[1199]: CdMain: failed to emit DeviceAdded: failed to register object: Für die Schnittstelle org.freedesktop.ColorManager.Device auf /org/freedesktop/ColorManager/devices/sysfs__null_ wurde bereits ein Objekt exportiert
Feb 13 14:14:23 Tux colord[1199]: CdMain: failed to emit DeviceAdded: failed to register object: Für die Schnittstelle org.freedesktop.ColorManager.Device auf /org/freedesktop/ColorManager/devices/sysfs__null_ wurde bereits ein Objekt exportiert
Feb 13 14:14:56 Tux ModemManager[1009]: <warn> Parse error in step 2: SIM reference data not found.
Feb 13 14:14:56 Tux ModemManager[1009]: <warn> Parse error in step 3: SIM reference data not found.
Feb 13 14:15:50 Tux colord[1199]: CdMain: failed to emit DeviceAdded: failed to register object: Für die Schnittstelle org.freedesktop.ColorManager.Device auf /org/freedesktop/ColorManager/devices/sysfs__null_ wurde bereits ein Objekt exportiert
Feb 13 14:15:50 Tux colord[1199]: CdMain: failed to emit DeviceAdded: failed to register object: Für die Schnittstelle org.freedesktop.ColorManager.Device auf /org/freedesktop/ColorManager/devices/sysfs__null_ wurde bereits ein Objekt exportiert
Feb 13 14:15:50 Tux colord[1199]: CdMain: failed to emit DeviceAdded: failed to register object: Für die Schnittstelle org.freedesktop.ColorManager.Device auf /org/freedesktop/ColorManager/devices/sysfs__null_ wurde bereits ein Objekt exportiert
Feb 13 14:16:22 Tux ModemManager[1009]: <info> Modem: state changed (unknown -> failed)
Feb 13 14:16:22 Tux NetworkManager[1044]: <info> [1613222182.6796] device (ttyACM0): modem state 'failed'
Feb 13 14:16:22 Tux NetworkManager[1044]: <info> [1613222182.6797] modem-broadband[ttyACM0]: failed to retrieve SIM object: No SIM object available
Feb 13 14:32:12 Tux smartd[1069]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 194 Temperature_Celsius changed from 83 to 86
Feb 13 15:02:12 Tux smartd[1069]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 194 Temperature_Celsius changed from 86 to 85
Feb 13 16:32:12 Tux smartd[1069]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 194 Temperature_Celsius changed from 85 to 84
Feb 13 16:34:18 Tux systemd-resolved[929]: Server returned error NXDOMAIN, mitigating potential DNS violation DVE-2018-0001, retrying transaction with reduced feature level UDP.
|
Am RAM kann es auch nicht liegen, den habe ich schon ausgetauscht...
Die Abstürze kommen zufällig. Ich kann auch L4D spielen 2 Stunden, gehe dann auf den Desktop, höre ne Stunde Musik und dann patsch weg...
|
Blade83
(Themenstarter)
Anmeldungsdatum: 23. November 2014
Beiträge: 46
Wohnort: Hillesheim
|
Also er ist gut dreckig von innen. Ich baue mal alles auseinander und schaue dann nochmal
|
dingsbums
Anmeldungsdatum: 13. November 2010
Beiträge: 3532
|
Feb 13 14:32:12 Tux smartd[1069]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 194 Temperature_Celsius changed from 83 to 86
Der Festplatte wird es recht warm. Zeig mal sudo smartctl -a /dev/sda | grep -iE "error|fail"
|
hakel2020
Anmeldungsdatum: 21. Januar 2021
Beiträge: 1169
|
AMD FX-8350 Eight-Core
Das ist natürlich eine recht üble Plattform. Streß dein Gerät und kontrolliere die Gehäusetemps mit LM_Sensors. Möglicherweise hast du dein System -MB- zu Tode gebruzzelt per Gaming.
TOSHIBA size: 240.1GB
Den Hobel würde ich mal gründlich testen!
|
Blade83
(Themenstarter)
Anmeldungsdatum: 23. November 2014
Beiträge: 46
Wohnort: Hillesheim
|
Habe die Kiste jetzt mal auseinander gebaut und gereinigt. War gut zugesetzt. Ich habe festgestellt, das in der Wasserkühlung kaum noch Kühlmittel war. Habe es nachgefüllt. Jedoch ist mir aufgefallen, dass die Pumpe zwar läuft, jedoch kaum Bewegung in dem Schlauch ist. Die Festplatte ist eine SSD, die kann keine 80° warm werden. Hatte das auch schon gesehen.
Nun habe ich mir das Programm sensors installiert und hier ist die Ausgabe davon: watch -n 1 "sensors"
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32 | fam15h_power-pci-00c4
Adapter: PCI adapter
power1: 51.94 W (crit = 125.19 W)
radeon-pci-0600
Adapter: PCI adapter
temp1: +36.0°C (crit = +120.0°C, hyst = +90.0°C)
k10temp-pci-00c3
Adapter: PCI adapter
temp1: +14.1°C (high = +70.0°C)
(crit = +70.0°C, hyst = +67.0°C)
atk0110-acpi-0
Adapter: ACPI interface
Vcore Voltage: +1.18 V (min = +0.80 V, max = +1.60 V)
CPU/NB Voltage: +1.16 V (min = +0.80 V, max = +1.60 V)
CPU VDDA Voltage: +2.53 V (min = +2.00 V, max = +3.00 V)
DRAM Voltage: +1.67 V (min = +1.40 V, max = +1.90 V)
HT Voltage: +1.22 V (min = +0.80 V, max = +1.50 V)
NB Voltage: +1.12 V (min = +0.90 V, max = +1.35 V)
SB Voltage: +1.11 V (min = +0.80 V, max = +1.50 V)
+3.3V Voltage: +3.31 V (min = +2.97 V, max = +3.63 V)
+5V Voltage: +5.06 V (min = +4.50 V, max = +5.50 V)
+12V Voltage: +12.11 V (min = +10.20 V, max = +13.80 V)
CPU Temperature: +28.0°C (high = +40.0°C, crit = +90.0°C)
MB Temperature: +25.0°C (high = +35.0°C, crit = +95.0°C)
NB Temperature: +39.0°C (high = +65.0°C, crit = +95.0°C)
SB Temperature: +30.0°C (high = +35.0°C, crit = +75.0°C)
OPT_TEMP1 Temperature: +5.0°C (high = +0.0°C, crit = +90.0°C)
OPT_TEMP2 Temperature: +19.0°C (high = +0.0°C, crit = +90.0°C)
OPT_TEMP3 Temperature: +15.0°C (high = +0.0°C, crit = +90.0°C)
|
Diese OPT_TEMPx sind externe Sensoren. Davon werde ich nun mal einen an die SSD kleben. Dann sehen wir mal was da abgeht.. sudo smartctl -a /dev/sda | grep -iE "error|fail"
| Error logging capability: (0x01) Error logging supported.
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
169 Unknown_Attribute 0x0003 100 100 010 Pre-fail Always - 0
194 Temperature_Celsius 0x0023 084 059 020 Pre-fail Always - 16 (Min/Max 4/41)
SMART Error Log Version: 1
No Errors Logged
|
|
Blade83
(Themenstarter)
Anmeldungsdatum: 23. November 2014
Beiträge: 46
Wohnort: Hillesheim
|
Habs geprüft, die Platte ist Eiskalt obwohl was anderes angezeigt wird!
|
hakel2020
Anmeldungsdatum: 21. Januar 2021
Beiträge: 1169
|
Jetzt, wo du alle "Spuren" beseitigt hast, kann man nix mehr sagen. 😛 Hoffen wir mal, daß die Aktion etwas gebracht hat. Die Temperaturen sehen nachvollziehbar und gut aus. Dein Brett wird gut unterstützt.
power1: 51.94 W (crit = 125.19 W)
Das ist doch "nett". Bei "Musik hören" kann erstaunlich viel Last und Temp entstehen. Wenn sich das dann irgendwo staut, dann ... Egal, jetzt muß man mal sehen. Bei einem 8350 ist viel möglich, sehr ungünstig. Gönn' deinem System ruhig mal ein Upgrade. 20.04 ist gut, im Sinne von besser als 18.04. 👍
|
Blade83
(Themenstarter)
Anmeldungsdatum: 23. November 2014
Beiträge: 46
Wohnort: Hillesheim
|
Wie meinst du das "nett"
Was haben den alle gegen den 8350? Hat Jahrelang gelaufen...
|
Tuemmler
Anmeldungsdatum: 26. März 2007
Beiträge: 8018
Wohnort: Süsel / Ostholstein
|
Moin Moin, Blade83 schrieb: War gut zugesetzt. Ich habe festgestellt, das in der Wasserkühlung kaum noch Kühlmittel war. Habe es nachgefüllt. Jedoch ist mir aufgefallen, dass die Pumpe zwar läuft, jedoch kaum Bewegung in dem Schlauch ist.
Hier ist Erklärungsbedarf, wieso Wasserkühlung, und wenn, wo Leckagen im System? Und wieso, wenn sauber heruntergefahren werden soll nicht die Kombination = Altgr + Druck ⇒ Eingabe = R E I S U B? Seit 2014 dabei und kennt die einfachsten Regeln nicht? Gruß
|
hakel2020
Anmeldungsdatum: 21. Januar 2021
Beiträge: 1169
|
"nett"
Wo wird denn LM_Sensors so gut unterstützt, daß sogar der Stromverbrauch angezeigt wird? Das ist top! 👍 Bei vielen meiner MBs, wird nur Müll angezeigt.
power1: 51.94 W (crit = 125.19 W)
Meine proprietären Mini HPs verbrauchen 15 Watt im Idle und bis 4 Threads sind die vermutlich noch flotter. Wegen dieser FX ist AMD fast pleite gegangen, so gut waren die. Egal, dafür sind sie robust und unkaputtbar. Wird bei Wasserkühlung "das soziale Umfeld" nicht unzureichend gekühlt. Ram, Spannungswandler etc. ? Der Staub ist natürlich ein Anhaltspunkt, meine Rechner sind seit einigen Jahren erstaunlich sauber. Kühlung springt kaum noch an. 👍 Früher habe ich die immer in der Weihnachtszeit gesäubert in der Firma.
|