Hallo,
Mein Kubuntu, welches eigentlich sehr stabil läuft, hängt sich sporadisch beim Kopieren von einigen hundert Dateien sowohl unter Dolphin als auch mit 'cp' im Terminal auf. Kopiert werden sollen die Dateien von /dec/sda1 (ext4) auf die eingehängte SSD auf /dev/sdc1 (ext4).
Mein System: Kubuntu 22.04 auf nvme (aktualisiert aus dem Backports-PPA), Kernel 5.15.0-40-generic, Plasma 5.24.5, Gear 22.04, Frameworks 5.95.0, alle Ubuntu-Pakete auf dem neuesten Stand. Die nvme ist eine Corsair MP600 mit aktueller Firmware.
Speicherplatzprobleme auf den Platten gibt es keine, fsck zeigt keine Fehler an und der RAM wurde mit memtest auch bereits auf eventuelle Fehler überprüft.
'journalctl' ergibt folgende Fehlermeldungen, die mir aber nichts sagen (kopieren ab 14:32:37):
# journalctl -b -p err Jul 06 14:02:36 merlin kernel: Jul 06 14:02:37 merlin smartd[925]: Device: /dev/nvme0, number of Error Log entries increased from 8917 to 8924 Jul 06 14:02:37 merlin systemd-udevd[547]: vboxdrv: /etc/udev/rules.d/60-vboxdrv.rules:1 Only network interfaces can be renamed, ignoring NAME="vboxdrv". Jul 06 14:02:37 merlin systemd-udevd[545]: vboxdrvu: /etc/udev/rules.d/60-vboxdrv.rules:2 Only network interfaces can be renamed, ignoring NAME="vboxdrvu". Jul 06 14:02:37 merlin systemd-udevd[547]: vboxnetctl: /etc/udev/rules.d/60-vboxdrv.rules:3 Only network interfaces can be renamed, ignoring NAME="vboxnetctl". Jul 06 14:02:52 merlin xdg-desktop-portal[1847]: pw.context: 0x556c3ae14530: can't load config client.conf: Datei oder Verzeichnis nicht gefunden Jul 06 14:05:22 merlin kernel: ntfs3: Unknown parameter 'windows_names' Jul 06 14:32:37 merlin smartd[925]: Device: /dev/nvme0, number of Error Log entries increased from 8924 to 8925 Jul 06 14:44:11 merlin kernel: BUG: unable to handle page fault for address: 0000000000001008 Jul 06 14:44:11 merlin kernel: #PF: supervisor read access in kernel mode Jul 06 14:44:11 merlin kernel: #PF: error_code(0x0000) - not-present page Jul 06 14:46:15 merlin kernel: ================================================================================ Jul 06 14:46:15 merlin kernel: UBSAN: array-index-out-of-bounds in /build/linux-WLUive/linux-5.15.0/mm/page_alloc.c:4108:10 Jul 06 14:46:15 merlin kernel: index -1139446722 is out of range for type 'long unsigned int [3]' Jul 06 14:46:15 merlin kernel: ================================================================================ Jul 06 14:46:17 merlin kernel: BUG: kernel NULL pointer dereference, address: 0000000000000000 Jul 06 14:46:17 merlin kernel: #PF: supervisor read access in kernel mode Jul 06 14:46:17 merlin kernel: #PF: error_code(0x0000) - not-present page
Verdächtig erscheint mir die hohe Anzahl 8924 der 'Error Log entries' auf der nvme:
# nvme smart-log /dev/nvme0n1p5 Smart Log for NVME device:nvme0n1p5 namespace-id:ffffffff critical_warning : 0 temperature : 38 C (311 Kelvin) available_spare : 100% available_spare_threshold : 5% percentage_used : 2% endurance group critical warning summary: 0 data_units_read : 58.722.414 data_units_written : 38.529.134 host_read_commands : 504.112.165 host_write_commands : 311.858.011 controller_busy_time : 2.388 power_cycles : 1.947 power_on_hours : 7.445 unsafe_shutdowns : 163 media_errors : 0 num_err_log_entries : 8.924 Warning Temperature Time : 0 Critical Composite Temperature Time : 0 Thermal Management T1 Trans Count : 0 Thermal Management T2 Trans Count : 0 Thermal Management T1 Total Time : 0 Thermal Management T2 Total Time : 0
Die letzten aufgeführten 'Log Entries' sehen alle so aus:
# nvme error-log /dev/nvme0n1p5 Error Log Entries for device:nvme0n1p5 entries:63 ................. Entry[ 0] ................. error_count : 8924 sqid : 0 cmdid : 0x1009 status_field : 0x2002(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field) phase_tag : 0 parm_err_loc : 0x28 lba : 0 nsid : 0 vs : 0 trtype : The transport type is not indicated or the error is not transport related. cs : 0 trtype_spec_info: 0 ................. Entry[ 1] ................. error_count : 0 sqid : 0 cmdid : 0 status_field : 0(SUCCESS: The command completed successfully) phase_tag : 0 parm_err_loc : 0 lba : 0 nsid : 0 vs : 0 trtype : The transport type is not indicated or the error is not transport related. cs : 0 trtype_spec_info: 0 .................
Ein Selbsttest bringt mir auch keine Klarheit:
# nvme self-test-log /dev/nvme0n1p5 Device Self Test Log for NVME device:nvme0n1p5 Current operation : 0 Current Completion : 0% Self Test Result[0]: Operation Result : 0 Self Test Code : 0 Valid Diagnostic Information : 0 Power on hours (POH) : 0 Vendor Specific : 0 0 Self Test Result[1]: Operation Result : 0 Self Test Code : 0 Valid Diagnostic Information : 0 Power on hours (POH) : 0 Vendor Specific : 0 0 ... Self Test Result[18]: Operation Result : 0 Self Test Code : 0 Valid Diagnostic Information : 0 Power on hours (POH) : 0 Vendor Specific : 0 0 Self Test Result[19]: Operation Result : 0 Self Test Code : 1 Valid Diagnostic Information : 0 Power on hours (POH) : 0x1a6f Vendor Specific : 0 0
Oder liege ich mit meiner Vermutung nvme völlig falsch?
Hat jemand eine Idee oder einen Tipp, wo ich weitersuchen kann?
Vielen Dank.
Moderiert von ChickenLipsRfun2eat:
Thema in einen passenden Forenbereich verschoben. Bitte beachte die als wichtig markierten Themen („Welche Themen gehören hier her und welche nicht?“) in jedem Forenbereich. Danke.