Hallo Zusammen,
ich hoffe ich bin im richtigen Forenbereich gelandet. Ich habe folgendes System:
Distributor ID: Ubuntu Description: Ubuntu 18.04.3 LTS Release: 18.04 Codename: bionic 4.18.0-25-generic Board: Supermicro X11QPH+ (neustes BIOS, 3.1) 4x Xeon 6138 Gold
processor : 0 vendor_id : GenuineIntel cpu family : 6 model : 85 model name : Intel(R) Xeon(R) Gold 6138 CPU @ 2.00GHz stepping : 4 microcode : 0x2000065 cpu MHz : 2000.060 cache size : 28160 KB physical id : 0 siblings : 1 core id : 0 cpu cores : 1 apicid : 0 initial apicid : 0 fpu : yes fpu_exception : yes cpuid level : 22 wp : yes flags : fpu vme de pse tsc msr pae mce cx8 sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp lm constant_tsc art arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid dca sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch cpuid_fault epb cat_l3 cdp_l3 invpcid_single pti intel_ppin ssbd mba ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 hle avx2 smep bmi2 erms invpcid rtm cqm mpx rdt_a avx512f avx512dq rdseed adx smap clflushopt clwb intel_pt avx512cd avx512bw avx512vl xsaveopt xsavec xgetbv1 xsaves cqm_llc cqm_occup_llc cqm_mbm_total cqm_mbm_local dtherm ida arat pln pts pku ospke md_clear flush_l1d bugs : cpu_meltdown spectre_v1 spectre_v2 spec_store_bypass l1tf mds bogomips : 4000.00 clflush size : 64 cache_alignment : 64 address sizes : 46 bits physical, 48 bits virtual power management:
Das System wird ohne grafische Oberfläche verwendet, bootet also direkt auf den Konsolenlogin. Seit letzten Freitag habe ich direkt nach dem Booten einen kompletten Systemfreeze. Ich kann noch den Benutzernamen eingeben und manchmal noch das Passwort aber dann ist Schluss. Nach ca. 10 Sekunden legt das System dann einen Neustart ein. Dasselbe passiert auch mit einer Live USB Version von Ubuntu.
Was ich getestet habe: Kompletten Speichertest mit Memtest. Ist ohne Fehler durchgelaufen. Diverse Kerneloptionen. Das System läuft mit der Option "nolapic". Allerdings ist das keine Dauerlösung da nur noch ein Kern aktiv ist. Alternativ läuft das System mit Live USB Ubuntu auch mit der Option "acpi=off". Der Serverversion schmiert allerdings mit "acpi=off" schon während des Bootvorgangs ab. Weitere Kerneloptionen wie "acpi=ht", "acpi=oldboot", "nomodeset", "nouveau.modeset=0", ... zeigten keine Wirkung. Ich habe auch andere Kernelversionen ausprobiert (den neusten und ältesten 4.15. den ich per apt-get finden konnte), leider verhalten sich alle gleich.
Leider habe ich mit Linux nicht viel am Hut (benutze den Rechner lediglich für rechenaufwändige Monte-Carlo-Simulationen) und weiss nicht wirklich welche Log Einträge hilfreich wären.
Für jegliche nützliche Hinweise wäre ich dankbar.
Grüße, Marco