Résolu le 25-05-22 Quels outils de diagnostic suite à un refus de démarrage ?

Postez ici toutes vos demandes d’assistance.
Avatar du membre
Scrat
Messages : 643
Enregistré le : lun. 6 août 2018 19:05
Localisation : île d'Oléron

Quels outils de diagnostic suite à un refus de démarrage ?

Message par Scrat »

Bonjour.

J'ai besoin de conseils sur des outils d'analyse du hardware et du software suite à un refus de démarrer du PC en signature à plusieurs reprises (blocage sur le logo LM après l'affichage du logo Lenovo).

En naviguant au hasard dans les menus du bios et les options de démarrage, j'ai trouvé une option de démarrage en "recovery mode" qui m'a affiché un inquiétant "pas OK" dans l'analyse des volumes logique, mais le PC n'a pas redémarré pour autant. En continuant à tester au hasard des options des menus, le PC a fini par démarrer sans que je comprenne pourquoi. Du coup, je me suis empressé de faire une sauvegarde du /home.

Pour info, le PC a été acheté neuf en juillet 2018 avec LM 19.1 préinstallé, et j'ai fait toutes les mises à jour jusqu'à LM 19.3.

L'outil "Disques" accessible dans le menu "Préférences" me dit que le disque est sain, mais je souhaiterais faire une analyse approfondie du PC et/ou le système en espérant que le disque n'a pas pris un pet. J'ai vu qu'il existait "Testdisk" que je viens d'installer via le gestionnaire de logiciels mais que je n'ai pas encore utilisé. Pourriez-vous me conseiller d'autres outils d'analyse ?
Portable Lenovo Ideapad 320-17IKB - Linux Mint 19.3 Tricia - Cinnamon 4.4.8
Noyau Linux 4.15.0-180-generic - CPU Intel© Core™ i5-7200U CPU @ 2.50GHz × 2
RAM 7.6 Go - Disque HDD 960.4 Go
Carte Graphique Nvidia GeForce 920MX 2 Go - Intel Corporation HD Graphics 620

On a toujours tort d'essayer d'avoir raison devant des gens qui ont toutes les bonnes raisons de croire qu'ils n'ont pas tort ! (Raymond Devos) :lol:

Avatar du membre
cyrille
Administrateur du site
Messages : 12285
Enregistré le : mar. 19 sept. 2017 08:49
Localisation : Nowhere
Contact :

Re: Quels outils de diagnostic suite à un refus de démarrage ?

Message par cyrille »

Yep
SI c'est la santé de ton disque que tu veux analyser , jette un oeil
https://cbiot.fr/dokuwiki/freebsd-smartmontools
à un refus de démarrer du PC en signature à plusieurs reprises (blocage sur le logo LM après l'affichage du logo Lenovo).
Passer sur un tty et essayer de voir le message d'erreur
chrooter et lire les logs à la recherche d(éléments pertinents

++
?séuqartéd sel ruoP / sécnoféd sel ruoP / sreiruréB sel ruoP / ?étéicos elleuQ

https://crust.ovh

Avatar du membre
Scrat
Messages : 643
Enregistré le : lun. 6 août 2018 19:05
Localisation : île d'Oléron

Re: Quels outils de diagnostic suite à un refus de démarrage ?

Message par Scrat »

Merci Cyrille.

Merci pour le lien. J'ai installé smartmontools et lancé smartctl, le disque semble sain. Voici le log complet :

Code : Tout sélectionner

richard@pc-linuxshop-5678:~$ sudo smartctl -a /dev/sda
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.15.0-177-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     ST1000LM035-1RK172
Serial Number:    ZDE6LVXG
LU WWN Device Id: 5 000c50 0a5c17b51
Firmware Version: LCM2
User Capacity:    1 000 204 886 016 bytes [1,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 T13/2161-D revision 3b
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon May 23 19:11:08 2022 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(    0) seconds.
Offline data collection
capabilities: 			 (0x71) SMART execute Offline immediate.
					No Auto Offline data collection support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 163) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x3035)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   077   064   034    Pre-fail  Always       -       55242344
  3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   098   098   020    Old_age   Always       -       2668
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   082   060   045    Pre-fail  Always       -       160088927
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       3081 (192 100 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   098   098   020    Old_age   Always       -       2187
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       6
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   061   049   040    Old_age   Always       -       39 (Min/Max 27/46)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       1
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       17
193 Load_Cycle_Count        0x0032   069   069   000    Old_age   Always       -       63072
194 Temperature_Celsius     0x0022   039   051   000    Old_age   Always       -       39 (0 13 0 0 0)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x000f   097   097   030    Pre-fail  Always       -       2880 (32 11 0)
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
La "ligne importante" (test result : PASSED) est correcte.
A toi de me dire si tu vois des anomalies dans le log, mais je pense que tout semble sain.

Reste à tester le passage en tty si le blocage se reproduit.

Pour info, quand il y avait blocage sur le logo LM, je cliquais sur la touche Échappement, j'obtenais un écran noir avec un curseur clignotant, et aucun message.
Portable Lenovo Ideapad 320-17IKB - Linux Mint 19.3 Tricia - Cinnamon 4.4.8
Noyau Linux 4.15.0-180-generic - CPU Intel© Core™ i5-7200U CPU @ 2.50GHz × 2
RAM 7.6 Go - Disque HDD 960.4 Go
Carte Graphique Nvidia GeForce 920MX 2 Go - Intel Corporation HD Graphics 620

On a toujours tort d'essayer d'avoir raison devant des gens qui ont toutes les bonnes raisons de croire qu'ils n'ont pas tort ! (Raymond Devos) :lol:

Avatar du membre
cyrille
Administrateur du site
Messages : 12285
Enregistré le : mar. 19 sept. 2017 08:49
Localisation : Nowhere
Contact :

Re: Quels outils de diagnostic suite à un refus de démarrage ?

Message par cyrille »

Le disque est sain, cherche une autre piste (RAM, proccess qui met le souk, une reconnaissance matérielle ....)
?séuqartéd sel ruoP / sécnoféd sel ruoP / sreiruréB sel ruoP / ?étéicos elleuQ

https://crust.ovh

Avatar du membre
Scrat
Messages : 643
Enregistré le : lun. 6 août 2018 19:05
Localisation : île d'Oléron

Re: Quels outils de diagnostic suite à un refus de démarrage ?

Message par Scrat »

Merci pour ton aide.
C'est déjà rassurant de voir que le disque est sain.
Depuis cet incident (le premier en 4 ans), j'ai fait plusieurs redémarrages qui se sont effectués normalement. Tout semble rentré dans l'ordre sans que je comprenne pourquoi. Donc affaire à suivre... ;)
Portable Lenovo Ideapad 320-17IKB - Linux Mint 19.3 Tricia - Cinnamon 4.4.8
Noyau Linux 4.15.0-180-generic - CPU Intel© Core™ i5-7200U CPU @ 2.50GHz × 2
RAM 7.6 Go - Disque HDD 960.4 Go
Carte Graphique Nvidia GeForce 920MX 2 Go - Intel Corporation HD Graphics 620

On a toujours tort d'essayer d'avoir raison devant des gens qui ont toutes les bonnes raisons de croire qu'ils n'ont pas tort ! (Raymond Devos) :lol:

Avatar du membre
serged
Messages : 823
Enregistré le : jeu. 16 juil. 2015 07:59
Localisation : Montrouge (France)

Re: Quels outils de diagnostic suite à un refus de démarrage ?

Message par serged »

Un fsck sur le disque système...

Code : Tout sélectionner

sudo fsck -V /dev/sda1
(en remplaçant /dev/sda1 par le disque système)
LinuxMint Virginia Cinnamon et d'autres machines en MATE, XFCE... 20.x , 21.x ou 19.x
Tour : Asus F2A55 / AMD A8-5600K APU 3,6GHz / RAM 16Go / Nvidia GeForce GT610 / LM21.1 Cinnamon
Portable : LDLC Mercure MH : Celeron N3450 /RAM 4Go / Intel HD graphics 500 i915 / biboot Win 10 (sur SSD) - LM21.1 MATE (sur HDD)

Avatar du membre
cyrille
Administrateur du site
Messages : 12285
Enregistré le : mar. 19 sept. 2017 08:49
Localisation : Nowhere
Contact :

Re: Quels outils de diagnostic suite à un refus de démarrage ?

Message par cyrille »

@serged
Si erreur de ce type, il n'aurait pas redémarré sans intervention et en plus la séquence de boot lancerait une invite initramfs.

@scrat
le fsck mangera pas de pain , mais AMA, ce n'est pas ça. Si tu veux tenter (tu ne risques rien), ça se fait sur un périphérique non monté.
?séuqartéd sel ruoP / sécnoféd sel ruoP / sreiruréB sel ruoP / ?étéicos elleuQ

https://crust.ovh

Avatar du membre
Scrat
Messages : 643
Enregistré le : lun. 6 août 2018 19:05
Localisation : île d'Oléron

Re: Quels outils de diagnostic suite à un refus de démarrage ?

Message par Scrat »

Bonjour à tous.

Peut-être un début de solution.

Ce matin, nouveau blocage sur le logo LM. Au bout de quelques minutes d'attente, j'allais essayer de passer en tty quand il a consenti à démarrer.

Une analyse par "systemd-analyze blame" m'a montré qu'il passait plus de 3 minutes dans ufw.services !!!! :shock:

J'ai aussitôt nettoyé le PC en virant les anciens journaux et en passant un coup de BleachBit qui m'a récupéré environ 540 Mo, puis j'ai désactivé et réactivé le pare-feu ufw et arrêté le PC. Le redémarrage a été rapide : seulement 25 secondes passées dans ufw.services. Du coup j'ai désactivé le pare-feu ufw avant d'arrêter le PC, et le redémarrage suivant a été tout aussi rapide, sans passage dans ufw.services.

Je ne sais pas si ce pare-feu est bien utile, mais je préfère le garder actif. Une solution consisterait à le désactiver avant l'arrêt et à le réactiver après le démarrage.

Je suis un peu surpris par ce problème avec ufw qui ne m'avait jamais causé de soucis depuis 4 ans. Merci d'avance pour vos avis éclairés. ;)
Portable Lenovo Ideapad 320-17IKB - Linux Mint 19.3 Tricia - Cinnamon 4.4.8
Noyau Linux 4.15.0-180-generic - CPU Intel© Core™ i5-7200U CPU @ 2.50GHz × 2
RAM 7.6 Go - Disque HDD 960.4 Go
Carte Graphique Nvidia GeForce 920MX 2 Go - Intel Corporation HD Graphics 620

On a toujours tort d'essayer d'avoir raison devant des gens qui ont toutes les bonnes raisons de croire qu'ils n'ont pas tort ! (Raymond Devos) :lol:

Avatar du membre
arghlub
Administrateur du site
Messages : 10421
Enregistré le : dim. 21 mai 2017 08:19
Localisation : Provence
Contact :

Re: Quels outils de diagnostic suite à un refus de démarrage ?

Message par arghlub »

Salut,

le serveur de FFLM est parfois surchargé de temps en temps (trop de sollicitations) , merci de votre patience ;)
Tour1 (custom)CM MSI Z270 M3 | CPU Intel I7-7700K | CG Nvidia GTX 1080 | RAM 16Go | tripleBoot : Debian 11 | MXlinux 21 | LMint 19.3 | XFCE
Tour2 (custom)CM Gigabyte | CPU AMD Athlon 5200+ | CG Nvidia GTX 560 | RAM 6Go | FreeBSD 12.1 XFCE
Portable1 MSI GF75 Thin 9SC | CPU Intel I7-9750H | CG Nvidia GTX 1650 | RAM 32Go | dualBoot : LMint 20.2 | MXlinux 21 | XFCE
Portable2 MacBook Air A1466 (2015) | CPU Intel I5-5250U | CG Intel HD Graphics 6000 | RAM 8Go | dualBoot : macOS Sierra | MXlinux 21 XFCE
─────( pour une informatique libre ! -membre en stand-by de l' April.org────────────────

Avatar du membre
cyrille
Administrateur du site
Messages : 12285
Enregistré le : mar. 19 sept. 2017 08:49
Localisation : Nowhere
Contact :

Re: Quels outils de diagnostic suite à un refus de démarrage ?

Message par cyrille »

SI tu es derrière une box et que tu n'as pas fait de config exotique du pare-feu, tu peux le virer, il ne sert à rien....
Au pire si tu veux le garder, tu configures le service pour qu'il se lance après la séquence complète de démarrage....
Perso, je le virerais, purement et simplement ;)
Je suis un peu surpris par ce problème avec ufw qui ne m'avait jamais causé de soucis depuis 4 ans. Merci d'avance pour vos avis éclairés. ;)
--> log voir ce qui le bloque ...
?séuqartéd sel ruoP / sécnoféd sel ruoP / sreiruréB sel ruoP / ?étéicos elleuQ

https://crust.ovh

Répondre