Il Kernel Linux 6.1 agevolerà la scoperta di CPU problematiche

Tra l’immenso numero di patch che vengono proposte per le nuove versioni del Kernel Linux, che come sappiamo è prossimo alla maturazione della milestone 6, ce n’è una in particolare molto interessante che abbiamo scoperto tramite l’amico Michael Larabel di Phoronix il cui scopo è quello di segnalare le così dette faulty CPU (o meglio lo specifico core della CPU) in tempo reale.

La modalità con cui il malfunzionamento viene rilevato è spiegata all’interno del commit relativo alla patch che, da quel che si capisce, a fronte di un segfault di questo tipo:

  segfault[1349]: segfault at 0 ip 000000000040113a sp 00007ffc6d32e360 error 4 in \
	  segfault[401000+1000] likely on CPU 0 (core 0, socket 0)

Scatena un messaggio che segnala all’utente il malfunzionamento.

Come lo stesso autore segnala, la feature è perfettibile, ma rimane uno dei pochi sistemi per capire se all’interno di una CPU qualche core non stia facendo il suo dovere correttamente.

Chiaramente l’approccio utilizzato espone il fianco a casistiche molto comuni nell’utilizzo dei sistemi moderni: ad esempio ambienti virtualizzati in cui le VM hanno un accesso verso la sottostante CPU filtrato da QEMU/KVM che “filtra” in qualche modo potenziali problemi, e quindi il punto di osservazione di questi problemi diventa particolarmente ostico da trovare: dovrebbe essere l’host o il sistema virutalizzato?

Il livello di complessità dell’argomento quindi è chiaramente alto, ma come scrive l’autore:

This is a racy snapshot, but it’s better than nothing.

Questo è un tentativo audace, ma è meglio di niente.

Da sempre appassionato del mondo open-source e di Linux nel 2009 ho fondato il portale Mia Mamma Usa Linux! per condividere articoli, notizie ed in generale tutto quello che riguarda il mondo del pinguino, con particolare attenzione alle tematiche di interoperabilità, HA e cloud.
E, sì, mia mamma usa Linux dal 2009.

Tags: , ,