La nuova vita di Bzip2

Raoul Scarazzini

6 Giugno 2019

Quando si parla di tool Linux conosciuti ed utilizzati da tutti sarebbe sempre bene ricordarsi come il loro sviluppo non dovrebbe smettere mai. Solo che i tool sono tanti, il tempo è poco e strumenti ormai assodati vengono lasciati così come sono per anni, a volte decenni.

È perciò con piacevole stupore che leggiamo questo post di Federico Mena Quintero, sviluppatore GNOME, nel quale annuncia di aver preso in carico il mantenimento di bzip2 tool di (ultra) compressione da sempre strumento essenziale per tutti i sysadmin Linux.

La notizia è buona soprattutto se si considera come questo tool non viene sviluppato attivamente dal 2010 (non è stata pubblicata nessuna release da allora) e lo è ancora di più perché il piano di mantenimento prevede nuovi sviluppi (con la creazione di una catena di continuous integration), il fix di issue in stallo da tempo e, non ultimo, la migrazione al linguaggio Rust.

La speranza del maintainer, ed a questo punto di tutti noi, è quella di poter presentare la nuova release 1.0.7 il prima possibile, magari chi lo sa, in occasione dei dieci anni dall’ultima.

Complimenti e buon lavoro!

Raoul Scarazzini

Da sempre appassionato del mondo open-source e di Linux nel 2009 ho fondato il portale Mia Mamma Usa Linux! per condividere articoli, notizie ed in generale tutto quello che riguarda il mondo del pinguino, con particolare attenzione alle tematiche di interoperabilità, HA e cloud.
E, sì, mia mamma usa Linux dal 2009.

Notizie

Bzip2

4 risposte a “La nuova vita di Bzip2”

JustATiredMan

8 Giugno 2019

Rust ? e quale vantaggi ne trarrebbe ?
Marco Bonfiglio

11 Giugno 2019

Rust è un linguaggio compilato recente, sviluppato all’interno di Mozilla – ma ora open source esso stesso – semplicemente per essere meglio di altri linguaggi, C per primo, sia come velocità di esecuzione che come facilità di uso – specialmente per ridurre al minimo errori introdotti dal programmatore.
A parità di algoritmo (sequenza di istruzioni usate), per esempio ha vantaggi prestazionali rispetto a C nelle operazioni di lettura e scrittura nella memoria; quindi il primo vantaggio più immediato dovrebbe essere una maggiore velocità di esecuzione, visto che un compressore di dati usa pesantemente la memoria.
Rust è memory safe, ovvero effettua dei controlli in fase di compilazione per evitare degli errori fatti dai programmatori nell’uso della memoria – specialmente in C, giusto per ribadire; questi errori (come buffer overflow o memory leak) lasciano zone della memoria non usate, o accedono a zone in realtà assegnate ad altri programmi, eventi che nella migliore delle ipotesi portano al blocco del programma, ma che talvolta sono usati dai malware per infiltrare i propri dati.
Altro vantaggio di Rust, ma solo in prospettiva futura, è l’essere thread safe, ovvero avere meccanismi interni per rendere più facile – e coerente – la parallelizzazione dell’esecuzione – con ovvi vantaggi prestazionali. La caratteristica di Bzip2, per ottenere la sua efficacia di compressione, è di analizzare i dati in ingresso e ordinarli prima di comprimerli per avere dati simili vicini, cosa che aumenta l’efficacia di qualsiasi algoritmo di compressione; poterlo fare su più CPU dovrebbe essere un bel vantaggio.
JustATiredMan

11 Giugno 2019

Passi il discorso delle performances, del garbage collector etc., che ovviamente, non conoscendo io rust, lo devo prendere per buono, non vedo come sia possibile avere in C o qualsiasi altro liguaggio, accesso a zone di memoria riservate ad altri programmi, quando le architetture hardware attuali, hanno tutte protezioni della memoria (discorso diverso ovviamente se in C fai firmware per microcontroller).
Quella era roba, mi pare, che succedeva agli anni che fu con processori senza mmu.
Marco Bonfiglio

11 Giugno 2019

In C è perfettamente legale creare un array da 2 elementi e cercare di accedere al ventesimo, quindi i comandi – le istruzioni per la CPU – per fare questo sono generati (in fase di compilazione) ed eseguiti: l’MMU interviene solo se la memoria a cui si accede è assegnata ad un altro programma, terminando il programma “invasore” con un errore tipo “Out of bound” o “Segmentation fault”; per questo ho detto che nella migliore delle ipotesi porta al blocco del programma. Ma se si rimane in zone sempre assegnate a quel processo (o non ancora assegnate a nessuno, per quel che ne so), l’MMU non interviene.
Il meccanismo, se non limitato apposta, lascia spazio a degli attacchi: se il programma si aspetta una risposta da 2 KB ma 64 KB, i 62 KB in più verranno scritti (statisticamente la memoria usata sarà contigua a quella già assegnata, e apparterrà al processo stesso, quindi niente MMU). Questi dati possono essere un programma malevolo, e sarà in una posizione conosciuta, quindi accessibile con un’altra chiamata – serve un attacco diverso, per esecuzione di codice, ma esistono anche questi. L’esempio non è a caso: https://www.miamammausalinux.org/2016/02/cve-2015-7547-il-nuovo-bug-in-glibc-e-ancora-per-dns/

Lascia un commento

GitHub

Articoli

Saturday’s Talks

The Security Corner

Raoul Scarazzini

Capire l’affare OpenAI/Hugging Face è capire gli LLM open-weight, le tecniche di abliterazione ed il futuro

Curiosi di sapere quale sia il processo creativo dietro ai loghi di Ubuntu? Ve lo spiega Canonical!

Tutti i dubbi di LibreOffice su Euro-Office: non usare lo standard ODF aiuta Microsoft ed il lock-in

Un nuovo sito per le donazioni e tanti ricordi: KDE Compie trent’anni!

Git & Tricks – Pillole di source code management | Parte 3: l’importanza del rebase per un mondo migliore

Kubelab, un ruolo Ansible per imparare ad installare e gestire Kubernetes

Kubernetes, CPU Limits e Requests per i Pod, spiegazione e confronto: massimo controllo o massima efficienza?

Git & Tricks – Pillole di source code management | Parte 2: gestire i commit con empatia

Installare Kubernetes in ambienti totalmente isolati si può, kubeadm supporta gli Air Gap Cluster!

Git & Tricks – Pillole di source code management | Parte 1: un ambiente confortevole

Saturday’s Talks: il prezzo dell’AI? Con CUDA è vendor lock-in totale (anche) nelle distribuzioni Linux, senza alternative!

Saturday’s Talks: l’open-source è nulla senza la riproducibilità delle build

Saturday’s Talks: OpenStack entra nella Linux Foundation, che differenza c’è tra opportunità e ultima spiaggia?

Saturday’s Talks: l’open-source ha davvero bisogno di Dittatori? Empatia e Dittatura sono un ossimoro, ma solo la prima ci salverà!

wp2shell: due CVE per prendere il controllo di un sito WordPress… Senza alcun account!

Bad Epoll, altra falla del Kernel Linux che, stavolta, non risparmia nemmeno Android

GhostLock, nuova falla nel Kernel Linux e nel suo semaforo dei processi (mutex): root e fuga dai container

Sedici anni e non sentirli: Januscape colpisce il Kernel Linux e KVM, e permette di eseguire codice sull’host

I repository AUR di Arch Linux sono di nuovo nei guai per uno degli attacchi malware più estesi di sempre

Categories

Collabora con noi!