
Eccoci con la rubrica ormai settimanale dedicata all’intelligenza artificiale usata male, diventata un vero e proprio trend sul portale, dal titolo AI, Ahi.
Si parte dalla notizia riportata da Phoronix, a proposito di Chardet, un rilevatore di encoding dei caratteri scritto in Python, sul cui repository GitHub è stata aperta una issue dall’utente a2mark, ossia Mark Pilgrim, l’autore originale del progetto, il quale si è rivolto agli attuali maintainer prima ringraziandoli e poi segnalando quella che per lui è una grave problematica da indirizzare, dal titolo “No right to relicense this project“:
However, it has been brought to my attention that, in the release 7.0.0, the maintainers claim to have the right to “relicense” the project. They have no such right; doing so is an explicit violation of the LGPL. Licensed code, when modified, must be released under the same LGPL license. Their claim that it is a “complete rewrite” is irrelevant, since they had ample exposure to the originally licensed code (i.e. this is not a “clean room” implementation). Adding a fancy code generator into the mix does not somehow grant them any additional rights.
I respectfully insist that they revert the project to its original license.
Tuttavia, è stato portato alla mia attenzione che, nella release 7.0.0, i manutentori affermano di avere il diritto di “cambiare la licenza” del progetto. Non hanno alcun diritto del genere; farlo costituisce una palese violazione della LGPL. Il codice concesso in licenza, quando modificato, deve essere distribuito con la stessa licenza LGPL. La loro affermazione che si tratti di una “riscrittura completa” è irrilevante, poiché hanno avuto ampia esposizione al codice originariamente concesso in licenza (ovvero, questa non è un’implementazione “clean room”).
L’aggiunta di un elaborato generatore di codice non conferisce loro magicamente alcun diritto aggiuntivo.
Quindi, riassumendo la questione è semplice: dopo aver riscritto porzioni importanti del codice del progetto, si è anche passati alla modifica della licenza, cosa che ha provocato la reazione di Pilgrim.
La parte rilevante del problema è rappresentata dal commit incriminato, il quale si presenta come da screenshot:

Oltre agli interessanti autori, che sono l’attuale maintainer e “claude”, che sta ovviamente per Claude Code, l’assistente AI di Anthropic, la cosa che balza all’occhio è chiaramente l’aggiunta del file LICENSE che specifica la licenza MIT.
MIT, come sapranno i lettori, è una licenza molto più aperta della LGPL scelta in origine dal creatore di Chardet, e quindi porta una modifica sostanziale, non tanto al codice, ma all’utilizzo che ne può essere fatto.
La modifica in questione ha riguardato anche il file README.md che oggi si apre così:
chardet 7.0 is a ground-up, MIT-licensed rewrite of chardet.
chardet 7.0 è una riscrittura completa di chardet distribuita con licenza MIT
Quindi, secondo l’autore, a giustificare il cambio di licenza c’è l’intera riscrittura del software.
Ovviamente la questione è stata discussa ampiamente nei commenti, tra favorevoli e contrari alla mossa, ed infine la issue è stata chiusa, un po’ perché stava diventando una classica discussione social, ed un po’ perché, probabilmente, era il modo più rapido per ignorare la richiesta originale, che quindi è stata scartata (così come una seconda issue aperta poco dopo).
Ai posteri l’ardua sentenza.
È una cosa legittima cambiare la licenza come è stato fatto in questo caso?
Se la riscrittura è stata fatta dando in pasto all’LLM di turno il codice originale, non è questo sufficiente per definire la nuova versione un lavoro derivato?
Considerato come l’istruzione dei modelli è stata fatta in maggioranza (se non totalità) su codice open-source, qualsiasi lavoro generato da un LLM non è a sua volta derivato?
Parliamone.
Intanto la licenza del progetto è, e probabilmente rimarrà, MIT, che almeno è una licenza libera.
Da sempre appassionato del mondo open-source e di Linux nel 2009 ho fondato il portale Mia Mamma Usa Linux! per condividere articoli, notizie ed in generale tutto quello che riguarda il mondo del pinguino, con particolare attenzione alle tematiche di interoperabilità, HA e cloud.
E, sì, mia mamma usa Linux dal 2009.





















Lascia un commento