La conservazione del sapere nella società dell’informazione
DI IGOR GUIDA
(Vicepresidente Cooperativa Stripes, è stato tra i fondatori del MiLUG, Milano Linux User Group)
Pur convinti che l’evoluzione tecnologica ci apra a sempre più importanti traguardi in relazione alla capacità di archiviare e ricercare informazioni attraverso la digitalizzazione dei nostri prodotti testuali, musicali e video, ci pare legittimo interrogarsi sull’effettiva capacità di questi prodotti di permanere intatti nel tempo. Se da un lato è vero che le informazioni digitali – composte da bit e quindi da numeri – permettono una riproduttività in infinite copie identiche all’originale (cosa non peraltro non sempre vera se, ad esempio, pensiamo ad un nastro magnetico musicale ed alla perdita di qualità per ogni riproduzione successiva del suo contenuto), resta pur vero che anche le informazioni digitali necessitano di supporti sui quali essere registrate e che tali supporti sono passibili di degrado, tanto quanto lo erano quelli del passato. Qual’è allora la differenza che impone sempre più ad università, archivi ed enti di ricerca una riflessione su tali argomenti? La preoccupazione nasce dalla natura delle informazioni archiviate sui supporti digitali. Se una foto invecchia, diventa gialla, oppure, se si graffia, nasconde in parte l’informazione contenutavi, ma essa resta senz’altro intellegibile all’occhio di chiunque. Se invece un DVD o un CD-ROM si graffia, le informazioni che vengono perse sono milioni di volte più grandi, perché la cancellazione di quei numeri può impedire potenzialmente l’intellegibilità dell’intero contenuto del DVD.
Per fare un altro esempio, potremmo dire che un film impresso su una pellicola è passibile di degrado; e se non si provvede entro un determinato periodo di tempo al restauro si rischia di perdere gradatamente la nitidezza dei colori, di vederne le scene sempre più rovinate, in continuo e lento processo di invecchiamento del supporto analogico che resta, pur sempre, riparabile e ricostruibile fintanto che non è materialmente e completamente distrutto. Ciò non vale per un film che esista solo nel formato digitale; in questo caso, infatti, il supporto sul quale esso è registrato potrebbe subire un danno che lo farebbe semplicemente “sparire”. Certo, oggi è più facile avere un numero sempre maggiore di “originali” (essendo le copie identiche per natura all’originale), ma ciò non toglie che il volume di informazioni che produciamo ogni giorno aumenta in maniera esponenziale e che il problema di come garantire che le informazioni oggi custodite restino fruibili il più a lungo possibile è reale. Una questione non trascurabile è data dalla longevità del supporto sul quale sono memorizzate le informazioni. Nonostante il dato sia di tipo digitale, il supporto sul quale è impresso è materiale e dunque deperibile. Tutti sperimentiamo questo effetto: basti pensare ad esempio a film su cd-rom acquistati una decina di anni fa o a fotografie memorizzate su CD-ROM, che magari già oggi non risultano più leggibili. In rete si trovano moltissimi esempi di durata dei supporti con tabelle che indicano in 5 anni la durata media delle chiavette USB, 12 anni i CD-ROM (potenzialmente tra i 5 e i 100) di qualità e fino a 15 ani i DVD conservati al meglio. Come si può notare sono comunque ben poca cosa se paragonati ad esempio alle Microforme1 che raggiungono tranquillamente gli oltre 500 anni e, ancora, se paragonati alle incisioni su pietra che superano le migliaia d’anni. Un altro aspetto importante da considerare è legato all’obsolescenza della tecnologia. Negli ultimi vent’anni, infatti, abbiamo assistito ad un proliferare di supporti, ognuno dei quali disponeva di un apposito apparato fisico (hardware) preposto alla loro lettura. Oggi molti dispongono di cartucce a nastro magnetico, dischi Zip, dischi magneto-ottici e via dicendo, per i quali non esistono più in commercio i relativi lettori (e, se esistono, per la loro sottrazione al mercato di massa sono particolarmente costosi). Pertanto, per quanto concerne i dati archiviati su questi supporti, se anche fossero ancora leggibili, non riusciremmo a leggerli, causa la continua evoluzione tecnologica. Forse è per i motivi finora illustrati che esistono progetti come il Rosetta Disk del The Long Now Foundation (www.longnow.org) che contiene 1.500 idiomi in 14 mila micropagine visibili a occhio umano solo con lenti 500x. Il prototipo del disco di 7,6 cm di nichel serve a sperimentare nuove forme di “memoria a lungo termine” con l’obiettivo di conservare le informazioni per 10.000 anni. Un ulteriore aspetto da considerare è legato al formato in cui i nostri dati sono salvati. In un interessante articolo di Franco Guadagni viene posta l’attenzione sulle tematiche qui trattate ed in particolare, per quanto concerne i formati, l’autore afferma: “Il problema dell’interpretazione dei dati è simile a quello che per anni ha afflitto gli studiosi di storia dell’antico Egitto: i geroglifici erano lì, evidenti, scolpiti sulla pietra o dipinti sui muri e sui papiri, ma come interpretarli?”. Pertanto anche disponendo dei dati, come si potrebbero interpretare in maniera corretta? Ancora Guadagni: “Certo, se fossero caratteri di testo codificati in ASCII (American Standard Code for Information Interchange), uno degli standard più longevi della storia dell’informatica, potrei ancora facilmente decifrarli, ma se l’informazione fosse scritta in un qualche codice “geroglifico” dell’era dell’Antico Egitto Informatico, sarebbe praticamente indecifrabile a soli trenta anni di distanza dalla sua scrittura, altro che millenni!”.
Quella degli standard informatici è una tematica a cui occorre prestare la massima attenzione quando si memorizza una informazione che per qualche motivo è importante. Un esempio che può servire agli appassionati di fotografia: oggi le fotocamere digitali di classe medio-alta hanno la possibilità di memorizzare le immagini ritratte, oltre che in formato JPEG (Joint Photographic Expert Group che, come molti sanno, è un formato compatto che però non mantiene intatta la qualità originale della foto) anche in formato cosiddetto raw, che riporta con completezza l’immagine catturata dal sensore CCD (Charge Coupled Device) che sostituisce la pellicola fotografica in una macchina digitale. Il formato raw dipende perciò dalla particolare fotocamera usata, e solo il software che accompagna quella particolare fotocamera è, in generale, in grado di decifrarlo. Se, per lo scrupolo di conservare esattamente le foto così come sono state scattate, si memorizzasse su CD il formato raw, ciò probabilmente in prospettiva sarebbe un errore, poiché la probabilità che tra dieci anni il software di decodifica di quel particolare formato sia ancora usato e possa essere eseguito sui sistemi operativi che ci saranno a quell’epoca, è estremamente bassa. Molto più logico sarebbe invece immagazzinare l’immagine in qualche altro formato standard che ugualmente la conservi nella sua integrità, per esempio TIFF (Tagged Image File Format) o PNG (Portable Network Graphics). Tale problema è molto sentito in ambiti anche professionali di conservazione dell’informazione, tanto che una delle aziende leader nel campo della pubblicazione di documenti elettronici, la Adobe, proprietaria del formato PDF (Portable Document Format), ha attivato una collaborazione con l’organizzazione internazionale di standardizzazione ISO per la pubblicazione di uno standard di derivazione del formato PDF, per consentire la sua decifrabilità svincolandola dall’uso di un software specifico di proprietà dell’azienda.” Quest’ultimo aspetto è di gran lunga il più importante e delicato e vale la pena di soffermarvisi. Se, da un lato, esperimenti come il citato “Rosetta Disk” ci fanno ben sperare in un futuro che veda supporti capaci di mantenere i dati al proprio interno per un periodo di gran lunga superiore a quello odierno, dall’altro resta eclatante il problema relativo ai formati con i quali le informazioni vengono salvate. Se ci fermiamo, infatti, a pensare alla mole di informazioni inerenti il ‘900 cui oggi gli storici possono attingere, sappiamo che si tratta di documenti prevalentemente testuali (e quando di altro tipo, come foto e filmati, di tipo analogico); e pertanto è possibile recuperare i dati in essi contenuti fintanto che il degrado non sia tale da impedirne la completa decodifica e cioè siano completamente distrutti. Rispetto al XXI ed al XXII secolo come si comporteranno gli storici? Come abbiamo visto, i problemi ai quali andranno incontro riguarderanno fondamentalmente i supporti sui quali la mole – in continua espansione – di informazioni prodotte sarà archiviata ma anche – se non soprattutto – in quali formati essa sarà custodita. Diventa pertanto fondamentale promuovere la divulgazione di formati aperti, non vincolati, cioè, da brevetti che ne impediscano la leggibilità. Per meglio intenderci, già oggi è esperibile la difficoltà con la quale si accede ai nostri scritti, prodotti con software di videoscrittura (ad esempio Word di Microsoft) risalenti soltanto qualche anno fa e che non sono più supportati dai produttori, impedendoci di fatto l’accesso alle informazioni in essi contenuti. Sicuramente oggi ci si può avvalere di aziende che ci aiutano in questa trasposizione dei contenuti in formati leggibili dai software di videoscrittura contemporanei, a patto di sborsare cifre non irrisorie. Ma cosa accadrà tra dieci anni? E tra cento o mille? Il problema maggiore sarà quello di decifrare la moltitudine di formati chiusi creati dalle varie software-house, per definire standard di fatto che non danno però alcuna garanzia sul lungo termine. Pertanto l’unico modo di archiviare informazioni, siano esse immagini, filmati, suoni o scritti è quella di farlo avvalendosi di formati aperti e liberi. Un contributo fondamentale in tal senso viene dalla Free Software Foundation e dall’adozione dei formati aperti che permettono a chiunque di essere integrati nelle proprie applicazioni disponendo di tutta la documentazione necessaria all’implementazione degli stessi, garantendo anche per il futuro la loro leggibilità. La Free Software Foundation (FSF), fondata da Richard Stallman il 4 ottobre 1985, è un’organizzazione non governativa, non-profit, che si occupa di eliminare le restrizioni sulla copia, sulla redistribuzione, sulla comprensione e sulla modifica dei programmi per computer. La FSF opera promuovendo lo sviluppo e l’uso delsoftware libero in tutte le aree dell’informatica, ma principalmente contribuendo allo sviluppo del sistema operativo GNU. L’accesso al software determina chi può partecipare a una società digitale. Quindi le libertà di usare, copiare, modificare e redistribuire il software, descritte nella definizione di Software Libero, consentono a tutti una pari possibilità di partecipazione all’era dell’informazione. La visione del Software Libero consiste nel fornire una solida base per la libertà in un mondo digitale, sia dal punto di vista economico che sociale/etico. Il Software Libero è una pietra miliare per la libertà, la democrazia, i diritti umani e lo sviluppo di una società digitale. La FSFE (Free Software Foundation Europe) si dedica a supportare il Software Libero in Europa in tutti i suoi aspetti. Creare consapevolezza per questi temi, rafforzare il Software Libero politicamente e legalmente, dare libertà alle persone supportando lo sviluppo di Software Libero, sono questioni centrali per la FSFE. Uno degli aspetti su cui pone attenzione maggiore riguarda proprio gli Open Standard e cioè, appunto, tutti quei formati software che non siano coperti da brevetto. Per fare degli esempi: – un documento scritto con la Suite Miscrosoft Office (.docx, .xlsx, .pptx, etc.) è un formato proprietario della Microsoft ed esiste ed esisterà solo e soltanto finché converrà economicamente alla stessa Microsoft tenerlo in vita (diversi di noi hanno già sperimentato ad esempio l’impossibilità di aprire documenti creati con versioni vecchie di Word, obbligandoci ad aggiornamenti continui dettati dalle nuove release del software) o finché la stessa non cesserà le proprie attività sul quel specifico campo; – un documento Open Documents, come i file prodotti dalla suite OpenOffice. org (che usa, invece, gli Open Document Formats come .odt, .ods, .odp, etc.) esiste oggi ed esisterà sempre in quanto, appunto, è uno standard aperto. Non è una questione di poco conto questa, perché nessun utente sentirebbe il bisogno di aggiornare il software di videoscrittura, come Word e OpenOffice, se non intende cambiare il contenuto del documento e pertanto l’informazione in esso contenuta. Pertanto il pericolo è che tutti i contenuti prodotti(non solo testi, ma anche immagini, filmati, musica etc.) con formati proprietari (non software, ma formati proprietari) sono intrinsecamente in pericolo e non vi è alcuna garanzia che in futuro sarà possibile accedere al contenuto. Un ipotetico archeologo del futuro che dovesse ritrovarsi per le mani dei documenti salvati in questi formati dovrebbe necessariamente avvalersi di tecnici informatici che proverebbero attraverso tecniche particolari a decifrare prima il formato e solo se vi riusciranno saranno in grado di leggerne il contenuto. L’ultimo aspetto da considerare è l’insidia data dal D.R.M. (Digital Rights Management) che ha lo scopo ufficiale di garantire il diritto d’autore ma ottiene una serie di incredibili effetti collaterali che arrivano a sottrarre il diritto di accesso alle informazioni contenute nei nostri file. Con Digital Rights Management (DRM), il cui significato letterale è “gestione dei diritti digitali”, si intendono i sistemi tecnologici mediante i quali i titolari di diritto d’autore (e dei cosiddetti diritti connessi) possono esercitare ed amministrare tali diritti nell’ambiente digitale, grazie alla possibilità di rendere protette, identificabili e tracciabili, le opere di cui sono autori. I DRM sono spesso chiamati “filigrana digitale”, in quanto le informazioni nascoste che vengono aggiunte ai file hanno lo scopo di regolamentarne l’utilizzo, come la filigrana delle banconote che ne impedisce la falsificazione. Tramite i DRM, i file audio o video vengono codificati e criptati in modo da garantire una più difficile diffusione, impedimenti all’utenza e consentirne un utilizzo: limitato (ad esempio solo per determinati periodi di tempo o per determinate destinazioni d’uso); predefinito nella licenza d’accesso fornita (separatamente) agli utenti finali. Se il Software Libero è il software che mette l’utente in grado di controllare i propri computer e dispositivi, al contrario, il D.R.M. (che diventa Digital Restriction Management secondo la FSF e non solo) è una tecnologia per mettere l’utente sotto il controllo di terzi fornitori di materiali audiovisivi o testuali. Questi due fini appaiono fondamentalmente incompatibili per FSFE. Ma non è solamente FSFE a vedere problemi con il DRM. La società tedesca per le scienze informatiche (“Gesellschaft fu?r Informatik”) dice: “Se il DRM prevalesse sul mercato, allora gli utenti perderebbero il controllo dei loro computer”. Symantec (azienda leader indiscussa nella realizzazione di software per la sicurezza di sistemi e personal computer) condivide questa opinione: “Come risultato, i clienti di tutto il mondo perderanno la possibilità di scegliere le soluzioni per la sicurezza che vogliono usare sui propri sistemi operativi, e saranno costretti ad utilizzare quelle soluzioni offerte o permesse da Microsoft”. Questa perdita di controllo significa che case editrici, stazioni TV, governi (incluse le loro amministrazioni), banche, società produttrici ed individui, perderanno il controllo non solo sulle loro schede grafiche, monitor e dischi, ma anche sui loro cellulari, fotocamere digitali e qualsiasi altra periferica digitale che in teoria dovrebbe essere in loro possesso.
In conclusione possiamo dire che non solo abbiamo molta strada da fare sul versante supporti affinché essi restino accessibili per il numero maggiore possibile di anni, ma dovremo anche e soprattutto attuare politiche e sensibilizzazioni generali in merito ai formati aperti, alla loro diffusione, partendo magari da quelli relativi ai documenti prodotti dalle nostre pubbliche amministrazioni e dai nostri enti di ricerca, Università e così via, oltre ovviamente a contrastare sistemi quali il D.R.M.
1 Microforme: Sotto il termine generico di microforme si individua un certo numero di formati: i più famosi di questi sono i nastri di microfilm da 35mm o da 16mm e le più recenti microfiche, che assomigliano ad una scheda plasticata. I microfilm, a loro volta, possono essere tagliati in strisce corte ed essere alloggiati in contenitori separati in modo tale da creare delle microfiche. Diversamente della relativa controparte digitale, il microfilm è il prodotto di una tecnologia statica e definita da standard nazionali. Una volta creato e memorizzato secondo questi standard, il microfilm vanta una speranza di vita superiore ai 500 anni; inoltre, mentre i dati digitali richiedono l’uso di un sistema informatico specializzato, le microforme possono essere lette ad occhio nudo usando soltanto luce e lente d’ingrandimento. A ciò si aggiunge che, al momento, il potenziale accesso alle microforme è evidentemente superiore se paragonato a quello della tecnologia digitale.