C’era una volta il libro

Ricordo che quando ero ragazzo consideravo i miei libri quasi come un patrimonio che avrei potuto conservare e magari trasmettere ai miei figli. Quando ho avuto occasione di rivederli a distanza di anni mi sono reso conto che si trattava solamente di un’illusione di stabilità, di durevolezza, e che anche la mia piccola biblioteca obbediva alle leggi generali che determinano la degradabilità di ogni prodotto della cultura umana.
Infatti, la carta era ingiallita e varie macchie si erano create sulle pagine. Il libro si era quindi trasformato in un oggetto che non invitava alla lettura e che appariva sgradevole alla vista.
Quando si acquista consapevolezza di questa inevitabile degradazione, che colpisce in maniera particolare il libro contemporaneo, la fiducia nel libro come strumento capace di raccogliere informazioni in maniera stabile viene a mancare, in parallelo con l’aumento di affidabilità del prodotto digitale. Non essendo un bene durevole, risulta necessario sottoporre il libro a un processo che ne consenta la conservazione su altro supporto, più facilmente riproducibile, per garantire la durata nel tempo dei suoi contenuti testuali e grafici. Questo supporto può essere sia di natura analogica che digitale; ma mentre le riproduzioni analogiche (fotografia, microfilm) sono preferibili per la durata e l’affidabilità, la soluzione digitale risulta vincente per la maggiore versatilità e portabilità. Purtroppo, per il ben noto fenomeno dell’obsolescenza tecnologica, nemmeno la soluzione digitale appare durevole, anzi sembra molto meno stabile della stessa carta contemporanea, ma attraverso varie strategie conservative finisce col garantire una durata non effimera e un futuro certo alla nostra produzione di parole e immagini.

Naturalmente l’avvento del digitale non significa che dobbiamo rinunciare a conservare il materiale originale, ma che possiamo prima di tutto cercare di limitare lo stress cui il libro è sottoposto, evitandone gli spostamenti e impedendone la consultazione, e che possiamo infine tentare di prolungarne la sopravvivenza sottoponendolo ad operazioni di restauro.
Quando il libro è seriamente usurato, non può più essere letto perché il suo utilizzo equivale alla sua distruzione; la sua fruibilità come supporto che veicola contenuti viene a cessare. Si trasforma in questo caso in oggetto d’antiquariato, che può ancora avere un valore economico, sia pure limitato dal cattivo stato di conservazione, e un valore di documentazione della produzione dell’industria culturale. A questo punto la scelta di sottoporlo a tecniche che ne stabilizzino nei limiti del possibile le condizioni diventa una scelta politica, ovviamente se il libro fa parte del patrimonio pubblico. Il cittadino è disposto ad accettare che una parte delle risorse create con il gettito delle imposte sia destinato alla conservazione di un bene percepito come minore, come il libro, anziché alla sanità o alla scuola o magari al restauro dei beni artistici, questi sì percepiti come beni culturali di primaria importanza, anzi come i soli beni culturali che valga la pena di conservare? In un’epoca neomedievale come l’attuale, in cui l’immagine è dominante, La risposta è ovvia e pertanto probabilmente il libro dovrà attendere tempi migliori, oppure essere trasformato esso stesso in immagine attraverso la digitalizzazione. Non a caso molti progetti di conversione digitale prevedono l’acquisizione delle pagine del libro in formato immagine, sia pure con caratteristiche che consentano in una fase successiva la trasformazione in formato testuale.
Sembra quindi che si vada verso una vita culturale che proceda per immagini, da gestire e catalogare proprio come immagini e non solo come insiemi di significanti testuali e conseguentemente di contenuti.
Probabilmente avremo più possibilità di richiedere, ricevere e selezionare informazioni, che avranno, indipendentemente dalla loro struttura, l’aspetto di un’immagine, costituita da un insieme di punti (i pixel) diversamente colorati. Le pagine cartacee saranno sostituite da milioni, miliardi di immagini depositate su server e disponibili attraverso quella che viene definita rete geografica o WAN.
Il nostro collegamento alla rete probabilmente non avverrà più mediante l’attuale pc, ma attraverso un suo diretto o indiretto discendente, che apparirà come una nuova specie di televisore. Il libro potrà essere letto o meglio consultato sullo schermo, ascoltato tramite un software di audiolettura, collegato con filmati che lo descrivono o con versioni cinematografiche o fiction derivate, o con apparati critici espressi in forma sonora o audiovisiva. Si potrà perciò leggere e approfondire la lettura, anche senza usare il libro, raggiungendo in tempi incredibilmente brevi quantità di informazioni incredibilmente elevate.
Secondo alcuni profeti questo nuovo tipo di fruizione potrebbe in tempi più o meno lunghi condurre alla morte del libro, almeno nella forma che conosciamo e utilizziamo e che ha accompagnato lo sviluppo della nostra civiltà dai tempi di Gutenberg ai giorni nostri. Si starebbe realizzando, cioè, una rivoluzione di portata simile a quelle che hanno condotto prima dall’uso dei supporti di metallo, legno o terracotta al papiro, da questo alla pergamena, dalla pergamena alla carta o ancora, dal libro manoscritto a quello che si serve della stampa a caratteri mobili.
I nostri nipoti potranno studiare il libro come un prodotto del passato, come si studiano le vecchie tecnologie, le soluzioni non più in uso. Il libro avrebbe lo stesso destino dell’aerostato o della macchina da scrivere, se vogliamo far riferimento a oggetti non troppo lontani da noi, oppure, se vogliamo far riferimento all’antichità, degli ostraka o delle tavolette cerate, per rimanere nell’ambito dell’universo della scrittura.

Migliorerà la comunicazione? Questo dipenderà come sempre non dal medium utilizzato ma dal linguaggio che si userà, che dovrà essere semplice e privo di ambiguità e contorcimenti sintattici. Se la funzione del linguaggio non è intesa come funzione di comunicazione, ma come mezzo di affermazione intellettuale e manifestazione (o dovrei dire epifania?) dell’appartenenza a un’élite culturale, allora si verifica la trasmissione di messaggi che vengono decodificati faticosamente e solo da una parte dei possibili destinatari. I critici, in particolar modo, giungono a costruire messaggi che hanno un’evidente destinazione elitaria e in cui si ha una contaminazione della funzione comunicativa con quella estetica: la critica, insomma, diventa essa stessa letteratura, poesia, retorica.

In realtà, gli attuali limiti della lettura digitale, in termini di portabilità, semplicità e immediatezza d’uso, fatica nella visualizzazione di un libro che sostituisce a un supporto opaco come la carta uno luminoso come lo schermo, sembra abbiano allontanato la fine dell’uso della carta come supporto di lettura, almeno fino a che non si affermino forme di comunicazione veramente alternative o di modalità di utilizzo più ampie e diverse degli attuali testi digitali, che per ora non hanno ancora grande diffusione (uso di e-ink, e-paper ecc.). Per ora anzi quello che viene prodotto con mezzi digitali viene di solito ancora stampato e letto su carta, con un’enorme spreco di risorse. Addirittura, l’enorme disponibilità di notizie su internet invoglia l’utente a stampare tutto quello che viene ritenuto di qualche interesse, producendo un gran numero di stampe da pc, che spesso vengono successivamente scartate.

Molte iniziative volte a rendere disponibile il libro in formato digitale hanno preso in considerazione la produzione di carattere letterario e soprattutto i classici della letteratura. Una politica che miri a una migliore diffusione della cultura e alla salvaguardia del libro originale deve dedicare sempre maggiori sforzi anche ai testi appartenenti ad altri settori quali filosofia, scienza, storia, arte, diritto e alla saggistica in genere.
In questo momento si assiste a una grande fioritura di progetti di digitalizzazione di periodici, cosa comprensibile, se si consideri che i periodici sono materiali che è estremamente difficile mantenere in buono stato, che contengono testi molto richiesti e che è complicato indicizzare in modo tradizionale. Non sempre esistono o sono disponibili indici e ancor meno frequenti sono gli spogli che segnalano i singoli articoli.
Le edizioni digitali di opere non letterarie si rivolgono a un pubblico che per lo più ricerca il libro non per leggerlo, ma per consultarlo. La distinzione tra lettura e consultazione è fondamentale per capire l’ambito di utilizzo e il futuro stesso del prodotto digitale. La lettura di testi digitali come attività edonistica non è certamente impossibile, ma è decisamente meno frequente della lettura di tipo tradizionale. La digitalizzazione di monografie o articoli di carattere non letterario offre invece uno strumento di consultazione che non ha rivali, in quanto l’utilizzo ludico di un’opera destinata allo studio o alla ricerca è eccezionale, rispetto al romanzo o alla poesia.

Il più grosso limite individuabile nelle operazioni di conversione in formato digitale è la normativa sul diritto d’autore, la cui applicazione di fatto sconsiglia la digitalizzazione e la conseguente pubblicazione sul web delle opere recenti. Ma bisognerà anche prima o poi tener conto della realtà dell’attuale produzione libraria che nasce digitale e diventa successivamente cartacea. Questa radicale trasformazione del processo produttivo non è considerata dalla normativa, che impone la conservazione solo del prodotto editoriale finito, in larga misura ancora cartaceo; mentre la versione digitale che precede la conversione in formato cartaceo non deve essere obbligatoriamente conservata. La sua persistenza dipenderà essenzialmente dalla sensibilità degli operatori del mondo tipografico ed editoriale. Si arriverà paradossalmente a digitalizzare in futuro prodotti cartacei nati in versione digitale, che sarebbero stati già disponibili al momento della creazione del libro. La mancata conservazione dei file digitali preparatori è originata spesso dal timore, per i detentori dei diritti di riproduzione del libro, che la stessa esistenza del file digitale possa favorire una disseminazione libera dei contenuti, con una conseguente perdita economica, timore inconsistente se la conservazione della copia digitale venisse affidata a un biblioteca pubblica che abbia facoltà di far visualizzare l’opera ma l’obbligo di non consentire la riproduzione di parti sostanziali, come già avviene per i libri cartacei soggetti a diritti di terzi.

Digitalizzare una raccolta significa anche adottare una strategia di conservazione del materiale digitale, che, come abbiamo visto, è per sua natura soggetto a danni irreversibili sia per le continue fughe in avanti della tecnologia, sia per lo stesso deperimento fisico dei supporti. Per quest’ultimo problema sarà sufficiente ricorrere alla presenza di un duplicato del supporto originale su supporto o alla conservazione su server dedicati, reintegrando immediatamente i dati in caso di crash del sistema. Più complesso è salvaguardare il prodotto digitale dall’obsolescenza tecnologica.
A questo fine si ricorre alla registrazione in forma strutturata di informazioni che ci forniscono tutti i dati utili al recupero dei contenuti degli oggetti digitali. Sono i cosiddetti metadati, che vengono inseriti in modo automatico negli stessi file che compongono il prodotto digitale, ricavati al momento dell’acquisizione dell’immagine, ma in una forma che ne consente l’esportazione in formati indipendenti dalle varie piattaforme tecnologiche, ad esempio XML, il più affermato dei linguaggi universali. Naturalmente il set di metadati deve essere scelto prima della digitalizzazione, per evitare il ricorso a costose procedure di adeguamento: bisogna infatti decidere che cosa si desidera conoscere del prodotto digitale e in quale forma. I metadati si distinguono in vari tipi, descrittivi, che forniscono informazioni sull’opera e fanno riferimento allo standard Dublin Core, amministrativi e gestionali (i MAG), che ci fanno sapere come, quando e da chi è stata digitalizzata un’opera, utilizzando sistemi come lo standard NISO, strutturali, che definiscono il rapporto tra le varie immagini e il record bibliografico cui fanno riferimento: si tratta in definitiva di una sorta di indicizzazione del documento, con l’indicazione delle pagine iniziali e finali delle varie sezioni in cui è articolato.
Questi tipi di metadati devono essere integrati, in una sola struttura, che attualmente in Italia è stata indicata dall’ICCU nello schema MAG.
Uno dei problemi per una politica che voglia attivare un processo di conversione del materiale librario in formato digitale è quello di saper elaborare progetti aggiornati e di saper aggiornare quelli già avviati da tempo. Un progetto che abbia qualche anno di vita difficilmente risulterà valido, senza qualche intervento di revisione delle specifiche e delle procedure.
Altra e finale constatazione sulle operazioni di acquisizione digitale è quella dell’impossibilità attuale di operare nel mondo del digitale lavorando in proprio, isolatamente: le esigenze poste da un lavoro di conversione digitale sono talmente tante che non è possibile evitare il ricorso agli specialisti.

Quanto detto finora è valido per ogni tipo di biblioteca; ma è interessante valutare quali risvolti presenti l’attività di trasformazione in biblioteca digitale per le biblioteche specializzate.
Le raccolte librarie organizzate intorno a un argomento o a una disciplina costituiscono un complesso di conoscenze in cui più che i singoli pezzi bibliografici hanno significato l’insieme, la struttura stessa della raccolta.
La ricerca nell’ambito della raccolta può essere tentata con metodi tradizionali, ma a costo di un enorme dispendio di tempo. Molto più agile e produttiva può essere la ricerca che utilizzi strumenti informatici, a vari livelli. Un primo livello è quello della ricerca per autore e titolo, che esige però conoscenze precise da parte del richiedente. Bisogna infatti già conoscere l’esistenza di un autore o di un’opera per poter accedere alle informazioni.
In questo modo funzionano sia i cataloghi cartacei, costituiti da schede bibliografiche, sia gli opac, cataloghi elettronici che consentono, è vero, un’interrogazione a distanza, ma non mettono in grado l’utente di conoscere il patrimonio. Utilissimi e inevitabili per la consultazione di cataloghi con centinaia di migliaia di record, potrebbero essere utilmente affiancati, nelle biblioteche di piccole dimensioni, o per la descrizione di singoli fondi da elenchi alfabetici informatizzati, che permettono di scorrere le schede virtuali e di avere notizia di tutto il materiale posseduto, scoprendo opere sconosciute e avendo la possibilità di sperimentare nuovi percorsi di ricerca, un po’ come avviene nelle biblioteche a scaffale aperto.
Un secondo livello di ricerca è quello che utilizza forme elementari di indicizzazione, che possono andare dalla tradizionale soggettazione alla creazione di parole chiave che consentono il reperimento di informazioni contenute nell’opera, anche se non prevalenti.
In alternativa alla soggettazione si può adottare una forma di classificazione, che ha il merito di organizzare la raccolta in base ai contenuti, ma soggiace al criterio di prevalenza, per cui è necessario individuare la classe principale in cui l’opera deve essere inserita, a scapito di altre materie e contenuti che vengono di conseguenza ritenuti meno rilevanti e non segnalati.
Un livello molto più aperto e completo è la ricerca full text, che consente il reperimento di un’informazione esaminando in maniera automatica l’intero testo dell’opera. La ricerca full text funziona egregiamente con termini di ricerca a bassa entropia; con termini ad alta entropia, oppure polisemici, usati con elevata frequenza e nei più svariati contesti, restituisce un numero eccessivo di occorrenze, per cui diventa eccessivamente costoso in termini di tempo esaminare tutti i casi. È noto che il messaggio statisticamente più probabile, che presenta un livello massimo di entropia, è praticamente privo di significato.

Per realizzare uno strumento che consenta questo tipo di ricerca non è sufficiente digitalizzare le opere, ma risulta necessario anche estrarne il testo.
Si può procedere con due tecniche diverse: ottenere direttamente l’estrapolazione del testo oppure realizzare un’immagine digitale e successivamente estrarne il testo.
La prima soluzione consiste nel sottoporre le pagine dell’opera ad una scansione con software di riconoscimento ottico dei caratteri (OCR); la scansione viene salvata come testo. Con questo sistema non è salvata, e viene pertanto a mancare, l’immagine. La correzione della lettura è effettuata direttamente confrontando il testo e anche successivamente non si avrà garanzia che il testo salvato sia effettivamente conforme al testo originale.
Con la seconda soluzione, la scansione genera un’immagine che viene salvata, ad una risoluzione ottica che può oscillare tra i 300 e i 400 spi. Questa stessa immagine digitale è quindi trattata con un software di OCR.
Questi software riconoscono la forma dei singoli caratteri e li restituiscono come testo. Il riconoscimento delle forme, che è una delle potenzialità più interessanti delle applicazioni informatiche, presenta però dei limiti e delle imperfezioni. Comunque sul libro moderno, stampato con caratteri ben definiti e correttamente conservato (come la stragrande maggioranza dei libri della biblioteca dell’Istituto Statale dei Sordomuti), si ottiene un riconoscimento quasi perfetto, con pochi errori per pagina, ma con molti dubbi da parte del programma, che esprime la sua perplessità colorando le parti non del tutto leggibili. Gli stessi programmi però sono in grado di imparare dai loro errori (funzione di ICR) e fornire un’interpretazione esatta dei segni evidenziati come dubbi e corretti dal revisore. Il limite di questi programmi e la scarsa fortuna del loro utilizzo in molti degli attuali progetti di acquisizione digitale è che necessitano dell’intervento umano. In termini economici si tratta di un impegno notevole, in quanto la revisione di interi libri comporta un gran numero di ore di lavoro: si tratta in definitiva di una sorta di correzione di bozze, lavoro ben noto a chi opera nel settore dell’editoria o nel ramo giornalistico. Ma l’opposizione all’uso da parte di alcuni informatici potrebbe rivestire anche contenuti ideologici, in quanto si basa sulla pretesa di risolvere ogni problema con i software, riducendo al minimo l’intervento umano. Ogni lavoro effettuato direttamente dall’uomo è considerato artigianale e scarsamente scientifico, dimenticando che è proprio il controllo umano sulla macchina a offrire la garanzia del nostro dominio di uomini e ad assicurare la nostra permanenza in un mondo che ormai potrebbe anche fare a meno della nostra presenza. In un lavoro di correzione automatica dei testi, in assenza di intervento umano, la macchina fa le proprie scelte, basandosi su vocabolari controllati, con risultati che possono essere non solo inaffidabili, ma addirittura comici. In particolare su testi letterari e storici dei secoli passati, come nei testi che utilizzano specifici linguaggi settoriali, risulta indispensabile per ora una correzione da parte di persone con adeguata predisposizione e discreta preparazione culturale.
Molte attività di controllo di questo tipo possono essere effettuate con ottimi risultati da volontari o stagisti, a patto che si effettuino controlli incrociati.
L’ultima fase da affrontare nella costruzione di una biblioteca digitale è la creazione di un’interfaccia web, cioè di una struttura che consente di rendere fruibili i contenuti predisposti al maggior numero possibile di utenti.
Bisognerà puntare più sulla coerenza strutturale delle pagine che sulla gradevolezza visuale della presentazione. Questo perché solo una composizione semplice e ben strutturata garantirà una visualizzazione apprezzabile e comprensibile con ogni tipo di browser e con ogni sistema operativo. La pagina, secondo questa logica, dovrà consistere in una serie di elementi strutturati gerarchicamente; mentre le costruzioni troppo ricche di elementi esornativi e inessenziali sul piano dei contenuti del messaggio rischiano di comprometterne la leggibilità, se applicate a dispositivi diversi dal pc e se interpretate da sistemi operativi differenti da quello per cui erano state elaborate.
Esistono per fortuna norme da seguire per la creazione di siti web che siano ad un tempo gradevoli e usabili e software che consentono di controllare il lavoro realizzato dal punto di vista dell’accessibilità e della correttezza sintattica. Particolare attenzione dovrà essere dedicata al colore, che non dovrà mai essere unico veicolo di un’informazione e che dovrà essere usato tenendo conto delle leggi che regolano la percezione da parte dell’occhio umano.
Le singole opere digitalizzate verranno integrate, con modalità strutturali e grafiche simili, al sito web che le ospita; potranno presentarsi sotto la forma di testi scaricabili o di immagini consultabili. In questo caso è consigliabile collegare alle immagini delle pagine il testo relativo. La presenza delle immagini sarà garanzia di conformità della versione digitale all’edizione cartacea originale, mentre il testo consentirà di fornire uno strumento di lavoro, che potrà essere copiato sul computer dell’utente ed elaborato secondo le sue esigenze. Il testo potrà inoltre essere letto e trasformato in formato audio per gli utenti non vedenti.
Si costituirà in questo modo un servizio che metterà i nostri libri digitali a disposizione di un pubblico universale, almeno finché internet e i suoi eventuali sostituti continueranno a esistere e svilupparsi, con una crescita che a volte può apparire caotica, ma che costituisce un colossale strumento d’informazione universale, utilizzato con sempre maggiore vantaggio, se usato in maniera corretta, da studiosi e cittadini del nostro villaggio globale.

Pubblicato in: Libri in azione…, a cura di Valeria Rossetti, Milano, Liceo artistico Statale Umberto Boccioni, 2005, pp. 50-57.

Lascia un commento