Tuesday, July 19, 2005

Pionieri italiani dell editoria elettronica


In Italia tra i pionieri che si occuparono di editoria elettronica si può ricordare per esempio che Stanislao Valsesia "riferiva della biblioteca elettronica e dell'Information retrieval; Carlo Tagliavini descriveva l'automazione nelle ricerche fonetiche (ma anche morfologiche e sintattiche) condotte sulla lingua contemporanea (di Diego Fabbri) nell'Istituto di Glottologia dell'Università di Padova (dall'allora laureando Antonio Zampollo); Silvio Ceccato si occupava di ciò che oggi chiameremmo traduzione automatica; Nanni Balestrini presentava un'esperienza di composizione automatica di poesia, mentre Franco Lucentini ricostruiva la storia degli automi e Umberto Eco argomentava intorno a La forma del disordine" (Raul Mordenti, Filologia ed elettronica in "Rivista IBM", anno XXVIII, numero 1, 1992, pag. 62).
Anche se la questione non è molto nota, va detto uno dei primi uomini al mondo che ha pensato di utilizzare il computer per l'analisi letteraria è un italiano.
Si tratta del padre gesuita Roberto Busa, del Centro Filosofico di Gallarate, studioso di Tommaso d'Aquino, uno dei primi al mondo a far convergere libro e computer. Sin dalla nascita dei primi calcolatori aveva pensato a un modo per utilizzarli nella catalogazione del corpus tomistico e per la creazione di indici sistematici. A New York, coinvolgendo IBM, sin dal dal 1949 ha cominciato a lavorare sulle macchine a schede perforate per inserire in un computer tutte le opere di S. Tommaso, in latino, codificando ogni parola e registrandone tutte le flessioni. Questo colossale lavoro lo ha impegnato per vari decenni e, agli inizi degli anni '90, è stato pubblicato su cd-rom. La sua opera ci permette oggi di rintracciare in pochi istanti tutti i passi che contengono una qualsiasi parola contenuta nei 118 libri di S. Tommaso e in altri 61 di autori contemporanei.
Questo approccio consente un'analisi linguistica del latino dell'epoca, dello stile dell'autore, delle occorrenze di ogni termine rapidissime. Le stesse operazioni, fatte a mano, richiederebbero mesi o anni di lavoro. E addirittura il sistema permette di distinguere i termini omografi, quei termini cioè, che si scrivono nello stesso modo ma derivano da lemmi differenti e possiedono perciò differenti significati. Cercando la parola facies, per esempio - che può essere sia il lemma faccia, viso, sia una forma flessa dal verbo facio (fare) -, il sistema avverte che esistono due significati possibili e richiede quale si desidera rintracciare.

In Italia un altro pionieristico lavoro di utilizzo del computer per la comprensione di un testo letterario, risale al 1965, ed è uno studio della Divina Commedia realizzato da IBM. I risultati di questo esperimento sono stati pubblicati in un voluminoso libro di circa 1.000 pagine in cui, oltre al testo di Dante, venivano riportate le concordanze, il lessico, il rimario e altri indici ottenuti mediante l'elaboratore. Il libro era stato preparato per celebrare il settimo anniversario del centenario della nascita del poeta e si avvaleva della consulenza di Carlo Tagliavini, ordinario di glottologia nell'Università di Padova. "Per le concordanze dantesche, - si legge nella prefazione - si può ragionevolmente pensare che un'opera eseguita unicamente con mezzi manuali come quella del Fay abbia occupato il suo autore per non meno di 5 o 6 anni. Per lo stesso lavoro (e per di più completo e non con l'omissione delle parole di frequenza maggiore) una volta eseguita la perforazione delle schede (che ha impegnato 2 perforatrici per 1 settimana), il sistema IBM 7090-1401 non ha impiegato più di 9 ore! A ciò si deve aggiungere la programmazione preventiva e tutto il lavoro di controllo, di divisioni e inserzioni manuali..." (Dante Alighieri, La Divina Commedia. Testo, concordanze, lessici, rimario, indici, IBM Italia, 1965, pag. XXI). Oggi naturalmente, con un semplice personal computer si impiegherebbe molto meno.
I dati pubblicati su questo voluminoso catalogo, contenevano gli elenchi delle concordanze erano disponibili sia in ordine alfabetico che in ordine di frequenza. Così si può vedere facilmente che la parola che ricorre maggiormente è la congiunzione "e" che compare 1341 volte nell'Inferno, 1281 nel Purgatorio e 1262 nel Paradiso, per un totale di 3884 occorrenze. La scelta di pubblicare questi dati su un libro di carta a quei tempi era obbligatoria, per farli circolare. Oggi, la stessa quantità di informazioni non ha più bisogno di un supporto fisico, e potrebbe viaggiare in pochi istanti da un capo all'altro del mondo grazie al WEB.

Ma va detto che questi lavori pionieristici qui citati (a parte l'opera di Roberto Busa che ha avuto una certa diffusione nel mondo tra gli accademici che si occupano di Tommaso), non hanno avuto una diffusione di massa e sono rimasti degli esperimenti un po' chiusi nel cassetto. Perché potesse nascere un'editoria elettronica di massa, e un mercato, dovevano ancora realizzarsi molte altre tappe. E infatti ci sono voluti alcuni decenni perché questo accadesse.

0 Comments:

Post a Comment

<< Home