"La Rivista di Engramma (open access)" ISSN 1826-901X

57 | maggio 2007

9788898260881

La filologia assistita dal computer

Pasquale Stoppelli

Convegno Luminar 6. Internet e Umanesimo. Mercurio e Filologia: la critica a nozze con il web | Fondazione Querini Stampalia, Venezia, 1-2 febbraio 2007

Il rapporto fra filologia e informatica può essere considerato da due differenti punti di vista: da un lato concerne la disponibilità di un supporto praticamente illimitato e una tecnologia che consente di superare il criterio della sequenzialità; dall'altro la possibilità che l'informatica applicata ai testi letterari restituisca iuxta sua principia informazioni che per quantità e qualità vadano oltre le possibilità delle acquisizioni individuali.

Nel primo caso il mezzo informatico ha il vantaggio di poter documentare integralmente la tradizione significativa (in formato testo e/o immagine), ma anche di dar vita a modalità nuove di rappresentazione del testo, dell'apparato, dell'eventuale paratesto ecc.: questo impiego del supporto digitale sembra soccorrere alcuni punti di vista propri della più recente critica filologica, soprattutto di ambito romanzo, dove è in crisi l'idea dell'edizione critica come definizione rigida di un testo e invece si fa spazio un'idea di testo "plurale", ovvero l'idea di testo come diasistema, sistema di sistemi testuali. Nel secondo caso la tecnologia, per la sua capacità di processare una quantità enorme di dati, si trasforma in mezzo euristico, mette in evidenza aspetti e fenomeni della testualità che l'occhio e la memoria altrimenti non riuscirebbero a cogliere.

Secondo alcuni, la pagina di stampa non sarebbe strutturalmente adeguata a rappresentare il testo nella sua pluralità. Anzi l'idea dell'edizione del testo come testo unico ("singolare") sarebbe stata determinata proprio dalle caratteristiche del mezzo della sua trasmissione. Se dal supporto cartaceo i contenuti testuali si trasferiscono in quello digitale si dischiudono spazi illimitati che consentono di esibire non "il testo" ma "i testi", non un ipotetico testo che aspira a coincidere con l'originale, ma l'intera tradizione significativa. A una struttura ipertestuale il compito di gestire il sistema, di rappresentare il testo nella sua mobilità, di mettere in evidenza il processo evolutivo delle varianti, di permettere di passare con estrema facilità e immediatezza da un elemento all'altro del diasistema, in definitiva di rendere in forma dinamica e non statica quello che nel suo farsi è stato un processo dinamico e non statico. Dunque non più la rigidità della distinzione fra testo e apparato, tra lezione accettata e lezione rifiutata. I confini si rendono permeabili. Sono tuttavia discutibili le considerazioni che si fanno seguire: cioè che nella costruzione di un sistema come questo il mezzo informatico non avrebbe solo una funzione strumentale (il grande contenitore che tutto contiene) ma addirittura epistemologica, giacché indurrebbe un'idea radicalmente nuova del testo e della testualità.

Su questo è opportuno aggiungere qualche considerazione. E anzitutto richiamare l'attenzione sui rischi di una sopravvalutazione della profondità dei risultati (e dunque del sovrappiù di valore conoscitivo o, se si vuole, di valore aggiunto) che in ecdotica potrebbero essere ottenuti applicando le tecnologie informatiche alla "forma" dell'edizione critica. A cominciare da un principio generale su cui si può generalmente convenire. La filologia è una disciplina di tipo storico, che fa delle ipotesi critiche sui testi, mirando non solo a operazioni di restauro materiale (il testo secondo la volontà dell'autore) ma anche a portare alla luce tutte le circostanze storiche, culturali, letterarie, biografiche che ne segnano la genesi e la storia nel tempo. Questo sovrappiù di conoscenza che sempre si realizza nel corso di un'indagine filologica è un portato altrettanto importante della ricostruzione testuale. Finalizzare il far filologia a un'operazione formale di restauro, senza riconoscere contemporaneamente il ruolo fondamentale che l'ermeneutica ha nel processo, è molto riduttivo. Sorge anche il dubbio che l'esibizione del testo nella sua pluralità (cosa che il contenitore digitale consente) possa diventare una via di fuga dalle responsabilità del filologo. Quando in filologia il giudice si fa notaio i risultati non sono affatto più scientifici. Ma c'è anche un'altra obiezione, non meno di sostanza. Qualsiasi macchina ipertestuale si realizzi, anche la più complessa, la logica a essa sottesa è in ogni caso una logica binaria: testo A/testo B, variante A/variante B. Dico che l'approssimazione a quella che dovrebbe essere la lezione d'autore passerebbe in ogni caso attraverso il filtro delle relazioni binarie. È vero che una rappresentazione digitale può consentire di infrangere materialmente la frontiera che separa il testo dall'apparato, ma a rappresentare meglio il diasistema forse è più utile analizzare, commentare, spiegare. È attraverso un procedimento argomentativo (dunque con gli strumenti della retorica) che un testo acquista fluidità, dinamicità, che quella frontiera convenzionale fra il testo e l'apparato viene di fatto abolita anche quando sopravvive fisicamente nella grafica della pagina.

Le scienze del testo sono mal descrivibili con lo zero e l'uno, il sì e il no; esiste la possibilità, la probabilità, il dubbio, l'incertezza: a rendere questa dimensione serve il discorso. Non si nega l'interesse verso forme nuove di rappresentazione dei dati; il dubbio è che per questa via si accrescano ipso facto le conoscenze sul testo, cioè che si potenzino le capacità ermeneutiche, che si faccia insomma davvero un'altra cosa. D'altra parte gli apparati critici tradizionali funzionano già benissimo per chi li sa leggere. E chi non li sa leggere, in un mare di varianti non può fare altro che annegare. Insomma non è detto che una diversa organizzazione dei dati comporti di per sé nuova conoscenza, ovvero che sia reso un miglior servizio al testo depotenziando (come immancabilmente finirebbe per essere) la funzione critica, mirando a un'oggettivazione della pratica filologica che resta l'aspirazione di sempre, ma anche sempre delusa, del far filologia. Una filologia aperta, che mira a coinvolgere nella valutazione il lettore, sottratta cioè alla potestà del filologo giudice monocratico, potrebbe insomma anche rivelarsi una "non filologia". Peraltro la costruzione di sistemi di questo tipo è molto dispendiosa: e quale sarebbe il rapporto costo-benefici?

Ci si chiede allora se non valga piuttosto la pena di disporci in una prospettiva di continuità con il fare filologico tradizionale. Ciò significa molto semplicemente che le tecnologie informatiche, se impiegate strumentalmente, possono assolvere una funzione di grandissima utilità nella pratica filologica. I testi sono costituiti da sequenze di parole separate da spazi, le parole da simboli alfabetici. I simboli alfabetici, le parole sono elementi processabili. Il computer è in grado di lavorare su questi elementi. Molte delle informazioni che il testo veicola sono riconducibili alla materialità della sua forma, diventano pertanto descrivibili con sequenze binarie. Questo significa che è possibile acquisire dai testi con procedure automatiche o semi-automatiche una quantità di informazione, che non è tutta l'informazione in essi contenuta, ma che comunque eccede senza alcuna possibilità di paragone le capacità individuali. Ma per fare tutto questo è necessario che esistano testi in formato digitale. In tutti gli ambiti di studio, da quello classico a quello italianistico moderno, passando per la patristica, la scolastica e la letteratura in volgare del Medioevo, molte risorse on e off line di questo genere sono già a disposizione degli studiosi. Ma le prospettive non sono incoraggianti. Servirebbe per esempio, nell'ambito del nostro patrimonio testuale nazionale, un grande progetto filologico, una sorta di piano di edizioni nazionali di corpora testuali digitali di interesse storico, linguistico, letterario, artistico ecc. Sarebbe soprattutto necessario promuovere lo sviluppo di software specializzati per la realizzazione di procedure d'analisi utili nella ricerca filologica. Questo è il punto cruciale, sempre disatteso, della questione.

Una base di dati testuale consta di due elementi: i testi e il motore che li interroga. L'omogeneità e l'estensione del corpus sono elementi decisivi della qualità. La bontà del software di interrogazione si valuta invece sull'informazione che è in grado di recuperare in relazione al livello di codifica introdotto. Si potrebbe impiegare una vita intera, e forse neppure basterebbe, a codificare tutti gli aspetti possibili della Commedia di Dante. A quel punto basterebbero i più comuni software di data base a ottenere dei risultati. Ma dove sarebbe il vantaggio? Per realizzare utilmente una banca dati di testi letterari è necessario disporre di un motore di ricerca che riesca a estrarre dai testi la maggior quantità e la miglior qualità di informazione partendo da una codifica la più leggera possibile. È questa la tendenza oggi in generale prevalente nell'ambito delle ricerche per il reperimento di informazioni da basi di dati testuali (si vedano i grandi motori di ricerca di Internet). Codificare un testo in profondità è oneroso e dunque insostenibile in relazione a una grande massa di testi. Ma un archivio testuale che non consista di una grande quantità di testi non è significativo.

Ma va anche detto che non basta la macchina per ottenere risultati significativi nella ricerca. La qualità delle risposte che la macchina è in grado di fornire dipende dalla natura delle domande che a essa si pongono. Le domande devono muovere da una precisa strategia di ricerca, prendere avvio da ipotesi già presenti nella mente di chi la interroga. Il mezzo elettronico non servirà soltanto a confermarle o smentirle, potrà anche suggerire al ricercatore, nel corso del procedimento interattivo, di esplorare altre vie, di mettersi su percorsi a cui non aveva in precedenza pensato. Questo il valore euristico del mezzo, che per dare il meglio di sé richiede un interlocutore che unisca sapere e creatività a capacità di formalizzazione. Seconda avvertenza: i dati reperiti non sono i risultati della ricerca; i dati per diventare significativi vanno inseriti in un quadro argomentativo che tenga conto di ragioni storiche e linguistiche, oltre che del quadro filologico d'insieme. Terza avvertenza: la possibilità di accedere in pochi istanti a un'informazione altrimenti difficilmente attingibile può far nascere la sensazione del dominio del testo. Ma il testo si domina solo attraverso la sua lettura integrale: il testo frammentato, parcellizzato, così come appare nelle concordanze, può in certi casi addirittura dare un'impressione fuorviante.

Insomma, accompagnerei il consiglio ad avere fiducia nelle possibilità della filologia assistita dal computer con l'invito a esercitare sempre una grande prudenza e, perché no, anche un po' di scetticismo. In letteratura non c'è nulla di automatico. Nessun fenomeno letterario si presenta due volte uguale a sé stesso. La valutazione dei dati reperiti richiede sempre un atto critico che coinvolge da un lato l'interesse, la sensibilità, la passione, dall'altro il metodo, la storia, la filologia. Auspicare, come pure è stato fatto, che il fine ultimo delle applicazioni informatiche alla letteratura sia quello di trasferire nell'analisi letteraria qualcosa di simile al principio di verificabilità del metodo scientifico, per cui dato un certo testo tutti possano leggervi le stesse cose, è un assurdo. Un'ultima considerazione: a fare filologia con il computer non si fa prima. Si impiega molto più tempo di quanto se ne impieghi usando solo le metodologie tradizionali. Digitalizzare, elaborare, analizzare, classificare, interpretare i dati reperiti non si può fare in fretta. Che l'informatica riesca a rallentare piuttosto che ad accelerare il tempo del filologo è un divertente paradosso.