I computer che studiano Leopardi con lo stemma codicum semi-automatizzato

leopardi_infinito

A partire da documenti digitali (in XML), i professori dell’Università di Bologna Gioele Barabucci, Angelo Di Iorio e Fabio Vitali sono riusciti a generare uno stemma codicum semi-automatico tramite l’utilizzo di software. Il loro sistema di auto-generazione viene basato su una «virtuosa ripartizione di compiti»: da una parte il filologo si occupa del lato filologico (quindi interpretando i dati), dall’altro l’informatico si occupa del lato informatico (creando le strutture che li metteranno in relazione). Partendo dal presupposto che «sostituire l’analisi di un filologo con strumenti completamente automatici è impossibile», perché richiede «l’esperienza, la conoscenza dei codici, l’intuizione e le capacità di deduzione», si possono tuttavia rendere automatici alcuni procedimenti che sono meccanici, come «la mera individuazioni di differenze tra testimoni o alla verifica di diverse configurazioni dello stemma». Il procedimento è complesso e richiederebbe un’esposizione tecnica piuttosto lunga, per cui si rimanda alla bibliografia per ulteriori informazioni: ci limiteremo a illustrare i principi alla base del sistema di generazione. [1]
I testi vengono codificati in XML, che permette la lettura del testo non solo agli esseri umani, ma anche ai computer. L’XML, infatti, è un linguaggio di mark-up, cioè basato sui tag: facendola facile, le parole vengono etichettate e si spiega al computer a cosa serve una data etichetta. Facciamo un esempio semplice. Prendiamo un paio di terzine dantesche:

Nel mezzo del cammin di nostra vita,
mi ritrovai per una selva oscura,
ché la diritta via era smarrita.

Ahi quanto a dir qual era è cosa dura
esta selva selvaggia e aspra e forte
che ne pensier rinnova la paura!

Per il PC sono solo caratteri che si ripetono, noi vogliamo dirgli che sono due terzine. Si applica al testo il tag <p> [2], indicando con

 

[3] la fine della terzina:

<p> Nel mezzo del cammin di nostra vita,
mi ritrovai per una selva oscura,
che la diritta via era smarrita. <p/>

<p> Ahi quanto a dir qual’era è cosa dura
esta selva selvaggia e aspra e forte
che ne pensier rinnova la paura. <p/>

Volendo si possono evidenziare le parole rima con un tag creato ad hoc che chiameremo <rima>:

<p> Nel mezzo del cammin di nostra <rima>vita<rima/>,
mi ritrovai per una selva <rima>oscura<rima/>,
che la diritta via era <rima>smarrita<rima/>. <p/>

<p> Ahi quanto a dir qual’era è cosa <rima>dura<rima/>
esta selva selvaggia e aspra e <rima>forte<rima/>
che ne pensier rinnova la <rima>paura<rima/>. <p/>

In questo modo possiamo fare delle ricerche interne al testo, magari evidenziando solo le parole rima. Con particolari accorgimenti, si possono ricercare anche solo le parole con rime precise, oppure le rime all’interno della terza terzina di ogni canto, oppure qualunque altra ricerca sulle parole, a patto che esistano i tag e che il computer sappia a cosa corrispondono.
Se con l’XML si può far capire al PC cos’è una parola o una locuzione o una parte del testo, possiamo insegnargli anche come riconoscere gli errori, fargli comprendere le differenze e poi mostrarceli: si marcano errori diversi con tag diversi e si applica un software chiamato PAUP, che ricostruisce alberi filogenetici. Tutto si basa su computi matematici e statistici, nei quali il filologo potrà dare valori più alti a errori più importanti. È interessante notare che PAUP nasce nell’ambito della biologia evolutiva, come se il testo che abbiamo non fosse altro che un individuo di una famiglia nel quale gli errori non sono altro che mutazioni genetiche. Del resto le somiglianze fra un albero genealogico e lo stemma codicum sono abbastanza chiare. Il risultato finale è appunto uno stemma codicum finito e costruito: l’umanista ha segnalato gli errori e la loro importanza (i dati), l’informatico ha creato l’infrastruttura che li metterà in relazione (XML e PAUP), il computer, basandosi su questi dati, attraverso quelle infrastrutture, genera lo stemma, che verrà poi controllato dal filologo. Nell’esperimento fu utillizzato un frammento dello Zibaldone di Leopardi: lo stemma codicum che ne risultò, corrispondeva a quello ricavato dai filologi con sistemi tradizionali.
Siamo solo all’inizio di questo tipo di sperimentazioni, ma sembra che, nonostante alcuni limiti da migliorare, i risultati siano promettenti. [4]

[1] L’esperimento si trova in un lungo, tecnico e interessante articolo: Barbucci, Gioele, Di Iorio, Angelo e Vitali, Fabio, Stemma codicum: analisi e generazione semi-automatica, in a c. di Ciotti, Fabio, “Digital Humanities: progetti italiani ed esperienze di convergenza multidisciplinare”, Sapienza Università Editrice (Roma), 2014.
[2] In realtà il tag

indica un paragrafo, qui lo si utilizza per scopi puramente esplicativi. Per altro viene usato anche nell’HTML, anch’esso un linguaggio di mark-up, utilizzato per creare siti web.
[3] I tag terminano sempre con un “ / ”, per far capire al computer dove finisce un preciso tag: serve per inserire altri tag all’interno di un tag, per esempio

 

, come si vedrà più avanti.
[4] Per approfondire si veda anche Roos, Teemu e Heikkila, Tuomas, Evaluating methods for computer-assisted stemmatology using artificial benchmark data sets, in “Literary and Linguistic computing”, 2009, DOI 10.1093/llc/fqp002.

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...