This article reflects on the modelization of texts of our cultural heritage in the current very early phase of Digital Philology by asking the question: what "form" are we forcing upon our texts? I explore three ways in which our textual models reflect our cultural and technological bias: first, the OHCO hierarchical model behind TEI XML; second, the sequential alphabetical model based on Western print, lying behind Unicode. A third aspect has been less explored in the scholarly discussion: citation protocols such as CITE/CTS are based on specific digital corpora. For example, the canonic corpora for classical Greek and Latin texts are TLG and PHI 5.3. Each of those corpora freezes author identification, authorship attribution, text boundaries, paragraph and line numbering in a specific canonic form. A dilemma arises: on the one side, interoperability requires that CTS URIs are based on a fixed textual canon, which hinders scholarly modifications of that canon; on the other side, the principles of philology suggest that URIs point to specific versions of texts, which in its turn cripples the interoperability potential of the protocol.

L'articolo costituisce una riflessione sulla modellizzazione dei testi appartenenti alla nostra tradizione culturale in questa fase aurorale della Filologia Digitale e parte dalla domanda: che "forma" stiamo dando ai nostri testi? Vengono asplorati tre aspetti per cui i nostri modelli testuali riflettono i nostri presupposti culturali e tecnologici: in primo luogo, il modello gerarchico OHCO che sta alla base di TEI XML; in secondo luogo, il modello sequenziale alfabetico basato sulla stampa delle lingue occidentali, che sta alla base di Unicode. Un terzo aspetto, poi, è il meno esplorato nella ricerca: protocolli per la citazione testuale come CITE/CTS sono basati su corpora specifici. Per esempio, i corpora canonici per i testi greci e latini classici sono il TLG e il PHI 5.3. Ciascuno di questi corpora fissa in una forma canonica l'identificazione degli autori, l'attribuzione delle opere, la delimitazione dei testi, la numerazione di porzioni testuali come paragrafi e versi. Ne scaturisce un dilemma: da una parte, l'interoperabilità richiede che gli URI CTS siano basati su un canone testuale fisso, il che tende ad ostacolare le modifiche al canone da parte dei filologi; d'altra parte, i principi della filologia suggeriscono che gli URI puntino a versioni specifiche dei testi, il che però riduce il potenziale di interoperabilità del protocollo.

Forme del testo digitale / Monella, Paolo. - (2017), pp. 143-161. - CONTRIBUTI DEL CENTRO LINCEO INTERDISCIPLINARE BENIAMINO SEGRE.

Forme del testo digitale

Monella, Paolo
2017

Abstract

This article reflects on the modelization of texts of our cultural heritage in the current very early phase of Digital Philology by asking the question: what "form" are we forcing upon our texts? I explore three ways in which our textual models reflect our cultural and technological bias: first, the OHCO hierarchical model behind TEI XML; second, the sequential alphabetical model based on Western print, lying behind Unicode. A third aspect has been less explored in the scholarly discussion: citation protocols such as CITE/CTS are based on specific digital corpora. For example, the canonic corpora for classical Greek and Latin texts are TLG and PHI 5.3. Each of those corpora freezes author identification, authorship attribution, text boundaries, paragraph and line numbering in a specific canonic form. A dilemma arises: on the one side, interoperability requires that CTS URIs are based on a fixed textual canon, which hinders scholarly modifications of that canon; on the other side, the principles of philology suggest that URIs point to specific versions of texts, which in its turn cripples the interoperability potential of the protocol.
2017
Filologia digitale. Problemi e prospettive
978-88-218-1153-1
L'articolo costituisce una riflessione sulla modellizzazione dei testi appartenenti alla nostra tradizione culturale in questa fase aurorale della Filologia Digitale e parte dalla domanda: che "forma" stiamo dando ai nostri testi? Vengono asplorati tre aspetti per cui i nostri modelli testuali riflettono i nostri presupposti culturali e tecnologici: in primo luogo, il modello gerarchico OHCO che sta alla base di TEI XML; in secondo luogo, il modello sequenziale alfabetico basato sulla stampa delle lingue occidentali, che sta alla base di Unicode. Un terzo aspetto, poi, è il meno esplorato nella ricerca: protocolli per la citazione testuale come CITE/CTS sono basati su corpora specifici. Per esempio, i corpora canonici per i testi greci e latini classici sono il TLG e il PHI 5.3. Ciascuno di questi corpora fissa in una forma canonica l'identificazione degli autori, l'attribuzione delle opere, la delimitazione dei testi, la numerazione di porzioni testuali come paragrafi e versi. Ne scaturisce un dilemma: da una parte, l'interoperabilità richiede che gli URI CTS siano basati su un canone testuale fisso, il che tende ad ostacolare le modifiche al canone da parte dei filologi; d'altra parte, i principi della filologia suggeriscono che gli URI puntino a versioni specifiche dei testi, il che però riduce il potenziale di interoperabilità del protocollo.
Informatica umanistica; XML; CITE; CTS; TLG; PHI; Unicode; Digital Humanities; XML; CITE; CTS; TLG; PHI; Unicode
02 Pubblicazione su volume::02a Capitolo o Articolo
Forme del testo digitale / Monella, Paolo. - (2017), pp. 143-161. - CONTRIBUTI DEL CENTRO LINCEO INTERDISCIPLINARE BENIAMINO SEGRE.
File allegati a questo prodotto
File Dimensione Formato  
Monella_Forme_testo_2017.pdf

solo gestori archivio

Note: Full text PDF, incluse le informazioni bibliografiche
Tipologia: Versione editoriale (versione pubblicata con il layout dell'editore)
Licenza: Tutti i diritti riservati (All rights reserved)
Dimensione 927.07 kB
Formato Adobe PDF
927.07 kB Adobe PDF   Contatta l'autore

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11573/1485140
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact