View Gyula Kalcsó's profile on LinkedIn

I use TEI

Legújabb hozzászólások

2011. szeptember 7.

Kőbe vésett XML

A digitális bölcsészet egyik fontos (bár talán kevésbé divatos területe) a történelemtudományhoz és segédtudományaihoz kapcsolódik. A történészek számára nagy előnyt jelent, ha a forrásokat valamilyen internetes felületen tanulmányozhatják, ha pedig a forrás ráadásul kereshető annotációt is tartalmaz, annak a felbecsülhetetlen hasznáról talán nem is kell külön említést tenni. Ma már a legtöbb levéltár például működtet valamilyen online adatbázist (ha mást nem, a katalógusban való böngészést lehetővé téve). A bejegyzésemben egy sajátos forráscsoport digitális archiválásáról és internetes közzétételéről szeretnék szólni.

Az epigráfia (a feliratokkal fogalkozó történeti segédtudomány) számára is nagy áttörést jelentettek az internet adta lehetőségek. A feliratok tanulmányozása sokszor jóval nagyobb nehézséget jelent a kutató számára, mint pl. a kéziratok és nyomtatványok esetében. Sok felirat eleve mozdíthatatlan objektum része (épületen, sziklán stb.), mások múzeumokban találhatók, de nem lehet őket olyan egyszerűen "kikérni", mint mondjuk egy régi kódexet vagy levelet. A hagyományos megoldás a feliratgyűjtemény, amely nyomtatott formában tartalmazza a szövegeket, jobb esetben az objektumról készült fényképpel együtt. Az ilyen gyűjtemények ma már elkészíthetők digitális változatban is.

A Unicode által nem kódolt írásrendszerek esetében hasonló nehézséggel kell megküzdeni, mint a kéziratok és régi nyomtatványok szövegének digitális rögzítésekor (erről már volt szó korábban). Ezen túl azonban számos egyéb problémát is meg kell oldani. Képzeljük el pl. ennek a feliratnak a digitális rögzítését:

 

Látható, hogy a szöveg egy része az olvashatatlanság határáig megkopott, valamint bizonyos részei letörtek. A karcolások és töredezések a kődarab történetével együtt rendkívül fontos információkat hordozhatnak, ezeket valahogyan tartalmaznia kell a digitálisan archivált változatnak. De hogyan lehet ezt megoldani?

A válasz ezúttal is az XML. XML-lel ugyanis az égvilágon mindent lehet kódolni, mivel általános célú jelölőnyelv. A fenti fényképen látható felirat XML-lel kódolt változata megtalálható az Inscriptions of Roman Tripolitania (Tripoliban fellelt római kori feliratok) honlapján. Ez a gyűjtemény tulajdonképpen egy 1952-ben megjelent epigráfiai gyűjtemény digitális kiadása. Nagyon jól használható az egyes feliratok tanulmányozását lehetővé tevő oldal: háromféle változat megtekintését teszi lehetővé. Az első a szöveg kutatók által helyreállított változatát tartalmazza:

[Εὐμοιριτο] Ἑλλάδιος ἔζησε ἔτι ν´
[πλέον ἔλατ(τ)ον μῆ]ν[ες γ´] ἡμέρας
[δεκαπέντε ὁ Χριστὸς μετὰ τ(ο)ῦ] πνεύ-
[ματός σ(ο)υ ἐτ]ελεύ[τισεν μι]νὶ Π̣αυνὶ
5[ἑβδό]μι κατὰ τοὺς Ἄφρ<ο>υς

A következő a szöveg aktuális állapotát, megjelenési formáját tükröző változat (jelölve az elveszett részeket):

[··········]ΕΛΛΑΔΙΟΣΕΖΗΣΕΕΤΙΝ´
[·········]Ν[·····]ΗΜΕΡΑΣ
[············]ΠΝΕΥ
[···········]ΕΛΕΥ[·········]ΝΙ·ΑΥΝΙ
5[·····]ΜΙΚΑΤΑΤΟΥΣΑΦΡ<Ο>ΥΣ

Ez a két változat nem tartalmaz semmilyen hozzáadott információt, viszont a fényképpel együtt máris óriási segítség a kutatónak. A számunkra legérdekesebb a harmadik, az XML-lel kódolt változat. Ebben ilyen kódrészleteket találunk:

<supplied reason="lost" >
Εὐμοιριτο
</supplied>

A <supplied> TEI-XML kód, jelentése: kiegészítés. Az elem attribútumában meg is van adva az ok: @reason="lost", azaz a szövegrészlet elveszett. Vagy pl.:

<expan>
<abbr>
ἔλατ
</abbr>
<ex>
τ
</ex>
<abbr>
ον
</abbr>
</expan>

ahol az <expan> TEI-elem rövidítés feloldását (expansion) jelöli, azon belül pedig megtalálhatjuk magát a rövidített formát (<abbr> 'abbreviation'), és a feloldást (<ex>).

De mire jó ez az egész? a konkrét honlap esetében tulajdonképpen egyetlen célt szolgál: szabványos digitális formában archiválja a feliratot. Az igazi előnye akkor lenne érvényesíthető, ha a kódolt információkat valahogyan elő is lehetne hívni (pl. az összes felirat összes rövidítése kikereshető lenne, hiszen a rövidítések meg vannak jelölve). A TEI kapcsán is gyakran felmerülő probléma ez: sokmindent kódolnak ma már, de ezzel párhuzamosan alig fejlesztenek olyan eszközöket, amelyek segítségével a kódolt információ egyszerűen kinyerhető lenne. Tegyük hozzá gyorsan: az archiválás azért tényleg fontosabb. Az információ kinyerését lehetővé tevő eszközöket meg majd megcsinálja valaki. Addig pedig a világ sok-sok szerverén pihennek azok a bitek-byte-ok, amelyek a kulturális örökséget őrzik a jövő számára.

Kalcsó Gyula jegyezte be, 14:07-kor.

Címkék: epigráfia digitális bölcsészet XML TEI

Szólj hozzá!

A bejegyzés trackback címe:

https://digitalisbolcseszet.blog.hu/api/trackback/id/tr583208920

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása