View Gyula Kalcsó's profile on LinkedIn

I use TEI

Legújabb hozzászólások

2011. augusztus 9.

Kód és kép összekapcsolása

Korábban már volt arról szó, hogy a legjobb megoldás a "digitális fakszimilék" publikálására az lenne, ha a kódolt szöveget összekapcsolnánk a dokumentumról készült jó minőségű fotóval. Álmaim annotáló eszköze egy olyan alkalmazás, amely lehetővé tenné a kód és a kép manuális összekapcsolását egy felhasználóbarát felületen keresztül. Nos, valami ilyesmi a Text-Image Linking Environment (TILE).

A projekt gazdája a University of Maryland egyik intézete, (az egyébként más szempontból is érdekes) Maryland Institute for Technology in the Humanities (irigylésre méltó, hogy több amerikai egyetemen külön intézetben zajlanak a DH-kutatások), valamint az Indiana University, és olyan, a DH-ban járatosak számára ismert nevek kötődnek hozzá, mint Dot Porter vagy John Walsh (aki jelenleg a TEI tanácsának a tagja). Az eszköz online hozzáférhető, de letölthető az offline is használható változata.

A szoftver arra alkalmas, hogy egy kódolt szöveget összekapcsoljunk egy kép négyszög vagy ellipszis alakú részletével. Jelenleg elsősorban egy szöveg sorainak az annotációjára használható (van egy beépített automatikus sorfelismerő is benne, amely egész jól működik). Két dologra van szükségünk: egy megfelelő formátumú kódolt szövegre (P5-ös verziójú TEI-XML), és egy megfelelő formátumú (JPG, PNG) képre. A képnek a weben kell lennie, és az XML-fájlban hivatkozni kell rá. Ha ez megvan, akkor a TILE felhasználói felületén a Load gombra kattintva fel kell tölteni az XML-fájlt, amivel együtt betöltődik a kép is (mert ugye az XML-ben benne a referencia).

Bal oldalon megjelenik a szöveg sorokra tördelve (a TEI <l>, azaz 'line' eleme alapján), jobb oldalon pedig a kép. Az automata sorfelismerőt használva megjelölhetjük a képen a sorokat, de akár kézzel is elvégezhetjük a műveletet (ha nem vagyunk megelégedve az automatikus felismerés eredményével, ami a fotó minőségétől függően jobb-rosszabb). Ezen túl még lehetőségünk van a kép bármely négyszög vagy ellipszis alakú részét a szöveg bármilyen egységéhez kötni ún. labelek (címkék) segítségével. Ehhez a jobb oldalon az Activate Highlight Mode-ra kell kattintanunk (kis toll formájú ikon), ki kell jelölnünk a szövegegységet, majd a felugró ablakban meg kell adnunk a címke nevét, ezután pedig a jobb oldalon kijelölhetjük a kép megfelelő részét.

Mit is csinál a TILE? Voltaképpen hozzáad az XML-fájlban a <teiHeader>-höz egy új elemet, a <tile>-t. Ebben <array> nevezetű elemeket hoz létre, amelynek @key és @value attribútumai lehetnek. Több <array> is egymásba ágyazható. Ezek az oldalakhoz és a sorokhoz lesznek kapcsolva, mégpedig a TEI-kódok alapján (ugyanis pl. a <l> elemnek is van @n attribútuma).  Az alábbi kódrészlet ezt mutatja:

... <array key="pages">
        <array key="0">
          <value key="id" value="0cf7e"/>
          <value key="url" value="http://mith.umd.edu/tile/sampledata/images/acs0000001-01-100.jpg"/>
          <array key="lines">
            <array key="0">
              <value key="text" value="Anactoria"/>
              <value key="id" value="line0"/>
            </array>
            <array key="1">
              <value key="text" value="τίνος αὖ τὺ πειθοῖ"/>
              <value key="id" value="line1"/>
            </array>
            <array key="2">
              <value key="text" value="μὰψ σαγηνεύσας φιλόταταϗ"/>
              <value key="id" value="line2"/>
            </array>
            <array key="3">
              <value key="text" value="Sappho."/>
              <value key="id" value="line3"/>
            </array>
            <array key="4">
              <value key="text" value="My life is bitter with thy love; thine eyes"/>
              <value key="id" value="line4"/>
              <array key="shapes">
                <value key="0" value="154_shape"/>
              </array>
            </array> ...
Az első <array> az oldalt azonosítja, a következők a sorokat, az attribútumok tartalmazzák az azonosítót és az "értéket", azaz magát a szöveget, valamint (ahogyan ez a 4-es számú sornál látszik) a hozzárendelt képterület azonosítóját (@key="shapes"). Ezek után következik az oldalhoz definiált képterületek megadása, ugyancsak az azonosítók segítségével:

... <array key="shapes">
            <array key="0">
              <value key="id" value="154_shape"/>
              <value key="type" value="rect"/>
              <value key="_scale" value="1"/>
              <value key="color" value="#000000"/>
              <array key="posInfo">
                <value key="x" value="109.13723254322"/>
                <value key="y" value="568.26627979399"/>
                <value key="width" value="726.32709933934"/>
                <value key="height" value="33.870175616861"/>
              </array>
              <array key="lines">
                <value key="0" value="line4"/>
              </array>
            </array> ...
Az eredményt természetesen el is menthetjük.

Őszintén szólva kicsit csalódtam, amikor kipróbáltam az alkalmazást. Én ugyanis arra számítottam, hogy rendes TEI-annotációt lehet vele csinálni, azaz a TEI-kódokhoz tudom hozzárendelni a kép megfelelő részeit. Ennek ellenére nagyon örülök, hogy maga az ötlet már alkalmazásban is testet öltött. Van azonban más lehetőség is a TEI-fájlok manuális képhez kapcsolására. De erről majd máskor.

Kalcsó Gyula jegyezte be, 11:49-kor.

Címkék: kód kép összekapcsolás TEI TILE MITH

Szólj hozzá!

A bejegyzés trackback címe:

https://digitalisbolcseszet.blog.hu/api/trackback/id/tr203136564

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása