Nagyon fontosak és hasznosak azok a blogbejegyzések, amelyekben egy terület elismert szakértője abban kalauzolja el az érdeklődőket, hogy milyen módon tudják beleásni magukat a témába, hogyan indulhatnak el az önképzés útján, milyen forrásokat érdemes felhasználniuk stb. Elindítok ezzel a poszttal egy olyan bejegyzéssorozatot, amely a TEI P5 megismerésében irányítja az olvasót. Nem akarok idegen tollakkal ékeskedni: a sorozat szerzője James Cummings, aki a blogjában még 2012 márciusában indított egy TEI P5-tutorialt. Az ő posztjait ültetem át a blogomba kisebb módosításokkal.
Mindenekelőtt az Oxfordi Egyetem digitális bölcsészeti központjának nyári egyetemét ajánlja, amelynek keretében nyilván hatékonyan és intenzíven lehet TEI-t (és más DH-s dolgokat) tanulni. De mit tegyen az, akinek nincs ideje (pénze) nyári egyetemre menni?
A TEI megértéséhez elengedhetetlenül fontosak a kódolási alapismeretek. Ismerni kell mindenekelőtt a HTML-t és az XML-t. Ezek tanulmányozására Cummings a következő oldalakat ajánlja:
- http://www.w3schools.com/html/
- http://www.w3schools.com/xml/
- http://www.tei-c.org/release/doc/tei-p5-doc/en/html/SG.html
- http://en.wikipedia.org/wiki/XML
- http://www.tei-c.org/About/Archive_new/ETE/Preview/guidelines.xml
- http://www.tei-c.org/About/Archive_new/ETE/Preview/principles.xml
- https://www.youtube.com/watch?v=NLlGopyXT_g
Az utóbbi egy nagyon szellemes videó, amely a kódolás (markup) alapfogalmait illusztrálja.
A fenti források elolvasása után rögtön önálló kísérletezést javasol az XML-lel, amihez szükségünk lesz egy XML-szerkesztőre. A legjobb minden kétséget kizáróan az oXygen, ez azonban nem ingyenes program. Véleményem szerint a kezdeti kísérletezéshez megteszi valamilyen ingyenes eszköz, egy dolog fontos azonban: képesnek kell lennie a validálásra (azaz a létrehozott XML-dokumentum érvényességének az ellenőrzésére). Elég sok választási lehetőségünk van, érdemes áttekinteni az összahasonlításokat. (Én az XML Copy Editort ajánlom.)
Ezután keresnünk kell egy rövidebb (kb. egyoldalas) szöveget, amelyhez hasonlóval foglalkozni szeretnénk. Föntről lefelé haladva kell végighaladnunk a szöveg strukturális jellemzőin: listáznunk kell azokat a szövegegységeket, amelyeket meg szeretnénk jelölni. Érdemes ezenkívül összeírnunk, hogy milyen egyéb jellemzőket szeretnénk kódolni (pl. a neveket, dátumokat, bizonyos szakszavakat, netán nyelvi elemeket, pl. végződéseket stb.).
A következő lépés érdekes: az összeállított listánk alapján az editorral készítenünk kell egy XML-fájlt, amelyben a listában szereplő jellemzőket saját kódokkal kódolnunk kell. Érdemes megfigyelni, hogy a saját kódolásnak milyen nehézségei vannak, mert ez könnyen meggyőzhet bennünket arról, hogy inkább valamilyen kidolgozott kódrendszert érdemes használnunk. Mint amilyen pl. a TEI. A következő posztban a TEI alapjairól lesz szó.
Legújabb hozzászólások